Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 2|回復: 0

谷歌专利使用通用提取模式从

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 2024-4-27 18:52:25 | 顯示全部樓層 |閱讀模式

非结构化文本中提取信息描述了一种基于从单个句子中提取的种子事实使用来自非结构化文本的新信息不断扩展数据库的方法。该专利不是以实体来描述的但也可以用来完善实体的属性和关系。抽象的用于从非结构化文本中提取信息的方法系统和装置包括计算机程序产品。事实对用于从文本正文中提取基本模式。通过用相似单词的类别替换单词来概括模式。通用模式用于从文本正文中提取更多事实对。该过程可以从事实对基本模式或广义模式开始。作为知识图的知识库是一个知识数据库它结合了从内容中提取的内容通过分析文本表格数据结构和人工注释例如通过和来自现有知识数据库如的信息。

许多帖子都猜测谷歌的 波兰移动的电话数字 知识库最终是否会取代知识图谱。我将知识库视为知识图。为了提取信息知识库使用以前称为等结构化数据源等半结构化数据源以及非结构化内容。这些数据通过融合模块合并通过监督机器学习进行处理然后传输到知识图知识库。虽然经典的知识图主要仅​​从结构化或至少半结构化数据源获取信息但知识库能够以可扩展的方式处理独立于手动维护的信息的信息。以下是科学论文的摘录。在这里我们介绍这是一个规模的概率知识库它将内容的提取通过分析文本表格数据页面结构和人工注释获得与从现有知识存储库中导出的先验知识相结合。



我们采用监督机器学习方法来融合这些不同的信息源。知识库比任何以前发布的结构化知识库都要大得多并且具有计算事实正确性的校准概率的概率推理系统。知识库的开发是因为维基百科等人类维护的数据源的增长陷入停滞需要开发新的信息源以便在不牺牲信息有效性的情况下实现几乎完整的知识数据库的目标。因此我们认为有必要采取新的方法来进一步扩大知识库建设的规模。这种方法应该自动从整个网络中提取事实以增强我们从人类输入和结构化数据源中收集的知识。不幸的是这项任务的标准方法参见经常产生非常嘈杂不可靠的事实。


回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|自動贊助|GameHost抗攻擊論壇

GMT+8, 2025-4-19 07:10 , Processed in 0.037281 second(s), 18 queries .

抗攻擊 by GameHost X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |