据国外媒体8月27日消息,搜索引擎巨头谷歌正建立一个自动化的知识库(Knowledge Vault),通过演算法自动爬梳网络上的资讯,并利用机器学习将资讯整合成知识,兼具广度与精度,让电脑与智能手机了解人类的提问,未来有望改进 谷歌回答问题的方式,从原本列出一连串的搜索结果,进化到一目了然的答案。
资料图
Knowledge Vault 的前身是2012 年 谷歌所发布的“知识图表”(Knowledge Graph),一个将资讯结构化的数据库,透过群众外包的力量扩大讯息量,内容取自维基百科、CIA 的世界概观(World Factboo)与协作知识库Freebase,内容包罗万象,有名人、事件等,总共汇整了5 亿个条目及35 亿种事实描述。但最终Google 发现人的力量还是有限,知识量的扩增出现停滞,于是谷歌改弦易辙,决定以自动搜集的过程取代人力。
到目前为止,Knowledge Vault 已建置了16亿种事实描述,其中2.71 亿被评比为可信赖的事实,谷歌将新事实与已掌握的知识进行交叉比对,发现准确性达90%。虽然目前Knowledge Vault 的知识量还未达到知识图表的水准,但它能自动扩充增加知识,超越的时间指日可待,很快的将成为全球最丰富的知识数据库。
谷歌除了能从网页上分析文本找寻事实,来喂养它的数据库,也能抓到一般台面上看不到的资料,例如Amazon 的产品销售数据,或浏览某项产品的人数等。Garntner 的技术分析师奥斯丁(Tom Austin)表示,几家世界上最大的科技公司如谷歌、微软、Facebook、Amazon 和IBM 等,都在打造类似的知识库,并处理极为庞大复杂的问题。记者 陈薇