Facebook 母公司 Meta 今天宣布了一个名为 Sphere 的新工具,该工具围绕着挖掘开放网络上的巨大信息库,为人工智能和其他系统的工作提供知识基础而建立。
Sphere 的第一个用户是维基百科,它正在用它自动扫描词条,并识别其词条中的引文何时得到有力支持或没有支持。该研究团队已经开放了 Sphere 的源代码,它目前基于 1.34 亿个公共网页。
将 Sphere 用于维基百科的想法很简单:该在线百科全书有 650 万个条目,平均每月增加约 17000 篇文章。这背后的维基概念实际上意味着添加和编辑内容是众包的,虽然有一个编辑团队负责监督,但这是一项艰巨的任务,而且与日俱增,不仅仅是因为其规模,还因为其任务。
与此同时,监管维基百科的维基媒体基金会一直在权衡利用所有这些数据的新方法。上个月,它宣布了一个企业层级和它的第一批两个商业客户 Google 和互联网档案馆,它们使用基于维基百科的数据为自己的商业利益服务,现在将有更广泛和更正式的服务协议围绕它。
就 Meta 公司而言,该公司继续被公众的不良看法所拖累,部分原因是有人指责它使错误信息和有毒思想得以自由传播,所以推出 Sphere 这样的东西感觉有点像 Meta 公司的公关活动,如果它能发挥作用,也可能是一个有用的工具,就表明该组织中有人在努力真诚地工作。
今天关于 Meta 与维基百科合作的公告并没有提到维基媒体企业,但一般来说,为维基百科增加更多的工具,以确保其拥有的内容是经过验证和准确的,这将是企业服务潜在客户在考虑为该服务付费时想知道的事情。
目前还不清楚这项交易是使维基百科成为 Meta 的付费客户。不过,Meta 确实指出,为了训练 Sphere 模型,它创建了一个新的数据集(WAFER),包括 400 万条维基百科引文,比以往用于此类研究的数据集要复杂得多。而就在五天前,Meta 宣布维基百科的编辑们也在使用它建立的一个新的基于人工智能的语言翻译工具,所以显然这里面有联系在其中。