在科技巨头微软、谷歌等相继发布大语言模型之后,Meta 终于也入局了,2 月 24 日,Meta 宣布推出 AI 语言生成机器人 LLaMA。
“今天我们要发布一个新的叫作 LLaMA 的大语言模型,它将被用于帮助研究人员提高他们的工作效率,”Meta 的 CEO 扎克伯格在一篇 Facebook 博文中表示,“大语言模型已经在生成文本、回答问题、书面材料总结,甚至是证明数学定理等方面都起到了非常重要的作用。Meta 将会致力于这种开源模型的研究,并且在未来我们将为 AI 研究社区开发出更新的开源模型。”
从扎克伯格的介绍中可以看出,LLaMA 不是一个像 ChatGPT 那样的对话式 AI,而是一个开源的、专注于研究使用场景的非商业大语言模型,并且 Meta 会将 LLaMA 的使用权限授予大学、非政府组织、行业实验室这样的团体。
在 MetaAI 的一篇官方博文中表示,Meta 推出 LLaMA,是为了降低大语言模型的使用门槛,向着更加民主化的方向发展。同时,如今大语言模型也存在着很多的乱象,比如提供的信息中充满了歧视性、带有恶意的内容。Meta 认为,整个 AI 社区都必须要一起努力,来为 AI 和大语言模型制定明确的规则。“我们期待着看到使用 LLaMA 后,AI 社区可以学习并且最终创造出什么。”Meta 在博客中写道。
在一份研究论文中,Meta 声称参数规模第二的 LLaMA 模型,LLaMA-13B,“在大部分指标上”的表现要比 OpenAI 旗下最流行的 GPT-3 模型更好。同时,参数规模最大的 LLaMA 模型 LLaMA-65B,甚至与 DeepMind 的 Chinchilla70B 和谷歌的 PaLM540B 这样表现更佳的大语言模型相比也很有竞争力。此外,Meta 还声称,不同于谷歌的 LaMDA 和 OpenAI 的 GPT 是基于机密资料进行训练,LLaMA 是基于公开资料进行训练的。
这次 Meta 推出自己的大语言模型,从公司的战略角度来看,也是对这一段时间以来硅谷各大科技公司争抢布局大语言模型产品的一次回应。
其实在过去 Meta 也发布过自己的 AI 聊天机器人,比如去年 8 月 Meta 推出了一款叫作 BlenderBot3 的机器人,但是反响不佳;去年年底,Meta 又上线了一款叫作 Galactica 的 AI 对话机器人,它本来是用于科学研究,但是后来因为它在输出科学内容时错误太多,仅仅在上线 3 天之后就被下架了。
编辑部说两句:
当美国各大科技公司争抢推出基于大语言模型的产品的时候,Meta 却显得低调很多,这其中既有 Meta 对竞争对手表现的“观望”,也是因为去年 Meta 接连推出的 AI 聊天产品表现不佳。
这一次Meta没有跟风推出自己的对话式AI机器人,而是推出了一个开源大语言模型,在笔者看来一方面是因为Meta了解自己在产品力上的不足,另一方面当其它科技公司都在将产品推向 C 端用户的时候,LLaMA 重点面向研究人员,在有限的使用场景内获取反馈,也是一种路径。