Google 百度正式官宣 ChatGPT 竞品!能否颠覆搜索引擎已经没那么重要
小爬 • 发表于2023-02-08 11:37:57 • 16406次阅读
2022 年 11 月,OpenAI 发布聊天机器人 ChatGPT。上线五天,ChatGPT 吸引了超过 100 万的用户,很快有了 ChatGPT 代替程序员、文字工作者以及搜索引擎的声音。ChatGPT 问世两周内,Google 拉响「红色警报」。随后,Google 两位联合创始人被 CEO 召回。上线两个月,ChatGPT 的用户数量达到 1 亿。时间来到今天,在 ChatGPT 为全世界瞩目之后,搜索引擎的行业巨擘 Google 和百度终于出手,推出了各自的「ChatGPT」。Google CEO 亲自出马,迎战 ChatGPT北京时间 2 月 7 日凌晨,Google CEO 桑达尔·皮查伊(Sundar Pichai)宣布,推出一款名为 Bard 的实验性对话 AI 服务。Bard 先向部分开发者开放,未来几周内将和更多公众见面。CEO 亲自下场发布公开信,Bard 被列为「code red」优先级项目,行业老大终于和 ChatGPT 正面刚了。2021 年 5 月,Google 推出了大语言模型 LaMDA。2022 年初的官方论文介绍,LaMDA 模型使用多达 137B 个参数训练,展示了接近人类水平的对话质量。Bard 就是基于 LaMDA 模型运行,但当前用的是更轻量的版本,需要的计算能力更少,所以能够扩展到更多的用户,从而获得更多的反馈。当 ChatGPT 受限于 2021 年以前的数据,Bard 将与世界保持同步:Bard 致力于将广泛的世界知识与大型语言模型的强大功能和创造力结合起来,它利用来自网络的信息为输入问题提供最新、高质量的回答。从官方公布的图片来看,Bard 有着和 ChatGPT类似的对话框。Bard 可以简化复杂的主题,比如向 9 岁的孩子解释 NASA 韦伯望远镜的新发现,或者让你了解当前足球界的最佳前锋。Bard 也可以帮助完成更加具体和主观的任务,包括「计划朋友的新生儿派对」「比较两部奥斯卡提名的电影」「根据冰箱里的食物获取午餐创意」等。不过,Google 并没有提到将 Bard 整合到搜索之中,但确实计划在搜索中加入新的 AI 功能。Google 发现,当人们使用 Google 搜索时,不仅需要事实性答案,比如「一架钢琴有多少个键」,也会越来越多地需要洞察,比如「钢琴或吉他哪个更好学?分别需要练习多久才能掌握?」。AI 的作用就在这里。面对没有标准答案的问题,它可以给出更加综合的信息,将复杂的信息和多种观点提炼成更好理解的回答。未来「AI 加强版」的 Google 搜索,既会查找更加丰富的观点,比如同时弹钢琴和吉他的人的博客,也会让你更加深入了解一个相关主题,比如初学者入门的步骤有哪些。在这个维度,AI 改变了我们与信息的关系,就像 Google CEO 皮查伊所说的:最令人兴奋的机会之一是,AI 如何加深我们对信息的理解,并更高效地将其转化为有用的知识,帮助人们在搜索时更容易地找到核心,并达成目的。在发布 Bard 之前,Google 有过这样那样的犹豫,不知是借口还是出自真心。CNBC 报道,Google 的 AI 负责人杰夫·迪恩(Jeff Dean)曾经告诉员工,Google 在提供错误信息方面存在更大的「声誉风险」,所以「比小型初创公司更保守」。这是可以理解的,毕竟聊天机器人通过互联网的大量文本学习,因此它们无法区分事实和虚构,也可能延续互联网和人类社会固有的偏见。或许更为实际的原因是,大型语言模型会影响 Google 搜索当前的商业模式——Alphabet 2021 年收入约有 81% 来自广告,其中大部分是 Google 的按点击付费广告。即将面世的 Bard,说明 Google 改变了立场。尽管 Google CEO 皮查伊强调,必须以「大胆和负责任的方式」开发 AI,但没有详细说明如何避免有害内容,只是说将外部反馈与内部测试相结合,确保 Bard 的回答在质量、安全性和接地性方面达到高标准,算是回应了「声誉风险」的问题。在 ChatGPT 稳坐王位 2 个多月后,聊天机器人之战才真正地打响了。下个月,Google 将开始对接独立开发者、创作者及企业,让他们尝试基于 LaMDA 及一系列模型打造出的生成式语言 API。已向 OpenAI 投资数十亿美元的微软,也紧赶慢赶地把 ChatGPT 整合进自家的搜索引擎和办公软件。集成了 ChatGPT 的新版 Bing,曾在 2 月 3 日短暂上线。根据设计师 Owen Yin 分享的截图,新版 Bing 的搜索框变为聊天框,Bing 会在聊天气泡中回复用户的问题。新版 Bing 鼓励用户使用自然语言而不是关键字进行搜索,还能够根据用户的要求调整搜索结果。在 Google、微软等互联网巨头之外,You.com、Perplexity AI、Neeva 等不少初创公司也加入了竞争,推出了类似的聊天式搜索引擎。其中 You.com 由语言和人工智能专家 Richard Socher 创立,可以通过聊天界面提供答案,回复带有引用,帮助用户追踪一条信息的来源,这是 ChatGPT 所没有的功能。但这个长处并非独一无二,OpenAI 正在开发一个名为 WebGPT 的 AI 系统,WebGPT 将能够更准确地回答问题,甚至还能说明引用的来源。另外,百度版 ChatGPT 项目「文心一言」(英文名 ERNIE Bot)也已官宣,三月完成内测,即将向公众开放。官方表示,百度在 AI 领域深耕数十年,拥有产业级知识增强文心大模型 ERNIE,具备跨模态、跨语言的深度语义理解与生成能力,「ChatGPT 相关技术,百度都有」。在第一财经的采访中,多位 AI 界行业人士指出,ChatGPT 的出圈本质是算力与样本量提升后得到的自然结果。现在各个互联网公司都交出了自己的答案,在搜索引擎的本业上做出颠覆,也意味着当大模型、大数据、大算力厚积薄发,训练数据中的统计规律到达节点,我们就迎来了 AI 的「寒武纪大爆发」。Google 加急推出对抗 ChatGPT 的聊天机器人,某种程度上可以说明,搜索引擎真正意义上地遇到了挑战。从上世纪末以来,搜索引擎「索引、检索和排序」的固有模式已经统治了 20 多年,Google 每年都会对搜索引擎进行数千次更改,其中大多数都很微小,并没有发生根本性的变化。搜索引擎的核心是海量信息集合,而非信息创造。你在搜索框输入关键字,搜索引擎根据算法,抓取、索引、排序与你的查询匹配的结果,然后你看到了大量链接,再从中寻找自己需要的信息。而 ChatGPT 属于 AIGC(人工智能生产内容),是一种新的内容创作方式。它已经被数据集训练完毕,通过一对一的对话和类似人类的口吻,给出单一、即时的答案,还能结合上下文,实现多轮对话,帮你解决更为复杂的、连续性的问题。有时候 ChatGPT 显得很笨,它只生成文本,缺乏时效性,也无法显示信息来源,并不保证准确,甚至还会做错小学的算术题,就算给出错误信息,仍然有自信的口吻。但需要注意的是,它仍处于起步阶段,就已经在根本上改变了我们与知识的相处形式。正像上文所提到的,当人们使用 Google 搜索时,需要的不只是事实性答案,而是越来越多地需要洞察。就算只是将搜索引擎和聊天机器人互相补充使用,也说明我们对「搜索」的根本需要改变了。让 ChatGPT 变得更聪明,人类首先需要学会如何与它沟通,这已经是人类的一项必备技能。游戏博主@祝佳音教会了 ChatGPT 用老北京口吻说话,UC Riverside 的研究人员让 ChatGPT 熟读美国哲学家 Daniel Dennett 的著作,然后让它伪装成哲学家本人回答问题。初级的「数字生命」,在 ChatGPT 身上得以实现。再比如,你可以一步步引导规则,让它设计游戏等产品,或者给它一段程序,让它检查 bug,还可以给它演示案例,让它举一反三。互动越复杂,ChatGPT 的能力也会越丰富。全世界还发生着许多主动要求 AI 代劳的场景,从学期论文、创意策划,到房产介绍、法律文书。我们可以批评 AI 当下的准确性,但我们也应该看到它的创造性。它并不真正理解世界,但它实际上能够做到用自然语言沟通,沟通对话者的需求,高效地处理海量信息。现在它们已经让人眼前一亮,以后还能够做得越来越好。