整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)
作为当前全球最火的生成式 AI,ChatGPT 仅用了 3 个月,就几乎搅动了整个科技圈,人们不断惊叹于 ChatGPT 的强大——但微软和 OpenAI 想要的,显然不至于此。
目前的 ChatGPT,由 GPT-3.5 系列中的模型微调而成。而据微软德国公司 CTO 兼 AI 部门主管 Andreas Braun 最新透露:下周,GPT-4 就要问世了,还是多模态的。
GPT-4 的参数量将高达 100 万亿?
GPT,即 Generative Pre-trained Transformer,是由 OpenAI 提出的一系列非常强大的预训练语言模型。该系列模型基于互联网上的可用数据上进行训练,在 NLP(自然语言处理)方面表现卓越,可用于问答、文章生成、机器翻译、代码生成和对话 AI 等。
在 GPT 系列模型推出之前,传统的 NLP 模型都是针对特定任务(如分类、翻译等)进行训练的,并且往往使用监督学习,这就导致了两个问题:缺乏大量的标注数据,模型也无法概括和泛化任务。
于是,OpenAI 在 2018 年推出了 GPT-1,模型参数数量为 1.17 亿,通过未标注的数据训练出一种生成式语言模型,再根据特定的下游任务进行微调,将无监督学习作为有监督模型的预训练目标。
时隔一年后,2019 年具有 15 亿参数的 GPT-2 出现。与 GPT-1 相比,GPT-2 在结构上并没有太多创新与设计,使用了更大的数据集和更多的模型参数进行训练,以此强化并提高模型性能。
从 GPT-1 的 1.17 亿到 GPT-2 的 15 亿,超 10 倍的参数差距带来了性能上的飞跃。这似乎意味着,随着容量和参数量的增多,模型性能还有更大的潜力——因此,2020 年 GPT-3 的参数量翻了 100 倍:1750 亿,其预训练数据量也高达 45TB(GPT-2 是 40GB,GPT-1 约 5 GB)。
事实证明,海量参数确实让 GPT-3 具备了更强大的性能,它在下游任务表现的非常好。即便是复杂的 NLP 任务,GPT-3 也表现惊艳:可以模仿人类写作,编写 SQL 查询语句、React 或 JavaScript 代码等。
回顾 GPT-1 、GPT-2 和 GPT-3 这一路的发展,许多人对 GPT-4 寄予厚望,甚至还有传言称 GPT-4 的参数量将高达 100 万亿。
将在下周推出 GPT-4!
不过,去年 11 月 Cambrian AI 的分析师 Alberto Romero 就曾发文预测,GPT-4 不可能发展至 100 万亿参数:“对于下一代模型,OpenAI 会把重点放在优化数据处理而非参数大小上。因此 GPT-4 的规模可能与 GPT-3 相似,同时训练成本会更低。”
不久之后,OpenAI 首席执行官 Sam Altman 也在一次采访中,辟谣了 100 万亿参数的说法:“过于荒谬,关于 GPT-4 的谣言越传越离谱。”
距离 2020 年 GPT-3 问世已经过去两年多,业界一直都在期待 GPT-4 的发布,ChatGPT 的火爆更为此添了一把火。但对于 GPT-4,OpenAI 方面始终保密得很好,不论是发布时间还是规模大小,几乎都没有透露。
在今年 1 月,Sam Altman 表示:“我们总有一天会发布的,只要我们确定它足够安全。目前来看,GPT-4 的发布会比大家期待的要晚一些。但当我们真正发布时,人们一定会觉得,等待是值得的。”
现在看来,Sam Altman 所说的“晚一些”并没有让我们太久。
本周四,微软德国公司 CTO Andreas Braun 预告了下周 GPT-4 的发布:“我们将在下周推出 GPT-4。”除了发布时间,Andreas Braun 还透露了很关键的一点——GPT-4 将是多模态的。
这十分令人意外,因为 Sam Altman 曾在年 4 月对 Alberto Romero 明确表示:GPT-4 不会是多模态的,而是一个纯文本模型。
语言模型是多模态,这意味着什么?即:使用 GPT-4,可以生成文本、图像甚至视频。正如 Andreas Braun 所说:“有了 GPT-4,我们将拥有多模态模型,它将提供完全不同的可能性,例如视频。”
除此之外,Andreas Braun 还指出 GPT-4 将是一个“改变游戏规则”的技术,因为“他们教机器理解自然语言,然后以统计的方式理解以前只能被人类阅读和理解的内容”。与此同时,GPT-4 已基本“适用于所有语言”,例如可以用德语提问并得到意大利语的回答。
Andreas Braun 认为,通过多模态,微软(OpenAI)将“使模型全面化”。
“GPT-4 不是要取代人类工作”
听到 Andreas Braun 的“剧透”,一直关注着 GPT-4 动态的人们坐不住了:
“如果所有这些都得到证实,那下周将是疯狂的。我已经开始清理我的日程安排,为此腾出时间。”
“我希望他没有撒谎,哈哈!这听起来有点假。”
“到时候见!!希望千万不是炒作。”
但同时,也有不少人提出担忧:目前基于 GPT-3.5 的 ChatGPT,就已经威胁到部分人类岗位了,有了 GPT-4 岂不是更危险?
对此,微软德国公司 CEO Marianne Janik 回应称:“GPT-4 不是要取代人类工作,而是要以与以前不同的方式来完成重复性任务。”她建议,公司可以培训员工使用人工智能:“传统的职位描述正在发生变化,由于新可能性不断丰富,令人兴奋的新职业正在出现。”
目前,关于 GPT-4 的更多详细信息还无法得知,让我们一起静待下周它的发布。
参考链接:
https://www.heise.de/news/GPT-4-is-coming-next-week-and-it-will-be-multimodal-says-Microsoft-Germany-7540972.html
https://www.datacamp.com/blog/what-we-know-gpt4
————————————————
版权声明:本文为CSDN博主「CSDN资讯」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/csdnnews/article/details/129457716