冬奥赛事正酣,除了新晋顶流“冰墩墩”外,支撑赛场内外的各项“黑科技”也是热议话题之一。其中,一众虚拟数字人的集中亮相尤其引人关注。

  冬奥赛事正酣,除了新晋顶流“冰墩墩”外,支撑赛场内外的各项“黑科技”也是热议话题之一。其中,一众虚拟数字人的集中亮相尤其引人关注。

  由百度智能云提供支持的AI手语虚拟主播亮相央视新闻,为听障用户提供24小时手语服务,助其即时获得赛事资讯;腾讯3D手语数智人“聆语”也上线央视频,为赛事提供手语解说;中国气象局推出的虚拟数字人“冯小殊”,为观众实时播报观赛气象指数;在谷爱凌摘得大跳台金牌的前夕,其数字分身Meet GU现身咪咕演播室;由科大讯飞打造的央视主播王冰冰虚拟形象,在《冰冰带你说冬奥》专属H5中登场;AI裁判&助理教练“观君”助力我国运动员摘得两金一银;还有新华社数字记者“小诤”继穿越空间站后,这次从火星发来赛事智能分析的特别报道……

  这些虚拟数字人形形色色、人设多样,给观众带来了崭新的服务与视听体验,颇有些“乱花渐欲迷人眼”的味道。可以说,冬奥成为了国内数字人集中展示的高规格舞台,越来越多的人在这次展示中看到了现阶段在数字人领域本土技术力量的崛起和进化。那么到底何谓数字人、数字人为什么会火、其商业前景如何,且让我们先捋一捋其发展轨迹。

  那些年,横空出世的数字人

  “数字人”并不新鲜。遥想当年,老二次元必定还记得初音未来、洛天依等虚拟偶像刚出现时掀起的热潮。虽然如今的大众对于虚拟数字人基本都见怪不怪、波澜不惊了,但事实上,虚拟数字人的发展到了近两年才开启了质的飞跃,其定义、分类、功能和市场潜力才逐渐清晰起来。

  根据中国人工智能产业发展联盟发布的《2020年虚拟数字人发展白皮书》定义,虚拟数字人,即具有数字化外形的虚拟人物。简言之,拥有类人的外观、行为、思想(当然也有一些非人的萌系形象,如火星车数字人“祝融号”)。

  从上世纪90年代至今,数字人的发展基本可以梳理为三个阶段:

  以“纸片人”为代表的1.0阶段:由初始公司发布初始形象,通过UGC的形式与用户进行互动。互动载体以长短视频为主,面向泛二次元用户。

  以vTuber主播为代表的2.0阶段:通过背后的中之人加上动捕设备来与用户进行千人一面的交流。驱动形态依旧限于二次元,用户群体也相对受限。

  具备模型高精、人工智能驱动特点的数字人3.0阶段:由于采用了传统+AI的方式实现,生产端成本降低,可驱动形态扩展到高精2D/3D,用户覆盖全人群。在AI能力的加持下,其互动载体更为多样,且其交互可以做到全天候,达到千人千面的效果。

  近年来,随着5G、AI等技术的发展,加之算力平台的迭代,数字人领域逐渐出现各类超写实、实时动捕乃至AI驱动的实验性的落地产品。尤其去年以来,借着Metaverse概念的兴起,MetaHuman也成为市场的宠儿。如何打开数字人在应用场景的商业化空间成为资本关注的焦点。

  头豹研究院数据显示,当前虚拟数字人市场规模已超过2000亿元,预计到2030年将达到2703亿元。当然,普罗大众的观感会更直观。你稍加留意就会发现,从去年开始,形态各异的数字人在各大平台次第登场,到冬奥会时密集露出,这无疑再次佐证了:数字人正在由一个泛化的概念真正进化到多元应用的产业化阶段。

  这是一场营销下的“虚火”吗?

  似乎在一夜之间,人人都知道了数字人是风口。但也正因如此,不少人开始质疑,数字人“火”了,是需求驱动下实打实的“真火”还是密集营销下沸反盈天的“虚火”?我们可以从政策、市场、资本三个维度做一下观察。

  首先,在政策上,2021年10月发布的《广播电视和网络视听“十四五”科技发展规划》指出:“要推动虚拟主播、动画手语广泛应用于新闻播报、天气预报、综艺科教等节目生产,创新节目形态,提高制播效率和智能化水平”,首次明确鼓励和支持虚拟人的发展。另外,《“十四五”数字经济发展规划》更新数字经济的指导意见,也让虚拟人、元宇宙的概念和发展,有了更清晰的导向。可以看出,国家对虚拟人产业发展整体持肯定态度,这对从业者而言显然是一剂强心针,可以专注研发,而不必担心行业会突然因政策而“触礁”。

  再者,根据市场需求,基于当前发展阶段和商业模式,数字人主要分为两类:偶像类演艺型数字人和服务型数字人。

  前者如虚拟偶像、虚拟主播、虚拟代言人等,主要落地在文娱和品牌营销等领域,比如会“捉妖”的虚拟美妆达人“柳夜熙”、穿梭在真人间的虚拟KOL “AYAYI”、央美毕业唱歌吟诗作画无一不精的虚拟数字人“夏语冰”;而服务型数字人则标志着另一种截然不同的发展路线,比如数字客服、数字员工、虚拟培训师等等,主要在落地在金融、运营商等领域,比如最卷打工人万科财务部的虚拟数字人“崔筱盼”、浦发银行首位数字员工“小浦”等等。

  从春节期间的各类晚会到冬奥会赛场内外,都可以看到,数字人并未止步于唱跳表演、直播或品牌营销,而是逐步融入主流媒体搭建的新闻播报、知识科普、大型赛事、公益等场景,发挥出了更多服务和功能价值。从单纯的虚拟偶像到如今在社交、游戏、办公等场景下的多点开花,市场对于数字人的期望正在向纵深发展,数字人在更多场景下商业变现的可能也在进一步被证实。

  最后,除了政策层面的认可,市场方面的需求,资本的涌入也是肉眼可见的。全球众多财力雄厚的科技巨头与平台早已纷纷入场,布局数字人赛道,抢占这个千亿市场的先发优势。他们有的通过基础技术赋能,有的从元宇宙全链路探索,有的走软硬件并行发展路线,有的从企业级、消费级应用打开缺口。

  B站早早开始布局并加码虚拟偶像领域,腾讯互娱旗下NEXT Studios和新华社联合打造数字记者“小诤”,阿里巴巴扶植虚拟主播助力内容电商,字节跳动通过入股的方式拥有了虚拟偶像团体A-SOUL,科大讯飞推出了虚拟人交互平台,网易发布虚拟人软件开发工具包“有灵”,百度发布全新智能数字人平台“百度智能云曦灵”,英伟达将自身积累的技术能力高度整合为Omniverse(全宇宙)产品,微软基于多年来探索的人机交互技术推动虚拟人与真人交流。在这些巨头的布局思路中,数字人不仅是当下值得投入的潜力场域,也是未来虚实共生场景的重要入口。

  由此,我们可以看到,虚拟数字人不论是从政策、市场还是资本层面都有其“火起来”的先决条件。但不可否认的是,在这个看似繁花簇锦的市场中,虚拟数字人的核心驱动技术仍处于发展的初始阶段。一些分析人士也因此持观望态度:“蜂拥而至的虚拟数字人,有点像过去企业吉祥物的变种。如果它们不能真正做到服务用户,即使是花大力量做出的吉祥物,除了能为企业贡献一时的流量外,未来并不具备可持续发展的可能。”

  数字人是如何“炼”成的

  数字人要迈向产业化、规模化服务阶段,根本上还是要取决于技术的发展。

  一般来说,数字人系统由人物生成、人物表达、合成显示、识别感知和分析决策等五大模块构成。这五大模块主要解决虚拟人的两个问题,第一,能否像真人一样表达,第二,能否像真人一样思考。

  能否像真人一样表达?解决这个问题的关键在于建模、驱动和渲染三大技术。

  事实上,得益于这三大技术的突破,数字人的质变式飞跃才有了可能。在建模端,具有高保真且能够获取人物动态模型数据的扫描技术已经出现,虚拟数字人在外表上已无限“逼近”人类;在驱动端,智能合成、动作捕捉取得了长足进步,虚拟人的表情、动作开始能达到以假乱真的程度;在渲染端,随着CPU、GPU等硬件能力的提升和算法的突破,成像的真实性和细微度均大幅提升。

  以AI气象服务数字人“冯小殊”为例,“冯小殊”的原型是《天气预报》节目主持人冯殊。据公开资料显示,小冰公司通过深度神经网络渲染技术(Xiaoice Neural Rendering, XNR)及小样本学习技术,仅用1周的时间就完成了对冯殊本人的学习。经过语音、嘴型、人脸渲染专家模型训练,虚拟数字人可以完美地get冯殊本人的嘴部动作、眼部及脸部肌肉之间的协同关系,其面容、表情、肢体动作的整体自然度跟真人几乎无异。

  技术的进步在一点点提升人们对虚拟数字人的期待,但很多时候这种期待会有落空之感。究其原因,在于数字人的“智能化”程度还不够,无法自主和人类互动、交流。这就涉及到关键的第2个问题——能否像真人一样思考?虚拟数字人在接收信息后作出判断、决策、然后再向人类进行反馈,做到这一点,才是真正打开了数字人发展的通达大道。

  百度智能云AI人机交互实验室负责人李士岩曾提到,目前,数字人虽然有很多技术创新,但它依旧处在3.0阶段的初期,其发展还存在三大技术难题:其一,数字人产业链各个节点相对割裂、不能高效协同;其二,服务场景和演艺场景没有有效打通,主要表现为演艺型数字人不具备客户所需的业务能力,而服务型数字人缺乏人设,难以与用户进行情感交流;其三,满足高机动性、高频需求成本依旧较高。当一些客户要来频繁升级数字人需求、做新场景时,依旧需要大量定制化开发成本。

  可以说,冬奥会中展现出的数字人的技术能力,几乎代表了现阶段虚拟数字人的最高水平。在这类资金实力充足的体育盛事中,集中力量打造符合赛事报道的数字人相对容易。但在广泛的落地过程中,虚拟数字人的发展仍存在不少掣肘。如何针对这些痛点,探索新的产品路径,想必是未来几年中众多玩家必争之处。

  未来:人手一个数字人,可能吗?

  在5G、AI等技术的加持下,现阶段的虚拟数字人通过自我学习和算法能力可以实现与人语音、手势的交互,但总体来说,智能化水平目前比较初级,距离泛化的应用还有一段“长坡”要走。

  对演艺型数字人来说,要打造为成功的IP,过硬的专业素质和原创内容才能维持和拓展人设生命力,提升商业价值,但这样也提高了应用的门槛和成本;对服务型数字人来说,作为企业员工的补充,迅速适配应用场景,助力企业降本增效才是立足之本,但定制化成本过高却是不容回避的问题。

  但同样不可否认的是,随着虚实共生时代的来临,多元场景对虚拟人将有更广泛的需求。当现实世界与数字世界之间的界限不断融合与模糊,虚拟数字人可以作为两个世界连接的载体,拥有无限的生命力与想象空间。多元的身份、强大的分析与数据处理能力,类似真人交互般的体验丝滑,这样的数字分身将成为我们出入虚拟数字世界的坚实铠甲。

  远方,荆棘与鲜花共生。我们期待:“人手一个数字人”的未来终将到来。