继续“造人”、“育人”
金磊 发自 凹非寺
非常AI | 公众号 QbitAI
意外。
今年科技圈的“寒冬”大潮还在持续上演着,而有这么一则消息却与这股大势“背道而驰”:
小冰公司,完成10亿元新一轮融资。
这家公司,很多友友们并不陌生。
因为近几年出自它家的众多虚拟人,经常活跃出现在人们的热议话题中。
而随着这次最新消息的曝光,新融资的归去来,也成了外界最关心的问题,特别还是大环境不好的当前。
对此,小冰公司在官宣中也直接做了解答:
用于加速AI Being小冰框架技术研发。
未来一个季度内,完成框架中正在运行的30万名虚拟员工(AI Being Employee)的升级。
更进一步的,小冰公司更是直言了这些动作背后的一个“小目标”——
推动虚拟员工的普及。
至此,新的疑问也接踵而至:
让虚拟员工普及,靠谱吗?不会影响人类员工吗?
为什么现在“寒冬”已然如此,这事还如此受资本热捧?
带着种种疑问,我们不妨一同来挖一挖。
虚拟员工,真的有在干实事吗?
或许很多人对虚拟人能做的事情,印象都停留在具备娱乐、艺术性质的创作上。
例如小冰公司最初一批走红的虚拟人之一,夏语冰,就是一位作画高手。
而在此之后,国内市场上也逐步浮现出众多颜值超高、擅长绘画唱歌的虚拟人。
但事实上,虚拟人现在在人类生活中起到的作用,可不只是“你以为的你以为”了。
因为他们已经悄然在人类社会中上岗打工了,也就是我们刚才提到的小冰公司的虚拟员工。
既然是上岗,业绩是考核虚拟人打工的一个很好的标准,我们不妨一同来看看他们做的事,到底够不够实在。
例如每日经济新闻的主播N小黑/N小白,他俩便是非常典型的虚拟员工代表选手。
而且最初由于形象、播报方式过于逼真,连续播报了70天新闻,愣是没有观众发觉他俩不是真人。
再如招商集团最近推出的一名虚拟员工招小影,外貌上不仅实现了与真人无异的神态,更是身怀“十八般武艺”。
她既有工作汇总、信息通知等通用技能,又具备专业领域知识和业务自动处理等能力。
而在今年的冬奥赛事上,也出现了虚拟员工的身影,他就是冬奥数字教练——观君。
更令人诧异的是,从披露的信息来看,“观君”作为非人类,冬奥前已在自由式滑雪空中技巧运动队“服役”了三年,助力取得了两金一银。
观君会针对运动员的每一跳做出专业判断,严格判别扣分动作,而且是与国际裁判计分准则保持高度一致的那种。
具体应用里,观君会在运动员起跳、空中和落地三个阶段,做一个全流程动作量化的工作。
例如在下面的这段训练过程中,观君便能实时提供运动出台的速度和角度、最高点达到了多少米,还有落地点等信息。
不仅如此,就连冬奥播报天气的主播,也是由虚拟员工冯小殊来担任。
更早像万科集团的财务数字员工崔筱盼,更是因为斩获集团总部优秀新人奖而破圈出名。
……
不难看出,从业务能力上来看,小冰公司的这些虚拟员工可以说是高分通过考核。
所以他们是如何做到的?
主要依托其自研的小冰框架技术(Avatar Framework)。
例如在面容、表情、肢体动作在内的整体自然度可以做到真假难辨,主要是结合了小冰深度神经网络渲染(Xiaoice Neural Rendering,XNR)及小样本学习技术。
简单来说,这项技术主要包含三个步骤。
第一步是构建两个专家模型。
第一个是语音专家模型,基本的思路便是利用很大量的数据来学习、理解人类的语音。
例如人类在讲话讲到激动的时候,他的嘴型都会有比较明显的变化,而语音专家模型就是学会这项技能。
第二个是专家模型,则是通过采集摄像机等设备拍出来的人物视频数据,学习人类在说话过程中,嘴部的变化与眼睛、脸部其它肌肉之间如何产生微妙的联动变化。
如此一来,就能会让虚拟人在说话时,整个面部表情能够变得自然流畅。
第二步便来到了渲染的环节。
也就是将语音输入到深度神经网络渲染模型,而后会一帧一帧地渲染出自然的脸,并形成动态的过程。
但在这个过程中,前两个专家模型也会起到一个监督的作用,目的还是让整体效果能够自然。
第三步,则是一个自动化的过程。
也就是当把文字输入进来的时候,就会通过TTS(TextToSpeech)的方式,将文本变成语音。
而当机器接收到这些语音信号后,又会将其联动虚拟人的所有姿态、动作、表情等,最终生成一个完整的视频。
也正是在这种技术路线上的改变,最终才得以让小冰的虚拟人“瞒天过海”地骗过了人眼。
除此之外,小冰框架中还会涉及情感计算、全双工交互、超级自然语音等等,可以说是从全方面让虚拟员工无限逼近真人。
在此次融资消息对外公布的同时,小冰公司也宣称要拿这笔钱全部投入到研发当中。
其中就包括对旗下人工智能虚拟员工产品线启动年度升级,加强的技术包括大模型对话引擎、3D神经网络渲染、超级自然语音及AIGC人工智能内容生成。
……
所以,如此对比下来之后,不难看出现在虚拟人已经不再是“花瓶”般的摆设。
而是确确实实在各自的岗位上干着实事,并且还是让工作效率变得更高、工作质量也能加强的那种。
但小冰公司很显然的没有满足于此,从此次消息公布上来看,它还要继续造“人”。
虚拟员工的未来如何?
要回答这个问题,我们不妨从虚拟人赛道的大环境着手来看。
单就从2020年以来,小冰公司自身便已经经历了三次融资,并且早在去年便已经被估值到了10亿美元之多。
很显然的,市场和资本对于虚拟人赛道可以说是看好的态度。
在非常AI智库的《虚拟数字人深度产业报告》中,更大范围来看亦是如此。报告预测:
在2030年,我国虚拟数字人整体市场规模将达到2700亿。
其中,得益于虚拟IP的巨大潜力,以及虚拟第二分身的起步,身份型虚拟数字人将占据主导地位,约1750亿,并逐步成为Metaverse中的重要一环。
服务型虚拟数字人则相对稳定发展,多模态AI助手仍有待进一步发展,多种对话式服务升级至虚拟数字人形态,总规模超过950亿。
而且从目前虚拟人市场发展情况来看,这个赛道仍处于前期培育阶段。
在各行业近两年开始意识到其技术可行性和商业价值后,虚拟人行业将快速进入高速发展期。
首先,作为多模态升级的代表技术,虚拟数字人的应用场景众多,可广泛与各行业领域相结合,变现路径和市场潜力明确。其中虚拟直播、虚拟偶像已得到明确的商业价值验证。而虚拟分身生成等场景也已得到了资本和相关产业方的认可。
其次,大多数国内玩家为综合实力较强,发展成熟的AI科技公司,在客户积累、技术实力、销售渠道、资金供给等方面较为可靠,行业预计可直接进入平稳发展期。
最后,在多家业内代表公司看来,虚拟数字人作为Metaverse 主要的交互载体,具有明确的巨大增长潜力,并基于NFT、VR等有理想的延展空间。行业天花板高,能够维持长期和衍生发展。
这也就不难理解为何市场和资本会如此青睐以小冰公司为代表的虚拟人赛道了。
但另一方面,从更大范围的AIGC(AI生成内容)市场发展来看,更是印证了这点。
像Stable Diffusion的爆火,在仅发布一个月的时间内,其背后的公司便被估值到了69亿元。
这种火爆,未来的市场规模和前景也已经有了推测:
到2030年,AIGC市场规模或将超过万亿人民币。
这是市场对于虚拟人、AIGC的肯定,而回归到小冰公司自身,其“打法”也是值得讨论一番。
其实早在元宇宙、AIGC等成为热词出现之前,小冰公司已然在AI作画、创作,情感计算等方面着手发力,像夏语冰那批虚拟人,便是很好的印证。
并且像AI Being这样的概念,也是由小冰于2019年率先提出,其前瞻性可见一斑。
在2020年年末,小冰公司董事长、清华大学双聘教授沈向洋在给吴恩达的新年贺词中也表示:
我预见2021年,人工智能社区将创造出更多工具来释放人类的创造力。人工智能将帮助世界各地的人们,以各有态度的方式去沟通和表达情感和情绪。
过去,期待在艺术领域里有所成就的专业人士,比如绘画、音乐、诗歌和舞蹈,必须长年学习和苦练。用中国老话讲,是“台上三分钟,台下十年功”;用流行语说,就是从平凡到专业的“一万小时”门槛。
我预期,诸如小冰X Suites这样的工具,可以帮助每一个人减少花费在重复练习上的成本,把宝贵的精力投入到创造更圆融的创意、更具想象力的表达上。
从现在开始,我们应该将注意力转移到AI帮助人们释放创造力这件大事上。
就目前看来,小冰公司已经是率先在AIGC形成稳定商业落地与文本、声音、图像的产品化阵列。
例如文本方面,小冰金融文本生成产品覆盖约90%的机构投资人。
在绘画方面,“夏语冰”创作的水墨画是唯一入选去年迪拜世博会中国馆的人工智能绘画作品。
又比如声音,由小冰进行词曲创作及歌声生成的各类作品,先后被采用为上海大剧院演出季、成都大运会、世界人工智能大会等重要活动的主题曲,也是今年首届全民阅读大会推广曲集中,唯一入选的人工智能作品。
而至于现在为什么要推广虚拟员工,小冰公司此前也是有所透露,这样做的目的并不是要让虚拟人替代人类,而是释放机械性质的劳动力,让人类更专注于创造性工作:
但目前的创新成就与未来理想状态相比还有很长一段路要走。
因此,这次小冰公司的融资要全部投入研发也就不难理解了。
或许在不久的将来,和你共事的同事是虚拟人不再会是什么新鲜事,反倒身边没有虚拟人同事,会成为怪事儿。