不论是前段时间凭一张证件照刷屏全网的“AYAYI”,还是一夜之间涨粉百万的“柳夜熙”,对真人形象的高还原度和超写实度,都标志着虚拟数字人技术,已经完全不同于人们对它的固有印象——是的,这项技术升级了,并且脱胎换骨。
而一向致力于虚拟数字人技术开发的小冰框架,绝不仅仅满足于虚拟偶像的打造。
他们的理想很宏大——打造出足够完美的虚拟数字人,并让它们“丝滑”地融入人们的日常生活并承担部分工作。
而最新消息是,他们已经初步成功了。
虚拟数字人,真假难辨
这一次,虚拟数字人选择的“试点”在“每日经济新闻”上。
如果有人关注过“每日经济新闻”,就会发现,这个栏目在过去两个多月的时间已经做到24小时不间断直播。
24小时不停歇,对于工作人员而言,意味着需要完成比平时更多的工作量。
可偏偏,整整70天的不间断直播任务,全部压在了两名主播身上——“N小黑”和“N小白”。播到最后,就连观众都有点看不下去了:“这俩主播也太敬业了,天天都上班?”
即便再敬业,给的钱再多,24小时连轴转谁都受不了。
在一次财经资讯播报完成后,“N小黑”主动向观众摊牌了——原来,他根本不是真实的人,而是一名人工智能主播。换句话说,他通过镜头所完成的每一个动作、所播报的每一条资讯,都是由人工智能小冰框架生成和驱动。甚至,连整个的视频采编、播出全流程,都实现了无人化操作。
连续直播70天,观众居然没发现主播是“假的”?这说出去,多少令人不可思议。
而支撑着“真假难辨”虚拟数字人的,正是领域内的一项最新技术:深度神经网络渲染技术(XNR)。
让虚拟数字人更接近人类
“深度神经网络渲染”,主要解决的是虚拟数字人的建模问题。
在制作虚拟数字人的时候,最基础,也是最难的一步,就是给它进行建模——模型的面部特征该怎么选择、五官结构该怎么展现、皮肤细节该怎么体现……这些问题,都需要在这个环节进行解决,并且,工作量巨大。于是,“深度神经网络”就应运而生。
这种技术,是一种结合了AI人工智能的机器学习技术。
比方说,研究员们想用它给一个虚拟数字人的头发做建模,那么他们首先需要搭建一个深度神经网络,然后给出至少40000种不同的发型和160000张二维照片去对它进行训练。经过训练后,这套深度神经网络就可以在几毫秒内对照着二维照片生成一个三维的头发形态,还可以准确还原出不同发型的颜色、长度等等。
“每日经济新闻”的虚拟数字主播“N小黑”之所以形象这么逼真,很大程度上都是依赖于这项技术。
当然,想让“N小黑”在直播过程中的每一帧动作都足够流畅,只靠建模远远不够。
在制作“N小黑”的过程中,技术团队首先搭建了两个专家模型:一个负责语音,一个负责面部表情。“语音专家模型”专门用来学习、捕捉人类讲话时嘴型的变化;另一个则专门用来学习人类讲话时嘴部与眼睛等面部其他肌肉的联动变化。这样一来,就能保证直播中的“N小黑”面部表情自然、流畅。
随后,技术团队会将特定的语音输入到搭建好的深度神经网络模型中,模型会自动渲染出相应的人物形象,并生成一个动态的变化过程。
最后,他们直接将文本转化成语音,输入到特定的机器中。机器接收到语音信号,就会调动制作好的虚拟数字人所有的姿态、动作,自动生成完整的视频。
“N小黑”和“N小白”就是在这样高度自动化的程序中,完成70天不休的资讯直播的。
虚拟数字人指向的未来
不论是“虚拟偶像”还是“虚拟主播”,它们的出现意味着,虚拟数字人已经是大势所趋。虚拟数字人柳夜熙
据相关资料显示,仅中国2020年的虚拟偶像市场,其核心产业规模就已经达到了34.6亿元。2021年,中国网民支持和关注虚拟偶像的比例已经达到63.6%。经专业数据机构预测,中国虚拟偶像核心产业的市场规模,在2023年将突破200亿元。
而“每日经济新闻”此次的虚拟数字主播“N小黑”和“N小白”潜伏70天自爆身份,也让更多人意识到,虚拟数字人物走进人们的日常生活,并非一定会遭受激烈的质疑和抵触,它们完全可以凭实力,让更多的人去接受这项新技术对日常生活所带来的改变。
在“新闻主播”之后,下一个引进虚拟数字人物的会是哪个领域?