虚拟数字人的发展路径浅谈

时间：2024-06-18

□刘宁陈梓霖

数字人的概念

数字技术的产生和发展为新兴媒体的产生提供了必要的条件，今天的信息传播方式在数字技术发展影响下发生了很大的变化，新兴的媒体以及传播方式在数字技术的发展中不断出现。在这样的背景下，传播主体、传播客体、传播渠道、传播内容、传播形式等方面都发生了变革，虚拟数字人应运而生。

虚拟数字人是只存在于虚拟世界的“假人”。随着技术的发展，虚拟数字人逐渐摆脱了过去二次元的形象，渐渐向真实世界中的人靠近，拥有三次元逼真的外形，并借助人工智能的发展拥有自己的性格以及一定的智能性，数字人逐渐成为“人”。

数字人在新闻传播领域和娱乐领域都已经展现出了巨大的潜力，对于新媒体时代数字人的研究，有利于媒体对新媒体时代数字人发展方向以及发展形势做出预估。数字人已成为当下最火的话题之一，在未来数字人也许会成为新媒体时代重要的角色之一。

数字人的发展历程

起源——自动机器。自动机器是指人类借助已知的某种生物的某种功能上的逻辑，对机器进行功能模仿，借助两者的相似性来发明制造自动机器。自动机器往往是对常见生物功能逻辑的模仿，与被模仿的生物具备一定的相似性。真正可考据的自动机械装置，则是出现于公元前1400年左右由古巴比伦人发明的漏壶式水时计，而在我国春秋战国时期工匠始祖鲁班便模仿飞鸟制作出木鸟，而三国时期“智圣”诸葛亮便发明制造出可以运送军队补给的木牛流马。而早期的自动机器往往是对低等动物的模仿，而到了中世纪末期的欧洲，逐渐出现模仿高等动物——人类行为逻辑的类人型的自动机器。这些自动机器会开门迎客、端茶送水、打扫卫生甚至表演节目等，据说世界上第一个具有人类特点的自动机器是由意大利博学家达·芬奇所制作的后被命名为Leonardo's robot 的武士机器人。这个武士机器人靠风能和水力驱动，身穿意大利式的骑士盔甲，可以模仿人类进行一些动作，包括站立、摇手、扭头和张开嘴巴等行为。世界上第一个有记载的真正意义上的人形自动机器是1525 年左右由德国布尔曼（Hans Bullmann）发明制造，他制作了若干个相似结构的机器人进行音乐演奏以取悦付费的顾客。18 世纪欧洲发生第一次工业革命，齿轮的运用达到一个新的高度，借助钟表与齿轮技术制造出了大量的自动人偶。1770 年左右，德罗斯（Jack Doros）父子三人在瑞士制作出了一个可以自动写字的机器人，而这一年乾隆皇帝也收到了英国公使进贡的自动写字机器人，这个机器人可以写出“八方向化，九土来仪”8 个汉字。

发展——AI（Artificial Intelligence）人工智能。从实践劳动的角度来看，机器人就是自动机器，不论是什么样外形的自动机器，只要能够根据人设定好的程序完成一定的行为，便可以称为机器人。在实践劳动中，发明制造自动机器的目的是为了减轻人的劳动强度，提高劳动效率，为了在生产劳动中达到这一目的，人必须与自动机器产生交互。

数字人虚拟化人格的雏形早在1927 年就已经出现，当时出现了世界上最早的游戏NPC，NPC（Non-Player Character）是非玩家控制角色的缩写，是游戏中的一种角色类型，这种角色与玩家控制角色不同，可以根据玩家在游戏中进行的一定行为做出相应的反应，通过相应的反应对自身角色进行一定的塑造，在玩家视角中已经具备了一定的虚拟化人格特点。不过早期的游戏NPC 往往是在程序设定好的范围内进行，而无法对玩家所有行为都进行反应。

随着计算机的发明，人们在与自动机器进行交互时已经不满足于简单的交互模式，而是对自动机器有一定智能化的需求。计算机科学之父、人工智能之父艾伦·麦席森·图灵于1950 年在一篇名为《计算机器与智能》的文章中提出他对自动机器智能化的相关思考，在文章中他这样写道：“如果计算机能够思考，我们如何区分？”在后续的研究中他又对此做了进一步阐述：“如果在与计算机进行交互时，计算机对外界交互的反应与人对其的反应并无二致，那么可以认为计算机可以思考。”著名的图灵测试就是基于这种模式进行的。在图灵测试诞生后的半个世纪，大量科学家制作智能体尝试通过图灵测试。

人工智能的智能化是在科技发展、技术不断积累、世代交替的过程中实现的。第一代机器人虽然可以根据人的行为方式和逻辑模式成功地在互动时对外界进行反应，但无法应付设定之外的情况。麻省理工计算机科学教授怀申鲍姆（Joseph Weizenbaum）在1966 年创造出世界上第一个完全基于计算机的人物，这也是世界上第一个数字人。1966 年怀申鲍姆教授利用计算机创造了一个名为 “伊莱扎”（Eliza）的计算机程序，这个程序被用在关于自然语言处理的实验中，“伊莱扎” 可以通过计算机和外界进行交互，试验者可以通过键盘输入句子与其进行沟通交互，可见数字人已经可以在某些特定的情况下被当作真正的人。

第二代人工智能开始配备了传感器，并采用计算机为核心的控制。最常见的第二代人工智能便是配备了最初的语音助手。1970 年，美国科学家贾里尼克提出了“基于数据统计的语音识别框架”的理论，使人与人工智能的交互迎来语音识别这种新方式。贾里尼克带领IBM 公司麾下的著名实验室——华生实验室，在语音识别系统中运用统计学、信息论等相关原理，为语音识别系统用新的方法搭建基础框架，从根本上使得语音识别系统有了可用性。

第三代人工智能则是在第二代的基础上具备了一定的独立思考能力。2006 年迎来了第三代人工智能的革新，第三代人工智能的核心理念被谷歌的人工智能科学家团队提出，那就是通过深度学习，即一种通过算法让计算机主动学习，使人工智能具备一定的独立思考能力。数字人开始拥有了自主学习的能力，数字人的智能性也获得了飞跃式的提升，人们开始倾向于将“数字人”当作“人”了。2010年苹果公司推出了自己的AI 助手“Siri”，“Siri”的应用标志着AI 数字人已经走进了人们的生活。至此，数字人已经拥有了一定的人格化特征，拥有了自主学习的能力，也拥有了一定的智能性，已经越来越接近于真实的人。

第四代人工智能是通用型的，目前还未完全成熟。随着物联网时代的到来，万物实现互联，数字人可以通过网络对各种传感器进行消息的接收，再次通过网络对链接互联网的设备进行相应的控制，辅助我们对各种电子设备进行控制。随着可以链接互联网的电子设备的普及，人工智能的通用性将会越来越强，最终进入成熟阶段。

进化——ChatGPT。 ChatGPT 是一种大型语言模型，由OpenAI 设计训练。它使用深度学习技术，可以对自然语言进行解析，然后生成回答，而不需要预先编写具体的规则指令，这使得ChatGPT 成为一种非常灵活和智能的工具，可用于多个领域的应用，如自然语处理、机器翻译、人机交互等。

ChatGPT 最初是在2018 年发布的，当时采用了基于语言模型的GPT-1 作为其核心技术，在其发布后不久，Chat-GPT 就展现出了极其强大的聊天交互功能。用户可以与ChatGPT 进行对话来获得各种信息。ChatGPT 不仅可以回答用户的普通问题，比如天气、时间等基本问题，还可以对用户的情感、倾向、语气做出回应。随着时间的推移，OpenAI不断对ChatGPT 进行改进和优化，GPT-1 被GPT-2 取代，成为了ChatGPT 的核心技术，ChatGPT 也能够更好地理解自然语言的含义和用户的意图，并能够提供更加符合用户需求的回答。2020 年，OpenAI 进一步发布了ChatGPT 的第三个版本GPT-3。GPT-3 比之前的版本更强，拥有庞大的语言模型，具有更强大和更智能的交互能力，可以做推理性的回答，并在某些领域比如文学和语言识别方面表现出色。

ChatGPT 的发展是自然语言处理技术快速发展的一个缩影，在过去几年中，自然语言处理技术得到了快速发展，这不仅使ChatGPT 取得了显著的进展，也促进了自然语言处理领域的研究。ChatGPT 的出现和不断发展，将会极大地改变人机交互的方式，推动智能化技术应用于更多领域。

数字人的未来

虚拟偶像。随着科技的发展和进步，数字人的发展也迎来新的契机。2018 年以前，由于算计图形算力不高、建模软件精细度不足等技术瓶颈的限制，大部分的数字人并不能为广大用户所知，而大部分的数字人也并没有可视化的虚拟形象。随着技术瓶颈的突破，大量的具有可视化虚拟形象的数字人开始被大众所关注。

实际上，具有可视化虚拟形象的数字人并不是近年才出现，作为数字人较先被认可的细分赛道的虚拟偶像在多年以前就已经出现。世界上第一个被广泛认可的虚拟偶像是日本音乐软件公司Crypton Future Media 旗下的 “初音未来”。“初音未来”于2007 年8 月31 日正式出道，是一个二次元偶像歌姬，一出道便风靡整个日本，随后影响力逐渐遍布全球。“初音未来”凭借对大众审美取向的精准把握，占据了数字人领域的优势地位。

近年来，科技的快速发展使得CG 技术、3D 建模技术、动作识别技术、面部捕捉技术迅速革新，几经迭代后，数字人的可视化虚拟形象也逐渐向真实的人靠拢，具有真假难辨的数字化形象，拥有独立思考的能力，具备一定人格化特征的人工智能内核，数字人的互动性和社交属性大大增强，虚拟世界与真实世界的界限开始模糊，智能趋同的数字人开始崭露头角，受到各行各业的广泛关注。

Metaverse 元宇宙。2021 年“元宇宙”的风潮以迅雷不及掩耳之势火遍各行各业，“元宇宙”元年也就此开启。“元宇宙”风潮的到来，作为“元宇宙”原住民的数字人也得到迅速发展，数字人数量迅速增长。资讯公司量子位发布的《虚拟数字人深度产业报告》显示，数字人短期内的主要价值增长点是代替真人服务，而需要长期布局的则是特定场景下的多模态的AI 助手。

在商业娱乐领域，元宇宙与数字人入局者大量增加。2021 年5 月20 日，国内各类社交媒体出现名为“AYAYI”的社交媒体账号，并发布其第一条作品。凭借着带着光影的绝美精致人物形象，AYAYI 引起了社交平台用户的巨大关注。作为我国第一款Metahuman 产品，AYAYI 具有前所未有的商业潜力与娱乐潜力。相对于元宇宙Metaverse 早在30 年前尼尔·史蒂文森的科幻小说《雪崩》中就被提及不同，Metahuman 源自于EPIC 公司开发的虚幻系列游戏引擎公布的新创作工具——Metahuman Creator，这个创作工具将被用于超写实虚拟数字人的创作中。在AYAYI 获得高度关注以后，很多品牌也随即意识到了AYAYI 巨大的商业潜力，在短时间内就有数个品牌对其抛出橄榄枝。其后，AYAYI 参加了美妆品牌娇兰、奢侈品牌路易·威登、迪士尼与空山基等品牌线下活动。2021 年9 月更是宣布入职阿里，成为天猫超级品牌日的数字助理人。

信息助手。数字时代的到来，使人们获取信息的方式有了很大的改变，不再拘泥于传统的广播、电视、报纸，而互联网与移动媒体的快速发展，让人们能够更方便快捷地获取信息。虚拟数字人作为信息助手的出现也为信息获取的交互，展现出了一种新的方式和维度。通过与虚拟数字人信息助手的交互，可以快速便捷地搜索信息、设置提醒、在线导航等，降低了信息获取的门槛，大大提升了信息获取的便利性。

随着数字技术的快速发展，新媒体环境下的大部分人已习惯了通过搜索引擎和社交网络获取信息、进行交流，然而部分老年人由于生活环境和生理原因等会对这种新的信息获取方式感到陌生和困惑，不过数字人的出现为这一问题提供了可行性的方案。数字人信息助手是一种通过人工智能技术实现的智能助手，能够提供技术支持和指导，它可以帮助老年人学习和使用数字技术，获取信息和解决问题，帮助这一群体适应数字时代的发展。数字人信息助手可以提供定制化的服务，也可以提供解决方案，根据老年人的需求和偏好进行个性化配置和优化。因此，数字人信息助手可以为老年用户提供更加专业的技术支持和服务，老年人也可以更加放心和便利地使用数字技术。数字人信息助手还可以打破年龄和文化上的障碍，为老年人创造更多的社交和文化，使老年人更好地融入数字时代的发展之中。

结语

在各因素的共同作用下，2021 年成为了元宇宙元年，大量的虚拟数字人横空出世，大量的国家与企业开始布局元宇宙与虚拟数字人。虚拟数字人作为元宇宙布局不可缺少的一环，已经开始展现出巨大的发展潜力，虚拟数字人的创作在未来必定成为一个快速发展的新兴行业，对虚拟数字人的研究也必定成为新的学术研究方向。关注虚拟数字人的发展，有助于把握新媒体虚拟化、智能化、互动化的发展路径与发展趋势，进而为元宇宙发展的研究提供具体对象。