数字人的应用场景与合规重点(上)
数字人的应用场景与合规重点(上)
引言
人工智能技术的发展与应用在许多领域引发了革命性的变化,其中之一即为数字人的兴起。近几年来,从虚拟偶像,到数字人主播,再到数字人员工,各种形式的数字人不断走入现实生活,数字人产业热度持续提升,数字人产业发展势头迅猛,潜力广阔,受到越来越多的关注。2022年,北京市印发《北京市促进数字人产业创新发展行动计划(2022-2025年)》,提出打造数字人产业创新高地;2023年4月,国家广电总局举办第三届广播电视和网络视听人工智能应用创新大赛,虚拟数字人技术应用为五大赛道之一;2023年6月,上海市发布《上海市“元宇宙”关键技术攻关行动方案(2023—2025年)》,将数字人生成与驱动技术作为关键技术进行重点布局。
作为“当下最前沿、最时尚的前沿技术产品”,[1]数字人的合规发展还有待同步建设与探索。本文将结合行业实务,对数字人的典型应用场景及合规重点进行梳理与总结,为数字人产业的规范发展提供参考。
一、数字人产业发展概述
迄今为止,数字人还未形成较为明确的通行定义。结合既有研究[2],本文将数字人定义为:使用计算机图形学(Computer Graphics,简称CG)、动作捕捉、人工智能(Artificial Intelligence,简称AI)等计算机技术制作,具有多重人类特征的数字化人物形象。
在此意义上,数字人应当满足三方面的要求:1.数字化,即存在于数字空间;2.技术基础,即依赖于计算机技术;3.真人化,即具备人的外貌特征、行为举止、交互能力等人类特征。
(一)从虚拟人到数字人
数字人的产生与发展依赖于作为其技术基础的计算机技术。20世纪60年代,CG技术出现,使工程与科学数据转化为图像具有了可能性。1964年,为研究飞行员与飞行舱的空间关系,从而设计出更加合理有效的驾驶舱空间,波音公司的设计师威廉·费特(William Fetter)将中等体型的美国男性身体数据输入电脑,“波音人”(Boeing Man),这一世界上第一个通过计算机创造而成的数字化人物形象就此诞生。不过,波音人的图像仅仅是用数量有限的点与线勾勒出了人体轮廓,与真实的人物形象相去甚远。
波音人Boeing Man-波音公司(图片来自boeing images)
受计算机技术发展水平的限制,在20世纪,创造出非物理世界中人物的主要方法为手绘。这类并非以计算机技术为基础的虚拟人物形象可称之为“虚拟人”。1982年,日本动画《超时空要塞》的制作方将女主角林明美包装为歌手,为其制作发行专辑,创造出世界上第一位虚拟歌姬。1984年,英国人George Stone, Annabel Jankel和Rocky Morton利用手绘、化妆、真人演员扮演等方式,创造出一位虚构的人工智能角色Max Headroom。[3]
进入21世纪,CG、动作捕捉等技术逐渐取代了化妆、手绘等传统方式。随着计算机技术的普遍使用,虚拟人向数字人转变。《指环王》《阿凡达》《加勒比海盗》《猩球崛起》等知名影视作品即使用CG与动作捕捉技术进行创作。2007年,初音未来这位使用CG技术合成人物形象、雅马哈VOCALOID系列语音合成声音的二次元风格偶像诞生于日本,受到广泛的追捧与认可。
(二)AI赋能数字人产业发展
近年来,建模、渲染、深度学习、AI等技术的日益成熟使数字人产业受益良多,而以ChatGPT为代表的采用大型语言模型(Large Language Model,简称LLM)的生成式人工智能技术的突破,更为数字人产业的发展插上翅膀。
AI使数字人“皮囊”的制作更加方便、成本更加低廉。以动作捕捉技术为例,《阿凡达》《猩球崛起》等影视作品所采用的光学式动作捕捉成本动辄高达百万元以上。AI动作捕捉软件出现后,仅需单个普通摄像头、一小段视频等,即可完成精准的动作捕捉,并将其应用于数字人形象的制作。
另一方面,AIGC(Artificial Intelligence Generated Content)让数字人的“灵魂”更加真实。生成式人工智能极大地增强了数字人的交互能力,AI可以学习和模拟人类的情感和情绪表达方式,使数字人能够更好地理解和回应人类的语言指令和对话,展示更加自然的情感反应,并不断学习和改进自己的行为,使其更加逼真和符合人类期望。
(三)数字人产业未来展望
随着科学技术的不断进步,数字人产业或将迎来更多创新和突破。
一方面,数字人将变得更加逼真和沉浸。通过使用更先进的图形渲染技术、生动的情感模拟、更自然的运动捕捉和智能的语音交互,数字人将提供更真实的感觉和体验,用户更加容易与其产生情感共鸣。另一方面,数字人产业将更加普及化、个性化,可以根据用户的喜好、需求和个性进行定制。通过深度学习和个性化推荐技术,数字人将能够提供定制化的服务、建议和内容,满足用户的独特需求,提升用户体验度。在更加长远的尺度上,随着元宇宙的不断发展,每位个体可能都将拥有属于自己、代表自己的数字人。
二、数字人的典型应用场景
(一)数字人的分类
数字人可根据不同维度的因素分成不同类型,主要的分类方式包括:
1.根据视觉维度,可以分为2D和3D两大类。
2.根据还原人类形象的真实程度,可以分为卡通、写实、仿真、全真等类别。
3.根据能否进行人格化交互,可以分为交互型数字人与非交互型数字人。
4.在交互型数字人中,又可以根据驱动技术基础分为人工智能驱动型以及真人驱动型。人工智能驱动型数字人通常是以人工智能作为其“灵魂”,由人工智能系统对外界信息进行读取、识别及反馈,进而驱动数字人做出相应的交互动作。真人驱动型数字人通常由真实的人进行扮演,并使用动作捕捉技术,将真人的动作和表情转化为数字人的动作和表情,从而实现与用户的交互,这一模式中的真人通常被称为“中之人”。
5.根据应用目的,主要可以分为服务型数字人与身份型数字人。[4]服务型数字人是指其主要应用场景为替代真人完成任务或提供服务,例如数字客服、数字导游、数字讲解员、数字助手等服务性角色。身份型数字人是指具有鲜明身份性、IP化运营的数字人,主要出现在娱乐、社交领域,例如虚拟偶像、虚拟品牌代言人、数字人主播、作为个体在虚拟世界中代表的数字分身等。
数字人类型
(二)典型应用场景
数字人的发展潜力巨大,适用领域广泛。目前,其在偶像娱乐、直播短视频、教育培训、数字化劳动力、情感陪伴领域的应用具有较强的代表性。
1. 偶像娱乐
偶像娱乐领域的应用在数字人产业中占据了重要地位,初音未来、洛天依等虚拟偶像的成功运作在一定程度上提高了社会对数字人的认识与接受程度,促进了数字人产业的发展。
目前,虚拟偶像主要可以分为原创型虚拟偶像以及现实偶像的数字分身两类。原创型虚拟偶像的典型代表如初音未来、洛天依、A-SOUL、柳夜熙、天妤等;现实偶像的数字分身的典型代表如虚拟邓丽君、千喵(易烊千玺的个人虚拟形象)、小小撒(撒贝宁的孪生人工智能主持人)等。
2. 直播短视频
AIGC加持下的数字人主播不知疲倦、全年无休,在直播、短视频领域大放异彩。完美日记、欧莱雅等知名品牌开始尝试使用数字人主播;今年“6·18”期间,京东推出了“言犀虚拟主播”产品;7月3日,西安市长安区首家数字人直播基地正式揭牌,110名AI数字人主播“上线”工作,助力长安区农特产品的线上销售。数字人主播还能够以较低成本解决语言障碍,直击跨境商家痛点。数字人主播正成为数字人产业的巨大增长点。
3. 教育培训
数字人技术正在以数字人教师、学生等身份参与教育培训。例如,虚谷未来科技于2020年推出形象为喜爱阅读、善于分享的12岁少女数字人小艾,提供领读、陪伴等服务,以激发少儿的阅读兴趣。2022年2月,河南开放大学引入首位数字人老师河开开,面向全省播报学校的教育教学支持服务等工作。2023年6月,中公教育与新华网联合推出三维数智人及职业教育行业大模型,有效地拓展了名师的教学范围,并大幅提升效率、降低成本。
4. 数字化劳动力
麦肯锡发布的《数字化劳动力》白皮书指出,作为第四种用工模式的数字化劳动力能够为工作模式与工作环境带来众多革新,预计至2030年市场规模将达到1.7亿元。[5]近两年来,银行、学校、展览馆等诸多场景已纷纷尝试数字人员工,例如2022年2月份,宁波银行上海分行迎来数字人员工“小宁”;2022年8月,网龙网络公司甚至任命其数字人员工“唐钰”为轮值CEO。
5. 情感陪伴
2013年,电影《Her》上映,描绘了男主人公与拟人化女声人工智能虚拟助手相恋的故事。受该电影启发,创始人Kuyda创建了AI聊天软件Replika,用户可以为自己的聊天机器人选定名字、性别、容貌等,具备学习型人格设定的Replika还会在与用户的沟通中不断“进化”,提供更加针对性的聊天体验。自2017年上线以来,Replika就吸引了千万用户,不少用户宣称与自己的Replika伴侣缔结了恋爱关系。2023年5月2日,23岁美国网红Caryn宣布与初创企业Forever Voice合作推出“虚拟女友”Caryn AI,公测两周即吸引近2万付费用户。业内领先的科技投资公司A16z提出,“我们正处在一个重大的社会转变的边缘:AI伴侣将很快变得司空见惯。”[6]
下篇预告
在下篇中,我们将对数字人在制作与应用中的主要合规要点进行梳理。
[注]