从ChatGPT看AIGC的法律风险及合规应对
从ChatGPT看AIGC的法律风险及合规应对
引言
2022年11月底,由美国OpenAI实验室研发的新一代生成式人工智能聊天机器人ChatGPT正式上线,在上线两个月后用户量便突破了一亿,成为历史上增长最快的消费应用程序。其不仅能够根据上下文进行自动回复,而且对撰写文章、代码、视频脚本等工作应对自如。从技术原理来看,依靠深度学习和自然语言处理技术的ChatGPT,实际上属于人工智能生成内容(“AIGC”)的一种新型的商业化应用方式。ChatGPT热度的飙升也再次引发了人们对AIGC相关法律风险的关注。本文将从AIGC概念及工作原理、具体应用场景及可能带来的法律风险进行分析,同时为AIGC领域相关企业提供相应的合规应对建议。
一、AIGC的基本概念及原理
AIGC全称为Artificial Intelligence Generated Content,即“人工智能生产内容”,是一种基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的AI赋能技术。
早前出现的PGC(Professional Generated Content,专业生成内容)和UGC(User Generated Content,用户生成内容)的内容生产行为背后的主体是人,而AIGC作为一种自动生成内容的新型生产方式,其内容生产行为背后的主体是人工智能。
从生成内容来看,AIGC中不仅包含基于线索的部分生成,还包括完全自主生成以及基于底稿的优化生成。也就是说,AIGC所生成的内容中不仅包括常见的图像、文本、音频等外显性内容,同样也包括策略、剧情、训练数据等内在逻辑内容。
二、AIGC的应用场景
从AIGC的应用行业来看,AIGC为文化传媒、商业、教育、金融、医疗、工业、影视等多领域都带来了颠覆性的创新。
从AIGC的具体生成内容分类来看,AIGC可划分为文本、代码、图像、音视频等类别。
资料来源:量子位智库,中国信通院,Tom Mason,OpenAI官网,中金公司研究部
其中,文本生成是目前AIGC应用最广的场景,近期爆火的ChatGPT即为典型的文本生成式的AIGC。文本生成式AIGC主要包括应用型文本、创作型文本及文本辅助和文本交互四种类型,并在新闻、营销、客服、游戏等行业有广泛应用。
三、AIGC涉及的法律风险
AIGC的发展为各行各业带来了新的变革与机遇,但与此同时,也应当关注AIGC可能带来的法律及伦理风险,以此推动这一技术的合法合规发展。
1. 数据安全风险
作为21世纪的“石油”,数据的战略重要性逐渐凸显。为捍卫国家数据安全、保护个人数据权益和规制数据使用行为,我国陆续出台《中华人民共和国网络安全法》(《网络安全法》)、《中华人民共和国数据安全法》(《数据安全法》)《中华人民共和国个人信息保护法》(《个人信息保护法》)等相关法律法规。在AIGC迅速发展的情况下,AIGC所带来的数据安全风险不容忽视。
以ChatGPT为例,根据ChatGPT的运作原理,用户在输入端口提出问题后,该问题首先会传输到位于美国的OpenAI公司,随后ChatGPT才会给出相应回答,从而实现输入到用户端口对问题的反馈。AIGC的使用者在使用AIGC技术时很有可能会无意中透露有关个人、金融、商业隐私等的敏感信息,从而造成数据的泄露。同时,部分AIGC公司的数据库中存在着大量未经用户知情同意的个人照片等隐私数据,容易对用户的个人隐私安全造成威胁。
此外,在ChatGPT类的AIGC工具进行内容生成的过程中,数据的入境与出境作为服务的开端和结尾,都隐藏着法律风险。尤其在数据出境方面,AIGC使用者所提出的问题中极有可能涉及到个人信息、敏感信息甚至有关国家安全、经济运行、社会稳定、公共健康和安全的重要数据。如前所述,在用户使用ChatGPT的过程中数据将会被传输到其境外母公司,由此可能对境内数据造成数据出境风险。2021年12月国务院印发的《“十四五”数字经济发展规划》中明确指出:数据要素是数字经济深化发展的核心引擎。因此,在当前数据安全保护的语境下,应当更加注重对于数据安全问题的关注。
2. 著作权侵权风险
AIGC的生成需要依托于海量的文本数据,通过对数据集进行监督学习、强化学习从而优化输出的内容。而AIGC的生成过程及其生成结果均存在着著作权侵权风险。
一方面,AIGC使用作品的行为存在着风险。AIGC在生成过程中不可避免会涉及到对他人享有著作权的作品的使用。在当前著作权法的语境下,在使用主体对受著作权法保护的作品进行使用时,必须在获得权利人许可,支付相应的许可使用费用后方属于合法使用,而在现行著作权法下AIGC对作品的使用并不能援引法定许可或合理使用条款作为其著作权侵权的例外条款。因此,AIGC未经许可使用作品的行为可能会因为侵犯被使用作品的复制、改编、信息网络传播权等权利而落入到侵权困境当中。如2023年1月,全球知名图片提供商华盖创意(Getty Images)起诉热门人工智能(AI)绘画工具Stable Diffusion的开发者Stability AI,称其未经许可从网站上窃取了数百万张图片。此外,还有3位艺术家对Stable AI和另一个AI绘画工具Midjourney,以及艺术家作品集平台DeviantArt提起诉讼,称这些组织通过在“未经原作者同意的情况下”从网络上获取的50亿张图像来训练其人工智能,侵犯了“数百万艺术家”的权利。因此,AIGC在生成内容的过程中使用受著作权保护的作品可能会由于未经许可而使用导致相关的侵权诉讼。目前欧盟、英国、日本等国家和地区已尝试出台了关于“文本与数据挖掘例外”“计算机分析例外”等与AI使用作品相关的著作权侵权例外制度,一定程度上为AIGC使用作品的行为提供了探索合理使用依据的实践。而目前我国最新修订的《中华人民共和国著作权法》(《著作权法》)中对于合理使用仍采取“封闭式”的立法模式,对于人工智能在进行内容生成时使用受著作权保护的相关作品的问题尚未进行回应,类似问题仍有待进一步的立法规范。
另一方面,若AIGC通过分析学习后生成的内容与原始作品过于相似,以至于可能会误导公众或混淆原始作品的来源,那么可能会因为与他人作品存在“实质性相似”而被认定为侵权,从而导致著作权侵权相关的诉讼。而使用含有侵权内容的AIGC内容的使用者也有可能需要承担侵权责任。
3. 深度伪造风险
AIGC还存在着被用于制作虚假的文本、音频、视频等深度伪造的内容的风险。深度伪造(Deepfakes)技术是近年来发展的一种基于深度学习的人物图像合成技术。其主要被运用于AI换脸、语音模拟、人脸合成、视频生成等场景。深度伪造技术被某些群体的恶意运用,将可能导致该技术被用于生成虚假信息、使用模型来模拟某个人的语言或行为模式、进行政治干预、煽动暴力和犯罪等破坏公共利益的行为。如2022年3月,一则乌克兰总统泽连斯基宣布投降的深度伪造视频在社交媒体平台广泛传播,虽然该视频较为粗糙,但仍造成了人们对媒体的不信任及对社会正常秩序的损害。
4. 商业秘密泄露风险
在使用AIGC的过程中,为了获取较明确的AIGC结果,用户在使用过程中可能需要提供详细的背景信息。因此,作为公司员工的用户很有可能会在未察觉的情况下违反了公司保密制度,将公司的营业信息、技术信息或商业秘密(如平台底层代码、近期营销计划、公司薪酬体系)等信息泄露,从而导致商业秘密泄露风险。以ChatGPT为例,其使用条款明确规定除非用户要求OpenAI不对其输入和输出内容进行使用,否则OpenAI拥有对任何用户输入和输出内容的广泛使用权,以达成改善ChatGPT的目的。为了防止出现泄露商业秘密的风险,微软和亚马逊均对其员工进行了禁止对ChatGPT分享任何机密信息的提醒。因此,AIGC用户,尤其是负有保密义务的用户在使用ChatGPT和类似的人工智能工具时,应当注意采取措施,以免出现泄密行为。
5. 违法信息传播风险
AIGC的广泛使用可能存在着加剧算法歧视与偏见的风险。以ChatGPT为例,根据OpenAI在其官网上的说明,尽管其努力使得ChatGPT拒绝用户不合理的请求,但ChatGPT生成的内容仍有可能存在着包含种族歧视或性别歧视、暴力、血腥、色情等对法律和公序良俗造成挑战的内容。因此,若对因算法歧视产生的可能违背法律法规或公序良俗的AIGC进行传播,则可能存在着违法信息的传播风险。
四、AIGC相关企业的合规应对
随着AIGC的发展,越来越多的科技企业将会加入这一赛道。国内AIGC领域企业在面对AIGC可能带来的法律风险时,应当做好相应的合规应对,从而更好地助力企业发展及产业进步。
1. 遵循数据安全及个人信息保护相关法律法规
AIGC相关企业应在遵守《网络安全法》《数据安全法》及《个人信息保护法》等法律法规中关于数据及个人信息保护的相关规定基础上,注意遵循2023年1月10日正式施行的《互联网信息服务深度合成管理规定》(《深度合成管理规定》)中对深度合成服务提供者和技术支持者的相关规定。对于训练数据包含个人信息的,应当遵守个人信息保护的有关规定。深度合成服务提供者和技术支持者提供人脸、人声等生物识别信息编辑功能的,应当提示深度合成服务使用者依法告知被编辑的个人,并取得其单独同意。
此外,AIGC相关企业在跨境传输数据时,应当按照《数据出境安全评估办法》《关于实施个人信息保护认证的公告》《网络安全标准实践指南——个人信息跨境处理活动安全认证规范V2.0》和《个人信息出境标准合同办法》等相关法律法规中关于数据出境的规定,通过主动了解相关法律法规和政策,开展数据出境风险自评估,为数据出境获得必要的授权或许可,并建立完善的数据出境保障措施和数据接收方管理措施,定期评估和审计数据出境的情况,从而遵守各国家和地区关于数据出境的相关规定,维护我国数据安全。
2. 加强企业版权管理
对于AIGC使用受著作权保护的作品的问题,根据我国现行《著作权法》的规定,使用他人作品时应当取得著作权人的授权。因此,AIGC相关企业在进行AIGC生成的过程中,应当注意用以抓取的数据库中是否存在受著作权保护的作品,若存在相关作品,则应当取得相关著作权人的授权,以避免陷入著作权侵权纠纷。
而对于AIGC的著作权归属问题,目前学界和实务界对此问题仍然存在着争议。在此情况下,AIGC的服务提供或技术支持相关企业可尝试在制定用户协议时明确AIGC的著作权归属,从而避免相关纠纷。
3. 加强内容审查及内容过滤
AIGC相关企业应当遵守《互联网信息服务算法推荐管理规定》以及《深度合成管理规定》等相关法律法规对AIGC的相关规定。按照《深度合成管理规定》要求,AIGC相关企业等深度合成服务提供者和技术支持者应当加强技术管理,定期审核、评估、验证生成合成类算法机制机理。此外,深度合成服务提供者对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的标识,并依照法律、行政法规和国家有关规定保存日志信息。在发现不良或违法信息时及时向有关部门进行报告,并将日志信息进行封存。
此外,AIGC企业还可以通过限制用户输入及通过自建库或第三方服务等方式,加强对其生成内容审查及内容过滤,以确保AIGC不会违反法律法规或公序良俗,从而推动AIGC企业合法合规发展。
[参考文章]