2023年4月11日,国家互联网信息办公室(以下称:网信办)发布关于《生成式人工智能服务管理办法(征求意见稿)》(下称《办法》)公开征求意见的通知。虽然目前只是征求阶段,但是我们还是可以从该意见稿中洞察AIGC领域的未来可能面临的合规之路,接下来我会列举《办法》中比较重要的条款进行解读。
《生成式人工智能服务管理办法(征求意见稿)》全文共21条,以《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》这三部法律为上位法,并与《互联网信息服务深度合成管理规定》、《互联网信息服务算法推荐管理规定》相衔接,共同构成对生成式人工智能领域的监管。
第二条 研发、利用生成式人工智能产品,面向中华人民共和国境内公众提供服务的,适用本办法。
本办法所称生成式人工智能,是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。
本条规定《生成式人工智能服务管理办法》的适用范围。即只要是面向中国境内公众提供服务,受到本办法的规定,如果是企业内部使用,在本条中并没有进行说明,根据法无禁止即可为的原则,企业内部使用应当不受该办法规制。
本条第二款,《生成式人工智能服务管理办法》对“生成式人工智能”进行了笼而统之的定义,狭义来讲,目前99%的软件服务都是“基于算法、模型、规则生成文本、图片、声音、视频、代码等内容”,如果为了没有其他规范性文件对生成式人工智能进行更具体的定义,那么可以预见,此款在实务中一定会出现各式各样的解释。
第三条 国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源。
本条再一次重申国家对于人工智能的持支持的态度,这也符合《十四五国家信息化规划》关于人工智能的未来规划。
第四条 提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗,符合以下要求:
(一)利用生成式人工智能生成的内容应当体现社会主义核心价值观,不得含有颠覆国家政权、推翻社会主义制度,煽动分裂国家、破坏国家统一,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情信息,虚假信息,以及可能扰乱经济秩序和社会秩序的内容。
(二)在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取措施防止出现种族、民族、信仰、国别、地域、性别、年龄、职业等歧视。
(三)尊重知识产权、商业道德,不得利用算法、数据、平台等优势实施不公平竞争。
(四)利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。
(五)尊重他人合法利益,防止伤害他人身心健康,损害肖像权、名誉权和个人隐私,侵犯知识产权。禁止非法获取、披露、利用个人信息和隐私、商业秘密。
本条系对提供生成式人工智能产品或服务提出了基本的合规要求。从整个条款上看都是一些常见的放之四海而皆准的合规性条款。但本条对于AIGC提供商来说,笔者认为未来也存在不小的挑战,比如:虚假信息在AIGC领域目前来说是无法避免的问题,CHATGPT胡言乱语,捏造答案的问题由来已久。因此AIGC的合规道路上如何避免AI生成虚假的、歧视的等内容,需要更多的开发者去着重解决。
第五条 利用生成式人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人(以下称“提供者”),包括通过提供可编程接口等方式支持他人自行生成文本、图像、声音等,承担该产品生成内容生产者的责任;
此条进一步明确了生成式人工智能产品的提供者,在实务中明确了主体是否适格的问题,本条将“生成内容生产者”的责任划归到产品服务提供商(文中称为“提供者”)之下。言下之意“技术无罪”,AIGC产品的开发人员在本条中并未提及,未来若AIGC产品被用于违法犯罪活动,笔者认为法律规范对于会对开发者进一步明确的规定。
值得注意的是,如果“提供者”只是AIGC的代理商,若因AIGC产品设计问题,非因“提供者”故意或者重大过失导致侵害他人合法权益,该侵权责任该如何定性,实务中大概率会出现。如:甲公司代理乙公司的AIGC产品,提供服务过程中侵害了第三人权益。那么甲乙公司应当如何承担侵权责任?
第七条 提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。
用于生成式人工智能产品的预训练、优化训练数据,应满足以下要求:
(一)符合《中华人民共和国网络安全法》等法律法规的要求;
(二)不含有侵犯知识产权的内容;
(三)数据包含个人信息的,应当征得个人信息主体同意或者符合法律、行政法规规定的其他情形;
(四)能够保证数据的真实性、准确性、客观性、多样性;
(五)国家网信部门关于生成式人工智能服务的其他监管要求。
此条在《办法》第四条的基础上,更加细化对AIGC服务提供者提出了合规要求,与第四条相同,此条主要内容也是放之四海而皆准的基础规范,但是同样在AIGC领域,数据的真实性、准确性、客观性、多样性是提供者需要着重考虑的问题。实务中,提供者很难对海量数据进行传统意义上的真实性核查验证,且AI训练过程中,并非所有源数据均源于现实世界界,AIGC生成虚假的信息屡见不鲜,该类数据本身很难用“真实”与否进行判断。笔者认为,未来对于AIGC的真实性、准确性、客观性、多样性应该会有更加细致的规定。
第八条 生成式人工智能产品研制中采用人工标注时,提供者应当制定符合本办法要求,清晰、具体、可操作的标注规则,对标注人员进行必要培训,抽样核验标注内容的正确性。
标注员一般指工作于互联网公司,按照公司要求收集互联网数据并进行标注的工作人员。标注员就是使用自动化的工具从互联网上抓取、收集数据包括文本、图片、语音等,是IT互联网公司的一个职位,然后对抓取的数据进行整理与标注,相当于互联网上的“专职编辑”,具笔者所知,数据标注的成本是一笔不小的开支,《办法》着重强调了标注这一事项,不知未来对于AIGC服务提供者,是否会有强制性的标注要求,这对于提供者来说是一笔支出。
第十条 提供者应当明确并公开其服务的适用人群、场合、用途,采取适当措施防范用户过分依赖或沉迷生成内容。
笔者认为,此条极具先见之明,在目前互联网生态中,防沉迷通常与未成年、游戏有关联,AIGC服务可拓展为AI游戏、AI伴侣、AI陪聊等各个领域,结合苹果公司前段时间开发的头戴设备苹果Vision Pro,可能会让用户无法分辨现实与虚拟世界,并沉迷其中,在未来不管是未成年人还是成年人沉迷于AIGC服务的概率非常大,因此笔者认为此条极具先见之明。
第十一条 提供者在提供服务过程中,对用户的输入信息和使用记录承担保护义务。不得非法留存能够推断出用户身份的输入信息,不得根据用户输入信息和使用情况进行画像,不得向他人提供用户输入信息。法律法规另有规定的,从其规定。
在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。禁止AIGC提供者对用户进行画像从而对其提供针对性的服务,这势必会对提供者在盈利造成严重的影响。因此笔者认为,未来限制性的允许提供者对用户进行画像更符合”支付人工智能“这一定调。
第十三条 提供者应当建立用户投诉接收处理机制,及时处置个人关于更正、删除、屏蔽其个人信息的请求;发现、知悉生成的文本、图片、声音、视频等侵害他人肖像权、名誉权、个人隐私、商业秘密,或者不符合本办法要求时,应当采取措施,停止生成,防止危害持续。
第十五条 对于运行中发现、用户举报的不符合本办法要求的生成内容,除采取内容过滤等措施外,应在3个月内通过模型优化训练等方式防止再次生成。
第十九条 提供者发现用户利用生成式人工智能产品过程中违反法律法规,违背商业道德、社会公德行为时,包括从事网络炒作、恶意发帖跟评、制造垃圾邮件、编写恶意软件,实施不正当的商业营销等,应当暂停或者终止服务。
上述几条对投诉机制、整改机制、惩罚机制做出了规定,十三条类似于网络服务提供者的避风港责任,即其在接到用户投诉、举报通知后,应当及时采取必要措施,否则应就用户损失扩大的部分承担责任。十五条、十九条可以看出对方AIGC提供者的惩罚并非一刀切,但是这也可能为权利早就了寻租的空间。
结语:
《办法》对生成内容、提供者的主体责任、数据信息的合规、算法备案等制度都提出了要求。《办法》的出台对整个行业的发展起到引导作用,也给各个开发者带来了一定的压力。开发者们需要在数据维护、模型设计、模型输出、用户交互等全流程进行新的服务设计和改进。这一政策的出台显示了我国对于生成式人工智能技术发展的关注与支持,将相关科研机构和企业的发展纳入了合规、安全的框架之中。这对于构建本土化AIGC研发环境来说是非常有利的。然而,我们也应该认识到这一政策仍然存在一些不明确之处,需要在实践过程中进一步完善。我们期待正式《办法》的早日出台,同时也期待相关行业在合法、合规和安全的框架下充分挖掘最大的潜能与价值。