Chatgpt引发了对人工智能的又一轮热议,在人们纷纷把目光集中在谁来享有和如何保护人工智能红利时,近日美国的三位插画艺术家将知名人工智能图片生成软件Stable Diffusion、DreamStudio、DreamUp、Midjourney等的运营者告上了法庭,指控内容包括侵犯版权、违反数字千禧年版权法案、侵犯公开权、违反服务条款、不正当竞争和不当得利,意在寻求损害赔偿和禁令救济。该案目前由美国加利福尼亚州北区地方法院审理。[i]这一诉讼在某种程度上反映出当下对人工智能发展及产物生成方面存在的深深忧虑:一方面,人工智能在生成产物的过程中是否可能构成侵权;另一方面,也是最重要的,最终产物所蕴含的利益应如何分配。以下分别进行分析。
1. AI训练过程中的著作权侵权。 以Stable Diffusion为例,其在LAION-5B数据集上进行了训练,LAION-5B包含58.5亿个图像文本对,大部分图像均为美术或摄影作品,且受版权保护。就目前技术实践而言,用于训练AI的作品均存储于本地硬盘或云端服务器中,这也是出于用同一样本进行反复训练的要求;而从训练效果和运算能力方面考量,都无法支持随意爬取数据并在内存中短暂进行计算的方案,亦即目前基本可以排除临时复制形态。故AI训练过程中作品复制件的储存行为应受作品著作权人复制权的控制。
后续问题是,这一行为属于对作品的合理使用吗?笔者认为,在《著作权法》第二十四条对作品合理使用的列举中,与之相关的似乎只有为个人学习、研究目的而使用作品,但这里的“个人”显然是指自然人,而不包括法人等组织,否则就没有必要为学校和科研机构等另外做出规定。
这一问题在国家互联网信息办公室于2023年4月11日发布的《生成式人工智能服务管理办法(征求意见稿)》中也有所涉及。该稿第七条规定:“提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。用于生成式人工智能产品的预训练、优化训练数据,应满足以下要求:(二)不含有侵犯知识产权的内容”。
2. AI生成物的著作权侵权。 这一点较好理解,如果AI生成物直接使用他人作品的一部分,或在他人作品基础上进行演绎,只要最终成果包含、体现了其他作者独创性的表达,就很可能侵犯他人的著作权。根据《生成式人工智能服务管理办法(征求意见稿)》第四条第五项的规定,提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗,尊重他人合法利益,防止侵犯知识产权。
3. AI训练中数据爬取的不正当竞争。 对爬取他人商业数据的不正当竞争行为,国内已有不少判例,目前更有望转化为法律规定——《中华人民共和国反不正当竞争法(修订草案征求意见稿)》第十八条规定,经营者不得不正当获取或者使用其他经营者的商业数据,损害其他经营者和消费者的合法权益,扰乱市场公平竞争秩序,其中包括违反约定或者合理、正当的数据抓取协议,获取和使用他人商业数据,并足以实质性替代其他经营者提供的相关产品或者服务。此外,大量爬取数据的行为也很可能对其他经营者的服务器等造成大量负担,不合理地增加其他经营者的运营成本,影响用户体验和其他经营者的正常经营。
4. AI生成物利用的公平性。 人工智能用艺术家的作品进行训练,艺术家不但没有从中获得任何报酬,最后市场还可能会被AI所挤占甚至完全替代。诚如前案中所称,艺术家们已经开始体验到这些产品可能给他们的生计带来的经济负担,艺术专业的学生想知道他们是否应该继续追求自己的激情。
对此,一方面,从著作权法角度出发,我们应当反思AI对他人作品的利用是否属于“不合理地损害著作权人的合法权益”,或者考虑利用行为“对作品潜在市场或价值的影响”,尤其当该利用往往出于营利目的时;同时也绝不能认为转化性使用(transformative use)就当然的可以与合理使用画等号。另一方面,从反不正当竞争法角度出发,虽然并非所有不劳而获行为都要由法律调整,但对本文讨论的问题,笔者并不认为这是法律的刻意“留白”,而是技术飞速发展对法律带来的又一新挑战。
在我们对AI产业的孵化及其生成物的保护抱有较高积极性,并尝试通过反不正当竞争法、邻接权或者专门法等各种方式及时对其提供保护的同时,是不是也应驻足去倾听和反思AI浪涛声中隐约传来的作者的呼声,探索建立和完善相应的权利保护与利益分享机制(或可参考追续权、孤儿作品、集体管理等制度)。这或许是出于利益平衡、产业发展、市场激励与文化繁荣,或许也只是因为,人工智能需要对每个人都公平和合乎道德。
注释
[i] 更多案件详情及进展可参见该案代理律所网站,网址https://www.saverilawfirm.com/our-cases/ai-artgenerators-copyright-litigation,作者最后访问时间2023年4月10日。