OpenAI赢下首轮媒体起诉案，但还有六起诉讼在前方等待丨AI版权战事

首页 > 商业 > 正文

2024-11-12 12:26:10 21世纪经济报道 21财经APP 肖潇

21世纪经济报道记者肖潇北京报道

OpenAI在与新闻媒体的版权战事中获得了首轮胜利，不过是暂时的。

11月7日，美国纽约南区地方法院驳回了新闻媒体 Alternet 和 Raw Story 起诉 OpenAI 的案件。两家媒体在今年2月联合起诉，指控OpenAI在给大模型投喂训练数据时删除了版权信息，而且ChatGPT可以在不说明来源的情况下，根据版权内容输出回复。

两家媒体因此对每起侵权行为索赔至少2500美元，并寻求禁令救济，阻止OpenAI继续使用它们的版权作品。此外，它们还要求OpenAI 从训练数据集中删除所有受版权保护的材料。

上周四，纽约南区地方法院驳回了Alternet 和 Raw Story 提起的诉讼。法官最终认为，原告没有证明它们因版权信息被删除而遭受了哪些具体伤害，不满足提起诉讼的条件。

需要注意的是，受访专家告诉21记者，即使这次是OpenAI的胜利，也只是一次有限的胜利，因为该案并没有回应AI领域最白热化的争议——公司使用版权素材训练AI，到底需不需要获得版权方授权？对于这一问题，中美两国的法院目前都还没有给出答案。

尽管诉讼被驳回，但Raw Story 和 AlterNet 并未打算放弃。原告律师在接受媒体采访时表示，他们有信心通过重新修订起诉书，继续维权。判决书也透露出法官愿意考虑重新提起诉讼的信号。

核心争议：版权管理信息

与其他诉讼不同的是，原告Raw Story 和 AlterNet并没有直接主张OpenAI侵犯了版权，而是指控其违反了版权管理信息（CMI）的相关条款。

两家媒体在诉讼书中写道，OpenAI 擅自抓取数千篇新闻报道，并在输入大模型训练时删除了版权管理信息（CMI）——包括作者姓名、作品使用条款和条件以及作品标题。它们还指出ChatGPT在生成回答时，通常也不提供作品的作者、标题和版权信息。

根据美国《数字千年版权法》第1202(b) 条款，未经授权去除或更改版权管理信息（CMI）的行为被视为版权侵犯。

另一边的OpenAI 则辩称，媒体出版商没有法律资格提出诉讼：一是因为它们没有证据证明ChatGPT 接受了它们的作品训练，二是没有证明因版权管理信息被删除，而遭受了哪些具体伤害。

法官最终认同了OpenAI的观点，并在判决书中补充道：“当用户向 ChatGPT 输入问题时，ChatGPT 会将其数据库中的相关信息合成回复。考虑到数据库的信息量，ChatGPT 输出原告文章内容的可能性似乎很小。”

上海大邦律师事务所高级合伙人、知识产权律师游云庭向21记者分析，原告只证明了自己的作品被包含在OpenAI的训练数据集中，但没有证明OpenAI是不是用了这些素材训练。他表示，在举证环节，原告一般会向AI定向提问，根据输出逆推输入素材。比如《权利的游戏》作者在起诉OpenAI时，让ChatGPT为《权力的游戏》续写大纲；有些艺术家会使用特定输入词，检测AI生成的图片是否包含自己作品的一些特征元素。

不过，举证始终是AI版权纠纷的一大难题。“大模型是一个黑盒，怎么才能证明它到底有没有拿你的素材？去做了哪些训练？拿我国的民事诉讼法来说，也缺少证据开示等帮助弱势当事方的制度。”此前天元律师事务所合伙人李昀锴向21记者表示。

李昀锴说，在技术黑盒的情况下，能让AI公司责任更轻、更稳妥的方案其实就是“闭口不谈”——只要AI公司不说，版权方就证明不了。此类困扰恐怕会一直存在。

值得一提的是，虽然本案法官认为原告不满足起诉条件，并且拒绝了重新起诉的请求，但判决书指出在特定情况下可以重新提起起诉。法官认为，本案利益攸关的地方不是版权信息被删除，而是“被告使用了原告的作品开发ChatGPT，却没有向原告支付赔偿金” ——也就是OpenAI需不需要为训练数据的版权付费

这又回到了版权战场的老叙事中。

未解之谜：合理使用问题

“即使这一次是OpenAI的胜利，也只是一次有限的胜利。本案判决并没有回应目前AI领域的核心争议。” 游云庭说，目前业内的目光焦点，也正是AI公司在使用版权素材进行训练的时候，到底需不需要获得授权。

公开资料里，OpenAI还有至少六起正在进行时态的版权官司：去年12月《纽约时报》打响了媒体版权战场的第一枪，声称ChatGPT可以逐字输出报道内容，《每日新闻》、非营利新闻机构调查报道中心、The Intercept三家媒体分别对OpenAI提起了同类诉讼；媒体之外，还有Youtube博主Millette指控OpenAI擅自转录了数百万个YouTube 视频来训练大模型，超过100人参与了集体诉讼；三名小说作者分别对 OpenAI 提起侵权诉讼，现已合并为针对OpenAI 和微软的一项诉讼。

以上诉讼的一个共同点是，都指控OpenAI擅自利用版权作品训练AI，侵犯了版权权利人的利益。

游云庭指出，对于这一争议，目前中美两国的法院都还没给出答案，但日本已经把其列为了“合理使用”行为。

日本《著作权法》允许AI在未经授权的情况下，利用包括报刊文章在内的版权作品，作为AI学习的材料。去年6月，日本文部科学（相当于国内教育部）大臣永冈桂子在当地会议上再次回应，称“在日本，无论使用何种方法，无论是出于营利或非营利目的，无论用于复制以外的行为，还是从非法网站获得的内容，都可以使用信息分析作品。”

广东财经大学法学院教授姚志伟此前告诉21记者，合理使用的理论在日本著作权法和美国的司法案件中有一定体现，但在中国法中没有立法依据，能否在司法上得到认可具有很强的不确定性。

除了版权官司，OpenAI近期负面动态频频，包括内部员工爆料下一代模型不及预期；人事变动频繁，安全团队高管接连离职。据外媒获得的财务文件，OpenAI 8月份的月收入达到3亿美元，自2023年初以来增长了1700%，预计今年的年销售额约为37亿美元。但有金融专业人士分析，在支付运营服务等其他成本费用后，公司预计今年将亏损约50亿美元。