普利策得主牵头起诉六大AI巨头!集体诉讼指向“盗版书训练模型”,索赔或达百亿美元级

AI训练数据的“原罪”问题迎来最强法律冲击。两度普利策奖得主约翰·卡雷鲁(John Carreyrou)携数十位知名作家,近日在美国加州北区地方法院发起集体诉讼,把OpenAI、谷歌、Meta、Anthropic、xAI与Perplexity AI六家头部公司列为共同被告,指称其长期用盗版书训练大模型,构成“故意版权侵权”。一旦被判成立,每部作品最高可获15万美元法定赔偿,总额或将冲至数十亿、甚至上百亿美元。

“双重盗版链条”被指成型

诉状指出,被告方被疑构建了完整的侵权闭环:  

1. 非法获取:从LibGen、Z-Library等“影子图书馆”批量下载数百万册受版权保护的图书(涵盖小说、纪实、学术类作品);  

2. 模型训练:将上述未经授权的内容喂入ChatGPT、Gemini、Claude等大模型;  

3. 商业变现:通过API订阅、企业服务、广告等方式盈利,却未向原作者支付任何报酬。

原告方表示:“作家的文字是AI能力的底座,却被当成免费的燃料。”这些作品不仅提供语言基础,也塑造模型的“知识厚度”和“叙述风格”,成为数十亿美元AI产业链背后的隐形支撑。

OpenAI成“被诉大户”,旧金山法院成AI版权案焦点

这并非AI公司首次陷入文字版权争议,但本案因原告权威性强、被告范围广、链条指控清晰而备受关注。根据南都数字经济治理研究中心的统计,OpenAI已遭遇至少14起版权诉讼,被视为行业“被诉大户”。而审理地——加州北区法院(旧金山)——目前受理的AI相关版权案已达25起,占全美同类案件的50%以上,其未来判决可能为AI训练数据的合法性提供全国性的关键参考。

故意侵权 vs. 合理使用:法律边界仍待落锤

被告公司此前多以“合理使用”(Fair Use)为抗辩理由,主张AI训练具有“转化性”,未损害原作市场。但此次原告将焦点锁定“数据来源的合法性”——若训练素材源自明显非法获取,“合理使用”抗辩或难站住脚。一旦法院认定存在“故意侵权”,不仅赔偿或显著提高,AI公司还可能被要求清洗模型、删除涉案数据,甚至被迫暂停相关服务。

行业震动:AI训练数据供应链或迎重塑

无论最终结果如何,此案已释放出强烈信号:  

– 头部AI公司正加速与出版社、作者协会等进行付费授权谈判(如OpenAI与美联社、Shutterstock的合作);  

– 开源模型社区面临更严合规要求,需核验训练集来源;  

– “影子图书馆”或将成为执法重点,采集与清洗工具链将被审视。

AIbase认为,这场由作家群体发起的“版权保卫战”,既是对创作者权益的坚守,也是对AI发展伦理的终极追问:技术进步是否必须以牺牲原创者为代价? 当法律开始为“数据的血汗”定价,AI的黄金时代,或将迎来一场深层的合规变革。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享