普利策得主牵头起诉六大AI巨头！集体诉讼指向“盗版书训练模型”，索赔或达百亿美元级-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

AI训练数据的“原罪”问题迎来最强法律冲击。两度普利策奖得主约翰·卡雷鲁（John Carreyrou）携数十位知名作家，近日在美国加州北区地方法院发起集体诉讼，把OpenAI、谷歌、Meta、Anthropic、xAI与Perplexity AI六家头部公司列为共同被告，指称其长期用盗版书训练大模型，构成“故意版权侵权”。一旦被判成立，每部作品最高可获15万美元法定赔偿，总额或将冲至数十亿、甚至上百亿美元。

“双重盗版链条”被指成型

诉状指出，被告方被疑构建了完整的侵权闭环:

1. 非法获取:从LibGen、Z-Library等“影子图书馆”批量下载数百万册受版权保护的图书（涵盖小说、纪实、学术类作品）;

2. 模型训练:将上述未经授权的内容喂入ChatGPT、Gemini、Claude等大模型;

3. 商业变现:通过API订阅、企业服务、广告等方式盈利，却未向原作者支付任何报酬。

原告方表示:“作家的文字是AI能力的底座，却被当成免费的燃料。”这些作品不仅提供语言基础，也塑造模型的“知识厚度”和“叙述风格”，成为数十亿美元AI产业链背后的隐形支撑。

OpenAI成“被诉大户”，旧金山法院成AI版权案焦点

这并非AI公司首次陷入文字版权争议，但本案因原告权威性强、被告范围广、链条指控清晰而备受关注。根据南都数字经济治理研究中心的统计，OpenAI已遭遇至少14起版权诉讼，被视为行业“被诉大户”。而审理地——加州北区法院（旧金山）——目前受理的AI相关版权案已达25起，占全美同类案件的50%以上，其未来判决可能为AI训练数据的合法性提供全国性的关键参考。

故意侵权 vs. 合理使用:法律边界仍待落锤

被告公司此前多以“合理使用”（Fair Use）为抗辩理由，主张AI训练具有“转化性”，未损害原作市场。但此次原告将焦点锁定“数据来源的合法性”——若训练素材源自明显非法获取，“合理使用”抗辩或难站住脚。一旦法院认定存在“故意侵权”，不仅赔偿或显著提高，AI公司还可能被要求清洗模型、删除涉案数据，甚至被迫暂停相关服务。

行业震动:AI训练数据供应链或迎重塑

无论最终结果如何，此案已释放出强烈信号:

– 头部AI公司正加速与出版社、作者协会等进行付费授权谈判（如OpenAI与美联社、Shutterstock的合作）;

– 开源模型社区面临更严合规要求，需核验训练集来源;

– “影子图书馆”或将成为执法重点，采集与清洗工具链将被审视。

AIbase认为，这场由作家群体发起的“版权保卫战”，既是对创作者权益的坚守，也是对AI发展伦理的终极追问:技术进步是否必须以牺牲原创者为代价? 当法律开始为“数据的血汗”定价，AI的黄金时代，或将迎来一场深层的合规变革。