检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome 、Edge、Firefox 。 X
2026年,生成式人工智能技术的快速增长将AI训练数据版权问题推至全球关注的中心。UNESCO发布《重塑创意政策》报告指出生成式AI正以超出当前政策响应速度的节奏冲击创意市场,预计到2028年将导致音乐创作者收入损失24%、视听创作者损失21%。AI训练数据的版权合规问题已从技术讨论演变为关乎数百万创作者生计的紧迫议题,需建立技术创新与版权保护的新平衡。美国和欧盟作为全球AI产业和创意产业的重要地区,先后发布官方立法提案或政策评估报告,试图明确AI时代的版权规则。
本文基于美国《版权标签和道德人工智能报告法案》(Copyright Labeling and Ethical AI Reporting Act)原文以及欧洲议会《关于版权和生成式人工智能的报告——机遇与挑战》(Report on copyright and generative artificial intelligence——opportunities and challenges)两份官方文件,客观梳理两大区域的最新监管政策与核心举措。
一、美国《版权标签和道德人工智能报告法案》
(一)法案基本背景
2026年2月10日,美国两党参议员联合提出《版权标签和道德人工智能报告法案》(简称CLEAR法案),该法案目前已提交参议院相关委员会审议。法案获得了美国音乐家联合会、美国作曲家、作家和出版商协会、美国导演工会、美国唱片业协会等超过30个创意行业组织的公开支持。
(二)通知与披露义务
CLEAR法案明确“生成式AI模型”指设计为使用人工智能生成文本、图像、音频或视频等表达性材料输出的计算机代码与数值组合。它要求任何使用训练数据集来训练或发布生成式人工智能模型的主体,必须向美国版权局提交一份通知。这份通知需要包含训练数据集中每一件受版权保护作品的足够详细摘要,如果该训练数据集在互联网上公开可用,还必须提供其统一资源定位符(URL)。值得注意的是,法案对“受版权保护作品”的定义仅限于已经在美国版权局正式注册的作品,这意味着大量虽受版权保护但未注册的内容不在披露要求范围内。在时间安排上,法案生效后首次商业使用或发布的模型,需在发布前三十天提交通知,而法案生效前已经使用或发布的现有模型,则需在版权局发布配套法规后的三十天内补交。
(三)数据库与执法处罚机制
CLEAR法案还要求美国版权局建立一个可公开访问的在线数据库,集中存放所有提交的通知。执法机制方面,法案赋予了版权所有者提起诉讼的权利。对于每一起未按要求提交通知的违规行为,法院可处以不低于五千美元的罚款,单个主体在单一年度内的罚款总额上限为二百五十万美元。此外,法院还可以发布禁令,强制违规方停止使用未披露的作品进行训练,直至其履行通知义务,并可判令违规方承担原告的律师费和诉讼费用。
二、欧盟《关于版权和生成式人工智能的报告》
(一)报告基本背景
2026年3月10日,欧洲议会全体会议表决通过了由法律事务委员会提交的《关于版权和生成式人工智能的报告》(文件编号A10-0019/2026),报告明确欧盟创意文化产业约占欧盟增加值的4%和国内生产总值的6.9%,吸纳约800万就业人口,必须在AI发展中得到充分保护。该报告属于欧洲议会的自主倡议报告,不具有法律约束力。
(二)训练数据透明度要求
在透明度方面,报告要求所有在欧盟市场提供通用人工智能模型的供应商,披露用于训练模型的受版权保护内容的逐项清单。该透明度义务同样适用于推理、检索增强生成和微调等后续使用场景。报告还要求人工智能爬虫向网站运营者标识自身身份,人工智能公司保留详细的爬虫活动记录。若人工智能供应商未完全履行透明度义务,则推定其使用了相关受版权保护作品进行训练或推理。若版权所有者胜诉,合理的法律费用和开支由人工智能供应商承担。报告重申欧盟版权法基于人类创作原则,完全由人工智能生成且不反映人类智力创造的内容不得获得版权保护,并且所有纯人工智能生成内容必须明确标注。
(三)标准化权利保留与报酬机制
在权利保留方面,报告呼吁由欧盟知识产权局(EUIPO)建立标准化、机器可读的权利保留系统。版权人可通过该系统声明其作品不得用于AI训练,AI开发者须自动识别并严格遵守。该机制旨在为权利持有者提供清晰、可操作的选择退出路径。关于报酬机制,报告正文强调创作者有权获得公平报酬,鼓励建立自愿集体许可协议,并探讨对过去未经授权使用版权作品的行为进行补偿。
(四)域外适用与市场准入
为确保欧盟法律在所有生成式AI服务方面的正确实施,并防止非欧盟提供商通过不合规获得不公平的竞争优势,无论人工智能模型的训练发生在哪个司法管辖区,只要该模型在欧盟市场上提供,就必须遵守欧盟版权法,不遵守规定的模型将被禁止在欧盟市场运营。
三、启示与建议
综合来看,美国与欧盟均将透明度作为底线要求,设立官方集中公示渠道以实现可查询可监督,设置罚款、禁令、律师费转移等威慑条款,平衡大规模数据使用与个体创作者收益。上海作为中国的科技创新中心和文化创意产业高地,正处于人工智能产业快速发展和创意产业持续繁荣的阶段。2024年到2025年,上海已布局数据产品知识产权登记存证体系,建立文化数据数纽中心,并有AI生成内容司法裁判实例,为构建可溯源的数据版权治理基础设施打下基础。在此基础上,一方面,上海应将AI训练数据来源追溯纳入现有登记体系,对数据产品的版权来源信息进行逐项披露与存证,并依托区块链技术构建跨境数据使用的版权合规审查与全链条存证机制,防范AI大模型和软件产品出海面临的版权合规风险。另一方面,上海可推动长三角区域数据知识产权登记的互认互通,建立跨省市统一规则,同时借助上海知识产权国际论坛、WIPO合作渠道及RCEP文化数据流通走廊,将规则向外输出,在AI版权治理全球规则制定的关键窗口期,把已有实践基础转化为真正的国际话语权。
参考文献:
1.Copyright Labeling and Ethical AI Reporting Act, S. 3813, 119th Cong. (2026)[EB/OL].[2026-02-10].[2026-04-15]https://www.congress.gov/bill/119th-congress/senate-bill/3813/text
2.NEWS: Sens. Schiff, Curtis introduce bipartisan bill to protect creators‘ work, implement transparency safeguards in AI model development[EB/OL].[2026-02-10].[2026-04-15]https://www.schiff.senate.gov/news/press-releases/news-sens-schiff-curtis-introduce-bipartisan-bill-to-protect-creators-work-implement-transparency-safeguards-in-ai-model-development/
3.Copyright and generative artificial intelligence – opportunities and challenges, European Parliament resolution P10_TA(2026)0066[EB/OL].[2026-03-10].[2026-04-15]https://www.europarl.europa.eu/doceo/document/TA-10-2026-0066_EN.htmlh