检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome 、Edge、Firefox 。 X
随着人工智能竞争进入新阶段,美国开始重新审视“数据”在人工智能发展中的基础性作用。2026年3月,美国创新基金会发布《数据危机:通过政府数据访问加速美国人工智能发展》的报告,提出通过扩大政府数据开放、强化“数据公地”,并探索建立“美国数据加速器”,以提升人工智能模型训练与应用能力。这一思路标志着美国人工智能政策正从过去以算力为核心的投入路径,逐步转向“算力与数据并重”的新阶段,试图通过释放政府掌握的大规模数据资源,为人工智能发展提供新的基础支撑。
一、从算力优先到数据驱动:美国人工智能政策重心的阶段性转变
在先进制造能力高度集中于特定地区的背景下,确保计算能力的可获得性被美国视为人工智能发展的前提条件,因此围绕芯片生产、出口管制及本土制造能力的政策投入持续加码。但随着技术条件与产业环境的变化,这一以算力为核心的政策逻辑正在发生调整。一方面,新型计算架构的发展以及美国国内对半导体产业的持续投资,使得算力供给的极端约束在中长期可能有所缓解;另一方面,人工智能模型在训练与优化过程中对高质量数据的依赖日益增强,数据逐渐成为新的关键瓶颈。
报告指出,当前大量易获取的公开数据已被主要人工智能实验室广泛使用,而剩余数据往往存在结构复杂、获取成本高等问题。同时,围绕知识产权的法律争议不断增加,也提升了企业在使用数据过程中的合规风险。在这一背景下,美国政策界开始将“数据获取与利用能力”视为影响人工智能竞争格局的重要变量,并提出将其纳入更广泛的政策工具体系之中,包括通过贸易安排获取关键数据资源,以及更系统地释放政府自身掌握的数据资产。这一转变意味着,美国人工智能政策正在从“保障算力基础”逐步迈向“强化数据供给能力”的新阶段。
二、数据加速器的功能设计:以政府数据为核心构建人工智能数据供给体系
围绕如何将数据资源转化为可用能力,报告提出建设“美国数据加速器”,其核心在于以政府数据为基础,通过制度与技术手段,使其能够被模型开发者直接用于训练与应用。从数据来源看,美国联邦政府长期积累了覆盖经济、产业、气候、科研等多个领域的大规模数据,其中相当一部分已具备法律上的公共属性,具备进一步开放的制度基础。然而,现有数据体系在实际使用中仍面临诸多障碍。尽管Data.gov平台已汇集超过36万条数据集,但这些数据在格式、标准和获取方式上存在较大差异,不同机构之间缺乏统一接口与结构规范,导致开发者在使用前需要进行大量清洗与整理工作。同时,一些对人工智能应用具有较高价值的数据,如监管成本、产业运行细节或部分医疗数据,仍未得到充分开放或结构化处理。这种“可获取但不可用”的状态,限制了数据在人工智能训练中的实际价值。
在此基础上,数据加速器被设计为连接政府与开发者的中介机制,其关键不在于简单增加数据数量,而在于提升数据的可用性与适配性。具体而言,一方面需要通过统一的数据标准、元数据体系和接口规范,使数据具备“面向人工智能就绪”的特征,从而降低使用门槛;另一方面,需要围绕高价值领域优先推动数据开放,例如地理与地质信息、经济与产业能力数据、监管成本以及医疗与药物试验数据等,这些数据既由政府集中掌握,又与现有的人工智能能力高度契合。在运行机制上,这一体系强调政府与企业之间的协同关系,即政府负责数据开放与制度授权,企业则承担数据整理、存储与分发等技术性工作,从而形成“公共数据供给加市场化能力支撑”的模式。同时,现有法律体系已为这一过程提供基础支撑,例如2018年相关法案确立了“数据默认开放”的原则,并要求各机构制定数据战略,为后续数据整合与标准化提供制度依据。
三、对人工智能竞争格局的意义与潜在约束
从更宏观的视角看,数据加速器的提出,反映出人工智能竞争逻辑正在从“算力竞争”向“数据与应用能力竞争”延伸。在技术层面,稳定且高质量的数据供给将直接影响模型性能及其在特定领域的适配能力。通过开放政府数据,可以降低企业获取关键数据的成本,使人工智能模型更容易在产业、医疗或政策分析等领域实现应用落地。在产业层面,这一机制可能对不同类型企业产生差异化影响。相较于大型科技公司已经具备的数据获取能力,数据加速器更有可能为中小企业和初创公司提供新的发展空间,从而在一定程度上缓解数据资源集中带来的竞争壁垒,促进技术创新生态的多元化发展。
在国际层面,数据供给能力也正成为国家间人工智能竞争的重要因素。报告指出,中国已通过政府主导与产业协同的方式,在公共数据整合与开放方面持续投入,为本土人工智能发展提供支持。在这一背景下,美国若不能提升数据资源的可获取性与可用性,可能在未来竞争中面临新的制约。与此同时,这一构想在推进过程中也面临现实约束。首先,数据开放本身难以完全限制外部使用,其潜在外溢效应需要在政策设计中予以考量;其次,多部门参与的数据整合与标准化过程复杂度较高,可能影响推进效率;再次,在推动数据开放的同时,如何兼顾隐私保护与知识产权约束,仍需进一步完善制度安排。
总体来看,美国提出“数据加速器”的政策构想,体现了其在人工智能发展路径上的阶段性调整,即在继续保障算力基础的同时,更加重视数据这一关键要素的供给与利用。通过系统性开放和重构政府数据资源,并推动其向可用于人工智能训练的形态转化,有望在一定程度上缓解当前的数据瓶颈,并为技术创新与产业发展提供新的支撑。未来,这一机制的实际效果,将取决于数据标准化程度、跨机构协同能力以及与产业需求之间的匹配水平。
参考文献:
[1]Levine J. Building the U.S. Data Accelerator[EB/OL]. [2026-04-02]. https://www.thefai.org/posts/building-the-u-s-data-accelerator.
[2]Levine J. The data crunch: accelerating American AI through government data access[EB/OL]. [2026-03-24]. https://www.thefai.org/posts/the-data-crunch-accelerating-american-ai-through-government-data-access.