检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome EdgeFirefox X

首页科技前沿与新兴产业新一代信息技术电子信息

美国能源部、英伟达和甲骨文共建美国最大的AI超级计算机

供稿人:陆颖供稿时间:2025-11-14 16:50:10关键词:PPP模式,能源部,超级计算机

1028,美国能源部(DOE阿贡国家实验室与英伟达、甲骨文宣布达成合作,在伊利诺伊州阿贡建设能源部体系中规模最大的人工智能超级计算机,并同步为科研人员提供即刻可用的云端算力支持。这一项目被视为AI驱动科学”的基础设施升级,旨在把大模型训练与推理引入开放科学主战场。

一、项目概况与组织方式

依据能源部与英伟达的公告,此次合作将在阿贡国家实验室部署两套新系统:SolsticeEquinox。前者规划配置十万块英伟达Blackwell GPU,将成为能源部实验室体系中规模最大的AI超算;后者规划一万块Blackwell GPU,作为先行节点推进建设,预计2026年上半年可用。

根据公开技术资料,SolsticeEquinox通过英伟达网络互联,面向AI工作负载的综合算力标称可达2,200 exaflops,并将以Megatron-Core开发训练框架与TensorRT推理软件栈为主线,支持“智能体化科研流程”的开发与运行。这一体系的核心,是以大规模并行GPU与高速互连构建统一的算力底座,从而承载超大规模模型的训练、微调与推理,支撑复杂科学问题的连续迭代。

在算力组织方式上,美国能源部采用“在建本地超算+即时云端资源”的组合:阿贡本地集群承担高强度长期训练与紧耦合的科学计算,甲骨文以云资源的方式,立即向能源部研究团队开放基于HopperBlackwellAI计算能力,形成“先上云、后落地”的过渡路径,缩短科研项目从设想到落地的等待周期。

此次合作遵循能源部的新型政企协作框架:以共享投资与共享算力为原则,快速把前沿硬件、软件栈与科研任务对接,缩短科研从构想到验证的路径。从任务分工看,政府部门负责提出战略方向、统筹国家实验室体系与科研场景;企业提供高性能GPU、网络、软件生态与云端补位;国家实验室负责任务编排、作业调度、数据管理与科研产出评价,逐步沉淀复用性强的工具链与数据资产。

二、科学用途与开放生态

两套系统将服务于跨学科开放科学:其一,依托阿贡先进光源等大科学装置,推动实验数据的实时分析、结构解析与自动化标注,缩短从数据到结论的整体链路;其二,在材料与化学领域,面向生成式设计与多尺度模拟提供“模型—实验—反馈”的闭环;其三,在清洁能源与电网韧性、生命科学等方向,通过多模态数据融合与推理能力,提升复杂系统的预测与决策水平。

从体系分工看,新建AI系统将与阿贡既有的“极级”通用超算形成互补:后者侧重传统数值模拟与HPC工作流,前者承担大模型训练与推理的密集任务,两类平台在开放科学框架下协同运行,有望把“生成式设计+数值验证”的组合推进到更高规模。Toms HardwareIT ProHPC ware等多家行业媒体的跟踪报道还显示项目是DOE更大范围AI超算布局的重要节点后续还将有不同负载侧重与供应链组合的系统上线,以实现任务谱系更广的覆盖

三、影响与展望

1. 对国家级算力主干网的补强。阿贡两套系统与橡树岭、洛斯阿拉莫斯正在建设的AI与通用超算共同构成分布式高性能计算网络,既提升区域冗余与资源调度能力,也为更严格的数据主权与科研可用性提供基础。

2. 对产业生态与供应链的牵引。十万级Blackwell集群对GPU供给、网络与存储系统、软件栈优化、数据中心能源与冷却方案都提出高标准,甲骨文的云端资源与英伟达的软件生态在其中扮演关键角色,这一“科研牵引型”大项目将为后续政企共建提供成熟范式。

3. 对开放科学的治理挑战。面向开放科学的大模型平台,必须兼顾数据安全、访问公平、可重复验证与成果共享。能源部强调,系统将服务全国科研共同体,并与多种实验设施形成数据通道这意味着需要在访问策略、配额分配、模型发布与评审机制上制定清晰规则,避免算力集中带来的机会不均。

4. 对国际竞争格局的影响。美国正把AI原生”的科研算力作为新一轮科技战略的关键抓手,并通过多点布局扩展国家实验室网络的AI算力结构,意在在前沿模型与科学应用上保持长期领先。随着多台系统未来按计划交付,开放科学的效率与产出有望持续提升。 

参考文献:

[1]Energy Department Announces New Partnership with NVIDIA and Oracle to Build Largest DOE AI Supercomputer[EB/OL].(2025-10-28). https://www.energy.gov/articles/energy-department-announces-new-partnership-nvidia-and-oracle-build-largest-doe-ai.

[2]Neetika Walter.NVIDIA, Oracle to build Americas biggest AI supercomputer using 100K Blackwell GPUs[EB/OL].(2025-10-28). https://interestingengineering.com/energy/nvidia-oracle-doe-ai-supercomputer-nvqlink-palantir.

[3]Jaime Hampton.Nvidia, DOE Announce Seven New AI Supercomputers Built for Science[EB/OL].(2025-10-28). https://www.hpcwire.com/2025/10/28/nvidia-doe-announce-seven-new-ai-supercomputers-built-for-science/.

[4]Anton Shilov.Nvidia and partners to build seven AI supercomputers for the U.S. gov't with over 100,000 Blackwell GPUs combined performance of 2,200 ExaFLOPS of compute[EB/OL].(2025-10-29). https://www.tomshardware.com/tech-industry/supercomputers/nvidia-and-partners-to-build-seven-ai-supercomputers-for-the-u-s-govt-with-over-100-000-blackwell-gpus-combined-performance-of-2-200-exaflops-of-compute.

[5]Jane McCallion.US Department of Energys supercomputer shopping spree continues with Solstice and Equinox[EB/OL].(2025-10-29).

https://www.itpro.com/technology/us-department-of-energys-supercomputer-shopping-spree-continues-with-solstice-and-equinox.