日本《AI for Science路线图》说了些什么

以 ChatGPT 为代表的新一轮人工智能技术浪潮正推动人类社会全面变革，科学研究范式正加速转换，一场人工智能驱动的科学研究（AI for Science，AI4S）革命正在到来。在国内，为了贯彻落实《新一代人工智能发展规划》，科学技术部会同国家自然科学基金委员会于2023年启动了“人工智能驱动的科学研究”专项部署工作，引起广泛关注。邻国日本也于近年开启了在AI for Science领域的一系列新动向，其中就包括于2024年5月公布的《AI for Science路线图》（下文简称“《路线图》”）。作为一份指南性文件，《路线图》到底说了些什么？本文围绕这份文件进行介绍。

一、《AI for Science路线图》的理念

2024年5月，HPCI（高性能计算机基础设施）计划推进委员会公布了日本的《AI for Science路线图》。《路线图》认为，AI for Science正在以前所未有的速度发展，并有可能开创科学研究的新范式，进而从根本上改变处理更复杂科学问题的方法。因此，有必要制定AI for Science路线图，以明确日本当前的AI for Science发展的方向和面临的技术挑战，并加强未来AI for Science领域的研究和国际合作。

二、AI for Science重点应用方向

《路线图》确定了11个科学研究领域作为AI for Science的重点应用方向，具体内容见表1。

表1 《AI for Science路线图》设定的11个科学领域和具体应用

科学领域	具体应用
纳米科学和仪器	·材料研究中的AI应用：使用机器学习势的分子动力学 ·数据科学与光谱实验融合构建材料分析流程 ·使用量子计算机构建机器学习模型并扩展到物理性能计算 ·AI在新材料开发中的应用 ·用数据驱动方法分析强关联量子物质 ·量子多体问题的数值解法及其应用 ·实验数据集成分析 ·AI在非晶态物质动力学中的应用——从图神经网络到生成建模
能源和资源	·基于模拟和信息学的材料设计和探索 ·利用机器学习势对分子系统进行高精度分子动力学模拟 ·用人工神经网络描述量子多体系统 ·通过高性能计算和AI加速量子化学研究
基本粒子和原子核	·核多体系统的结构和反应计算 ·用人工神经网络分析量子多体问题
生命科学	·基于机器学习的生物大分子立体结构分析 ·使用机器学习搜索生物大分子反应坐标 ·通过嵌入“世界模型”的强化学习进行医学和生物学研究 ·碎片分子轨道计算与AI和数据科学 ·使用差分模拟的分子动力学力场的优化 ·使用AI的粗粒度分子动力学力场开发 ·机器学习势的发展与展望 ·描述生物大分子动力学的降维 ·扩展变分自编码器的蛋白质动力学表达学习
药物研发和医疗	·医学中的大语言模型和多模态基础模型 ·蛋白质大语言模型的现状与挑战 ·处理基因组序列的大语言模型 ·用于基因表达数据的基础模型 ·基于生成模型的分子设计 ·化合物—蛋白质相互作用预测 ·蛋白质立体结构预测 ·AI在医疗中的可解释性和介入模拟
设计与制造	·基于卷积自编码器的流动特征提取及其应用 ·3D生成式AI在结构优化设计中的应用
社会科学	具体内容尚未确定
脑科学与人工智能	·神经科学、人工智能技术和大规模神经回路模拟
地震与海啸	·物理信息神经网络在地震反问题中的应用实例及其对大规模问题的适用性 ·利用数据科学方法加速大规模模拟
气象与气候	·代理模型：人工智能在云微物理过程中的应用、引力波参数化、纳维尔—斯托克斯方程湍流的RC学习 ·气象应用：全球气候模型模拟、AI数据同化与融合、降水临近预报、储备计算和天气预报应用 ·用于数据集和模型共享、交叉比较和分析的平台
宇宙和天文	·基于深度学习的高能天体现象研究 ·从天文大数据中提取宇宙学信息

三、应用案例

《路线图》展示了AI在科学研究中的广泛应用，并强调了AI技术在推动科学发展和创新方面的潜力。《路线图》列举了多项应用案例

案例1：量子化学与新材料的发现。量子化学通过模拟电子行为和化学键性质，揭示了微观化学现象。利用AI分析量子化学计算产生的大数据，有助于发现高性能和高功能的新分子与材料。AI可以加速量子化学软件的开发和实验过程，通过整合现有文献和数据，提出创新的理论框架和代码，从而缩短开发时间。

案例2：结构优化与3D形状生成。结构优化是决定设计变量（如形状、尺寸和材料）以最大化或最小化目标函数的过程。AI的应用可以加速这一过程，特别是在汽车、航空航天和建筑等领域。3D生成AI技术的发展，特别是结合大规模语言模型，使得非专业人士也能进行力学上正确的3D生成。

案例3：流体动力学与特征提取。流体动力学的模式分解技术有助于理解复杂的流体现象。AI可以加速3D形状的模式分解，这对于控制流动阻力、降低噪音、促进热传递和混合等具有重要意义。在汽车设计中，AI可以帮助再现高雷诺数的湍流，这对于实现能源效率和环境友好的生产至关重要。

案例4：药物发现与分子动力学。分子动力学计算是材料开发中的重要工具，但结果依赖于力场参数。AI可以提高分子动力学计算的精度，从而加速新材料的开发。通过学习高精度的计算结果，AI可以构建更精确的力场，推动企业在材料开发中的创新。

四、下一代计算基础设施所需的AI性能

《路线图》讨论了下一代计算基础设施所需的AI性能，尤其是针对2030年的预测和规划。随着AI技术的发展，对于高性能计算的需求不断增加，特别是在处理和训练大型语言模型（LLM）方面。

（一）2030年所需的有效AI性能的估计

这一估计基于在40至80天内完成大型语言模型预训练的目标。目标模型是一个具有1.59万亿参数的基于Transformer的模型。预训练该模型所需的计算量估计为3×10^26 FLOPs。考虑到实际AI操作相对于理论AI性能的计算效率约为40%，可以推算出，为了在80天内完成预训练，所需的理论AI性能为108.5 EFLOPS，有效AI性能为43.4 EFLOPS；若要在40天内完成，则所需的理论AI性能为217.0 EFLOPS，有效AI性能为86.8 EFLOPS。因此，为下一代计算基础设施的发展设定的目标有效AI性能应在43.4至86.8 EFLOPS或更高。

（二）2030年LLM参数数量的预测

基于以往模型的计算趋势，预计到2028年、2029年和2030年，训练LLM所需的计算量将分别达到9.0×10^25、1.5×10^26和3.0×10^26 FLOPs。相应地，预计这些年份的LLM参数数量将分别为0.85万亿、1.10万亿和1.59万亿。

（三）硬件和软件的挑战

为了满足这些需求，未来的AI硬件和软件需要进一步优化，以提高计算效率。预计未来的AI硬件和软件将能够实现约40%的计算效率，这对于大规模模型和大规模执行至关重要。

五、AI治理

随着AI技术的发展，其潜在的风险和挑战也日益凸显。因此，《路线图》认为，建立有效的AI治理机制变得至关重要。

《路线图》指出，AI技术的进步虽然带来了巨大的好处，但也可能导致幻觉、隐私侵犯、安全风险等新问题。有效的AI治理框架需要确保AI技术的伦理使用，评估和管理AI带来的风险，并确保AI技术的透明度和责任。然而，随着AI技术的快速发展，制定和实施这些治理机制变得困难，并带来了若干挑战。首先，国际上对AI的规范和标准尚未统一。美国、欧盟、中国和日本等国家和地区都在积极探讨AI治理，并提出了各自的政策和法规。AI治理的另一个重要问题涉及确保AI在数据使用中的公平性和平等性。AI系统可能会继承数据中的偏见，导致不公平的判断和歧视。为了避免这些问题，需要使用多样化的数据集和AI方法，并从多个角度进行评估。此外，通过教育和宣传活动提高整个社会对AI技术的理解，并加强AI人才的培养也是至关重要的。总之，AI治理旨在在管理AI潜在风险和最大化AI对科学贡献之间找到平衡。这需要研究人员、技术专家、政策制定者、法律专家和伦理学家之间的广泛合作，科学家需要理解并管理AI的潜在风险，同时最大化AI在科学研究中的应用。

六、日本在AI for Science领域加强与美国的合作

《路线图》中提及的在AI for Science领域加强国际合作，虽然并未明确是具体与哪些国家，但实际上日本已经与美国在该领域开展了较深入的合作。2024年4月，日本文部科学省与美国能源部签署《高性能计算机及人工智能相关安排》协议，其中就包括在AI for Science领域合作的相关内容。同时，日本理化学研究所（RIKEN）与美国能源部下属的阿贡国家实验室（ANL）签署了有关AI for Science的谅解备忘录，从情报、数据、人员、设备、知识分享等多个维度开展合作。对此，日本的年度科技创新战略《综合创新战略2024》明确要求，在谅解备忘录的基础上加强日美合作，加快开发和共享世界领先的面向科学研究的人工智能基础模型。

参考文献

1.王飞跃,缪青海,张军平,郑文博,丁文文.探讨 AI for Science 的影响与意义：现状与展望[J]智能科学与技术学报,2023,5(1):1-6.

2.第58回 HPCI計画推進委員会. AI for Science ロードマップについて [EB/OL].(2024-4-31)[2024-9-25].https://gkz781swok1ivzu2.www.mext.go.jp/content/20240418-mxt-jyohoka01-000035257_02.pdf.

3.文部科学省. 米国エネルギー省（DOE）との間で「ハイパフォーマンス・コンピューティング及びAIに関する事業取決め」に署名. [EB/OL].(2024-4-7)[2024-9-25].https://www.mext.go.jp/b_menu/activity/detail/2024/20240409_4.html