检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome 、Edge、Firefox 。 X
人工智能(AI)作为一个广泛的领域,其应用日益渗透到包括科学研究在内的各个领域。近年来,深度学习和自然语言处理(NLP)的显著进步催生了功能强大的大语言模型(LLMs)的出现。这些模型以其庞大的参数量和基于海量训练数据理解、生成和处理类人文本的能力为特征。值得关注的LLM示例包括GPT系列、BERT、PaLM和LaMDA等。本次综述将探讨LLM在不同科学学科、假设生成与验证、文献综述与数据分析中的应用,并讨论与其使用相关的挑战和未来方向。
LLM正被广泛应用于分析和解释复杂的生物数据。在基因组学方面,LLM的应用包括预测DNA突变的影响、识别调控区域、预测DNA-蛋白质相互作用以及分析DNA甲基化。DNABERT和GPN等模型便是例证。在转录组学中,LLM被用于RNA结构预测、剪接预测、识别非编码RNA、预测RNA-蛋白质和RNA-RNA相互作用以及分析RNA修饰。RNABERT和RNA-FM是相关模型。在蛋白质组学方面,应用包括预测蛋白质结构、生成新的蛋白质序列、预测蛋白质功能以及分析翻译后修饰。MSA Transformer和ProtTrans是示例。在药物发现领域,LLM有助于预测类药分子性质、生成新的药物分子、预测药物-靶点相互作用以及分析协同药物效应。SMILES-BERT和MolGPT是示例。在单细胞分析中,LLM被用于细胞聚类、细胞类型注释、预测细胞对药物的反应、推断基因网络以及整合多组学数据。scBERT和scGPT是相关模型[1]。此外,LLM还可以通过总结复杂的生物学概念、解释不熟悉的术语以及简化编码任务来帮助生物学家。
LLM在生物学和生物信息学中的多样化应用展示了它们处理不同类型生物序列和数据的多功能性。这预示着使用基于语言的模型来理解和操作生物信息的根本转变,将DNA、RNA和蛋白质序列视为具有潜在语法结构的语言。
LLM在分子设计、性质预测、合成路径优化以及新材料发现中发挥着重要作用。它们被用于性质导向的分子生成和从头化学。LLM可以根据分子的SMILES字符串预测其化学性质。Mol-BERT和MoLFormer等模型被用于此目的。具有编码器-解码器架构的LLM被用于预测化学反应结果和生成合成路径。分子转化器是一个例子。LLaMat等专用模型已为材料科学开发,擅长材料特定的NLP和晶体结构生成。LLM也正在成为自主代理的核心,这些代理可以在自动化实验室中执行化学任务。ChemCrow和Coscientist是示例[2]。
LLM在化学和材料科学中的应用突显了它们理解和操作分子和反应符号表示的能力。这表明LLM可以超越处理自然语言,学习化学的“语言”,从而帮助设计和合成新的分子和材料。
LLM在分析物理现象、生成假设和辅助数据分析方面的作用正在显现。大型物理模型(LPM)正在开发中,专门为物理研究定制,能够分析公式、关系和实验数据。LLM可以帮助生成假设、为复杂问题提供新的方法并激发创造力,充当研究人员的“人工缪斯”。它们还可以帮助设计实验、解释数据和生成用于数据分析的代码。LLM正被探索用于通过提示工程自动评分物理问题[3]。
虽然LLM在生物学、化学和材料科学中的应用更为成熟,但它们在物理学研究中的作用仍在发展。然而,LPM等专用模型的开发及其在物理学的理论和实验方面辅助的潜力表明,人们越来越认识到LLM在该领域的价值。
表1 大语言模型在不同科学学科中的应用
科学学科 | 主要应用 | 示例模型/技术 |
生物学与生物信息学 | 基因组学分析、蛋白质结构预测、药物发现、单细胞分析等 | DNABERT, ProtTrans,cBERT等 |
化学与材料科学 | 分子设计、性质预测、合成路径优化、新材料发现等 | Mol-BERT, 分子转化器, LLaMat, ChemCrow等 |
物理学 | 假设生成、实验设计辅助、数据分析、物理问题自动评分等 | 大型物理模型(LPM) |
LLM具有通过处理和合成大量科学文本来生成新颖科学假设的潜力。LLM可以充当头脑风暴伙伴,为复杂问题提供新颖的方法并激发创造力。SciMON等框架利用LLM生成基于现有文献的创新假设。具有不同角色的LLM(例如,研究员、审稿人、主持人)的多代理系统正在被探索,以模仿人类科学推理进行假设生成。检索增强生成(RAG)和思维链(CoT)提示等技术被用于提高LLM生成假设的质量和推理能力[4]。
LLM生成的假设及其实验验证的例子表明,LLM有潜力为科学发现做出贡献。利用Gemini.0构建的AI协同科学家系统已被用于生成急性髓系白血病(AML)药物再利用和肝纤维化靶点发现方面的新假设,并且AML的研究结果已通过实验验证。GPT-4已被用于假设治疗乳腺癌的FDA批准的非癌症药物的新组合,并且几种协同组合已通过实验室验证。LLM甚至独立地“重新发现”了现有的科学突破,例如抗菌素耐药性的机制。
LLM生成新颖且经过实验验证的科学假设的能力表明,这些模型在增强和加速科学发现过程方面具有巨大的潜力。虽然LLM有时可能会产生“幻觉”(即事实不正确的输出),但在假设生成方面,这些可以被视为可以进行实验检验的新颖想法,从而可能导致新的发现。开发用于指导和改进基于LLM的假设生成框架和技术(例如RAG、CoT和多代理系统)对于提高生成假设的质量和可靠性至关重要。这些方法旨在使LLM基于现有知识,并模仿人类科学推理的协作和迭代性质。
LLM可以帮助预筛选系统综述的文献,从而显著减少这项劳动密集型过程中的人工工作量。LLM可以根据标题和摘要有效地选择相关文献,与人工选择的文章高度重叠。它们可以显著减少一位审稿人在标题和摘要筛选阶段的工作量。AURORA等框架正在开发中,以自动化整个文献综述过程,包括总结论文和生成报告[5]。
LLM还可用于分析科学数据、提取见解以及生成用于分析和可视化的代码。LLM是减少学术界语言编辑和校对所花费时间的强大工具,可以提高草稿的可读性。它们可以帮助集思广益、组织想法,甚至生成研究论文的标题。LLM可用于搜索文献和生成文献综述。它们还可以帮助处理各种数据分析方面的问题,包括生成用于创建图表和可视化结果的代码,支持Stata、R和Python等编程语言。然而,生成的代码需要验证。LLM可以通过提取非结构化文本数据(例如研究论文)中的见解来增强数据分析。它们可以通过理解用户查询背后的意图并提供更相关的结果来改善搜索体验。
LLM有潜力通过自动化文章筛选、总结和合成等方面来彻底改变科学文献综述过程。这可以显著减少研究人员跟上海量增长的科学文献所需的时间和精力,从而使他们能够专注于更具创造性和分析性的任务。虽然LLM可以协助数据分析甚至生成代码,但仍然需要人工验证和监督。LLM可能会生成不正确的代码或错误地解释复杂的科学数据,这突显了研究人员保持其分析技能并批判性地评估这些模型输出的重要性。
在科学研究中,准确性和生成“幻觉”(即事实不正确的信息)的问题尤为突出,LLM在这方面面临挑战,因为科学研究需要严谨性和可验证性。LLM中存在的偏见是一个需要解决的问题,这些偏见可能源于训练数据,从而可能扭曲研究重点并低估某些观点。可解释性也是一个局限性,因为大多数LLM都像“黑盒子”一样运作,难以理解其输出背后的推理,这可能会削弱信任并使科学研究中的验证复杂化。训练和部署大型LLM需要巨大的计算成本,这可能会限制许多机构的可访问性并引起对环境可持续性的担忧。为了有效地理解和解决特定领域的科学任务,需要对LLM进行领域特定的调整。通用LLM可能不具备特定科学学科所需的专业知识。与LLM在科学研究中的使用相关的伦理问题也需要考虑,包括作者身份、责任以及潜在的误导性假设的滥用。隐私和保密是关键问题,尤其是在处理敏感研究数据时[6]。
LLM在AI for Science中的挑战和局限性突显了负责任地开发和部署这些技术的必要性。虽然LLM提供了巨大的潜力,但其固有的局限性,例如不准确和偏见的风险,必须加以解决,以确保其在科学研究中值得信赖和合乎伦理的使用。对LLM进行领域特定调整的需求表明,通用模型可能不足以满足所有科学应用。在特定科学文献和数据上开发和微调LLM对于提高其在专业研究领域的性能和可靠性至关重要[7]。
基础模型被定义为具有广泛能力的大规模AI模型,可以适应科学发现中的多项下游任务。科学基础模型(SciFM)基于大规模生成式AI模型。它们有潜力成为跨学科合作的综合平台,整合不同的知识领域。科学基础模型与AI代理中心(SciFM.ai)等机构旨在促进该领域的研究和开发。DARPA的FoundSci计划侧重于开发AI代理作为能够进行怀疑性学习和推理以帮助人类科学家的“自主科学家”。美国国家科学院也在探索基础模型的最新进展及其在科学发现中的机遇。大型物理模型(LPM)可以被认为是为物理学量身定制的一种科学基础模型[8]。
科学基础模型概念的出现标志着创建专门为科学研究设计的AI系统的趋势,超越了通用LLM。这些模型旨在更深入地融入科学原理和知识,从而可能更可靠和更有影响力地为科学发现做出贡献。
LLM促进了不同科学学科之间的合作和知识转移,这对于应对复杂的全球挑战至关重要。LLM可以通过使复杂概念更容易理解,帮助降低知识转移的成本并弥合不同研究领域之间的差距。它们可以帮助来自不同学科的研究人员理解和采用其他领域常用的技术和工具。LLM还可以帮助进行分析,例如开发用于复杂分析的代码,从而使来自不同背景的研究人员更容易获得先进技术。研究表明,在ChatGPT等模型发布后,各个领域与LLM相关的研究中,跨学科合作的趋势日益增长。LLM可以作为沟通的共同基础,提供即时反馈和解释,从而促进更顺畅的合作[9]。
LLM有潜力通过打破知识孤岛并促进来自不同领域的研究人员之间的沟通和协作,从而显著增强跨学科科学研究。这可以促进不同观点和方法的整合,从而促进创新并加速解决复杂、多方面的科学问题。
该领域的新兴趋势和潜在的未来研究方向值得关注。未来的研究可能侧重于开发更高效的科学文本LLM,以解决计算成本问题。改进对LLM在复杂科学问题解决任务中的评估,包括长文本理解和多模态推理,至关重要。解决与LLM在科学中的使用相关的伦理挑战,例如偏见、责任和潜在的滥用,将是关键的重点。开发将LLM与计算工具和实验设置更好集成的方法,以创建更自主的AI科学家,这是一个令人兴奋的方向。探索能够处理和理解来自文本以外的各种数据类型(例如图像、视频和实验数据)的信息的多模态LLM的潜力将非常重要。还需要进一步研究改进基于LLM的假设生成模型架构、整合多模态能力以及建立健全的伦理框架[10]。
[1] Center for Security and Emerging Technology. What Are Generative AI, Large Language Models, and Foundation Models?[EB/OL]. [2025-04]. https://cset.georgetown.edu/article/what-are-generative-ai-large-language-models-and-foundation-models/.
[2] PMC. AI-Based Modeling: Techniques, Applications and Research Issues Towards Automation, Intelligent and Smart Systems[EB/OL]. [2025-04]. https://pmc.ncbi.nlm.nih.gov/articles/PMC8830986/.
[3] ResearchGate. An overview of large AI models and their applications[EB/OL]. [2025-04]. https://www.researchgate.net/publication/387458379_An_overview_of_large_AI_models_and_their_applications.
[4] PubMed Central. Revolutionizing Health Care: The Transformative Impact of Large Language Models in Medicine[EB/OL]. [2025-04]. https://pmc.ncbi.nlm.nih.gov/articles/PMC11751657/.
[5] ResearchGate. An Interdisciplinary Exploration of Concept and Application of Large Language Models[EB/OL]. [2025-04]. https://www.researchgate.net/publication/388357346_An_Interdisciplinary_Exploration_of_Concept_and_Application_of_Large_Language_Models.
[6] arXiv. The Impact of Large Language Models on Scientific Discovery: a Preliminary Study using GPT-4[EB/OL]. [2025-04]. https://arxiv.org/abs/2311.07361.
[7] arXiv. Challenges and Applications of Large Language Models[EB/OL]. [2025-04]. https://arxiv.org/abs/2307.10169.
[8] PubMed. Large language models for science and medicine[EB/OL]. [2025-04]. https://pubmed.ncbi.nlm.nih.gov/38381530/.
[9] PMC. Editorial – These of Large Language Models in Science: Opportunities and Challenges[EB/OL]. [2025-04]. https://pmc.ncbi.nlm.nih.gov/articles/PMC10485814/.
[10] IBM. What Are Large Language Models (LLMs)?[EB/OL]. [2025-04]. https://www.ibm.com/think/topics/large-language-models.