检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome 、Edge、Firefox 。 X
在人工智能不断突破边界的当下,一种全新的科研模式正在悄然崛起:AI不仅仅是工具,更试图成为“科学家”的一员。位于美国旧金山的非营利机构FutureHouse正在将这一设想变为现实。通过开发一整套面向生命科学的AI系统,FutureHouse希望建构“AI科学家”的原型,推动科研流程从“人主AI辅”转向“人机共创”。近期,其AI系统Robin在仅2.5个月内成功识别出干性年龄相关性黄斑变性潜在疗法的案例,成为这一趋势的里程碑事件。
FutureHouse背景概况
FutureHouse成立于2023年,由前谷歌CEO埃里克·施密特支持,其联合创始人兼首席执行官Sam Rodriques曾是神经科技领域的研究者。团队成员既有来自麻省理工学院的生物信息学专家,也有在深度学习框架与科研自动化方面具有工程背景的技术人员。与许多试图进入AI for Science领域的初创企业不同,FutureHouse以非营利方式运营,核心目标并非商业变现,而是推动科学发现的系统性变革。
其愿景是在未来十年内构建能够像科学家一样提出假设、设计实验、分析数据的AI系统,助力解决诸如疾病治疗、材料设计、气候变化等重大问题。Sam Rodriques在接受采访时指出,未来的AI科学家并不只是一个会写代码、查资料的高级搜索引擎,而应该具备科学思维的全过程能力——包括广泛的文献检索、科学假设的提出、实验方案设计、数据分析解读,乃至科研论文初稿的生成。这一愿景的提出,为科学研究模式带来了革命性的设想。
构建科研流程的AI协同体
在Robin系统面世之前,FutureHouse已构建起一系列用于科研特定环节的智能体(AI Agent)工具:Crow能够快速检索海量文献并总结研究共识;Falcon可以深入探索科学数据库并生成结构化综述报告;Owl用于追踪领域最新进展;Phoenix专注于化学合成与实验规划;Finch则聚焦复杂数据分析,尤其擅长处理RNA测序、流式细胞术等生命科学领域的数据。
这些智能体在各自领域内展现出较强的自动化能力,但在实际科研中,“点状能力”往往难以替代“流程整合”。Robin正是在这一需求下应运而生。它不仅将多个智能体组合为一体,还引入了迭代优化机制,使整个科研流程实现闭环:从生成假设,到设计实验,继而获取数据并解读结果,再反哺下一轮假设。这种动态、递进式的模型,被Sam Rodriques形象地比喻为“一个可以在现实中工作的自动科研循环系统”。
Robin只用2.5个月发现疑难眼疾治疗新路径
为验证Robin的综合科研能力,FutureHouse选择了一个具有高度现实意义但尚无有效治疗方法的复杂疾病——干性年龄相关性黄斑变性(dAMD)作为试点场景。在美国,dAMD是导致老年人失明的主要原因之一,患者总数超过200万人。由于其发病机制复杂、治疗靶点不明确,长期以来缺乏有效的药物治疗方案。
Robin的工作起始于由人类研究者提供一个目标病种关键词,随后其自动启动多个智能体完成以下环节:首先,Crow和Falcon联合检索了超过400篇文献,并围绕视网膜色素上皮(RPE)细胞的功能提出初步假设;接着,Robin选择“增强RPE吞噬作用”为切入点,制定实验策略,并建议通过流式细胞术进行药效验证。
之后,Robin通过文献综述筛选出30种现有药物,利用大语言模型构建的“药物锦标赛”机制对其进行排序,最终选出前五位进行实验测试。实验结果显示,ROCK抑制剂Y-27632能显著增强RPE细胞的吞噬作用,这一发现得到了后续RNA测序数据分析的支持。Finch对实验数据进行分析,发现该药物可上调ABCA1基因的表达——而ABCA1正是与黄斑变性密切相关的关键转运蛋白。
在此基础上,Robin又迭代提出新的候选药物组合,并进一步筛选出效果优于Y-27632的利舒地尔(ripasudil)。这是一种已在日本获批治疗青光眼的药物,其在RPE吞噬实验中展现出7.5倍于对照组的提升效果。尽管仍需临床验证,但这一发现展示了Robin系统从文献到数据、从假设到验证的完整科研链条。
面向AI科学家的关键挑战与未来演进
尽管Robin的成功初步展示了AI系统自动开展科学研究的潜力,但其仍远非真正意义上的“AI科学家”。Sam Rodriques坦承,目前的大模型在处理开放性问题空间、识别实验可行性、输出操作性强的实验步骤方面仍存在显著短板。
首先,现有语言模型擅长生成增量式假设,却缺乏在“假设空间”中进行逆向思维和范式突破的能力。FutureHouse因此计划开发具备反事实推理能力的“反向模型”,以支持更具创新性的科学发现。
其次,AI系统目前尚不能评估实验是否可行,这就需要建立“可供性模型”,帮助AI识别实验设备、样本类型、时空资源等现实条件的限制。缺乏这一能力,将使AI停留在“纸上科研”阶段,难以实现实验场景的闭环。
此外,Robin系统目前虽然能够提出实验大纲,但实际实验步骤仍需人类研究员进行解释与转换。Rodriques表示,未来版本的Robin将朝向更加精细化的“自动实验设计者”方向发展,提升其可操作性。
在数据分析方面,Finch的稳定性目前较为依赖提示工程,即人类如何构造输入问题。未来,它需具备根据数据模态自适应生成分析路径的能力,从而真正实现“自主分析”的愿景。
FutureHouse认为评估系统本身的准确性与稳定性是发展“AI科学家”的必要条件。为此,他们开发了LAB-Bench,一个覆盖多个科学任务的公开评估集,并建立起一套用于人类大规模评审的工程体系。
参考文献:
[1] Stephanie Palazzolo. The Startup Building an AI Scientist[EB/OL].(2025-05-05).https://www.theinformation.com/articles/the-startup-building-an-ai-scientist
[2] Kyle Wiggers. FutureHouse previews an AI tool for ‘data-driven’ biology discovery[EB/OL].(2025-05-06).https://techcrunch.com/2025/05/06/futurehouse-previews-an-ai-tool-for-data-driven-biology-discovery/.
[3]Robin: A multi-agent system for automating scientific discovery. [EB/OL].(2025-05-19).https://arxiv.org/pdf/2505.13400
[4] Kyle Wiggers. FutureHouse releases AI tools it claims can accelerate science[EB/OL].(2025-05-01).https://techcrunch.com/2025/05/01/futurehouse-releases-ai-tools-it-claims-can-accelerate-science/.