检测到您的浏览器版本过低,可能导致某些功能无法正常使用,建议升级您的浏览器,或使用推荐浏览器 Google Chrome EdgeFirefox X

首页科技前沿与新兴产业新一代信息技术人工智能

病理AI大模型:当人工智能成为医生的“第二视野”

供稿人:徐星颖供稿时间:2025-11-03 16:34:31关键词:人工智能,AI,大模型,病理

在医学影像的世界里,病理学被誉为“金标准”。然而,在显微镜下识别数亿个细胞、分析其细微差异,对任何病理医生而言都是巨大的挑战。如今,人工智能正悄然改变这一切。

随着以ChatGPT为代表的生成式AI兴起,人工智能正经历一场深刻的范式转变。跨模态、可推理、可交互的大模型开始进入医疗影像领域,而在病理学这个“数据密集+认知复杂”的学科中,AI大模型的出现,更意味着一次深刻的行业重塑。

一、从识图到识病:计算病理的“基础模型时代”

计算病理学(Computational Pathology, CPath)正进入“基础模型”时代。不同于早期依赖小样本和特定任务的AI算法,新一代病理AI模型以亿级数据、跨模态学习和自监督机制为核心,具备通用化、迁移化和语言化的特征。

美国麻省总医院与哈佛医学院联合研发的两款基础模型——UNICONCH,标志着病理AI的里程碑。

UNI模型可理解不同分辨率、不同器官的组织图像,支持30余种临床诊断任务。它通过分析上亿个组织斑块,掌握从局部细胞到整体切片的形态规律,展现出“无监督自学习”的强大能力。CONCH模型则在视觉-语言融合上取得突破。它通过117万组“图像-文字”病理对联结,能够像医生一样“读图+读词”,在罕见疾病识别和图文检索任务中均表现出色。研究者甚至可以向它输入一句话:“显示腺体结构紊乱的肿瘤区域在哪里?”——模型便能自动定位并解释图像区域,实现了AI病理的语义理解。

这意味着病理AI不再是“黑箱”,而正在成为能听懂医学语言、会解释视觉逻辑的智能系统

二、CHIEF:用AI洞察癌症的“微观宇宙”

哈佛医学院团队进一步推出了CHIEF模型,这是一款为癌症诊断和预后预测设计的临床级基础模型。研究人员将1.5亿张未标注图像与44TB的高分辨率全切片图像融入训练,使模型能在不同癌种间迁移学习。

CHIEF不仅能自动检测肿瘤,还能推测其分子特征与患者生存率。它在来自24家国际医院的测试中准确区分了高风险与低风险患者。其核心创新在于“双模块架构”:一模块识别病理图像中关键区域,模拟病理医生“扫片”过程;另一模块利用对比学习增强对癌症类型的辨识。这让AI具备了“学习临床经验”的能力,使其输出不仅是结果,更是可解释的医学判断。

三、TITANPathChat:病理AI的“多模态革命”

在病理AI的多模态探索中,两款模型格外引人注目:TITANPathChat

TITAN是多模态全切片基础模型。它通过视觉自监督与语言对齐机制,能在无人工标注的情况下,从33万张切片与18万份报告中学习生成病理报告。

在临床测试中,TITAN能够自动生成接近专家水准的病理描述,并可在数据库中检索类似病例,辅助医生决策。

它的关键突破在于——让病理图像“说话”。过去医生需逐一解释显微镜下的每个特征,而TITAN能自动将显微图像转化为自然语言报告,实现从“看图”到“读图”的跨越。

PathChat则是病理学界的“GPT时刻”。它是一款病理多模态大语言模型(MLLM),可同时理解文字与图像。研究团队用100万张切片、1亿个组织片段进行训练,并与病理专家的问答语料共同微调。在测试中,PathChat的诊断准确率达到89.5%,远超GPT-4VLLaVA系列模型。更重要的是,它不仅能识别病灶,还能回答开放式问题,如“这张切片更可能是哪种癌?”、“有哪些免疫标志物异常?”

在多模态体系不断完善的同时,新一代模型正在推动计算病理从“视觉识别”走向“认知理解”。其中,PRISM2基于超过两百万张全切片图像和数十万份病理报告进行训练,兼具视觉与语言能力,能够自动生成病理报告并通过问答形式辅助医生决策;CRISP面向术中病理应用,在多中心测试中显著降低误诊率,使AI真正融入实时诊断。这些进展使病理AI逐渐从实验室的算法工具转变为临床的智能伙伴,既能洞察图像细节,也能理解医生的语言逻辑,推动医学诊断迈向真正的人机协同。

四、AI赋能病理:医学与信息技术的“双螺旋进化”

回望过去十年,医学影像AI主要依赖深度学习的模式识别。而今天,病理AI大模型的崛起本质上是医学知识的结构化重建。在这一过程中,信息技术的几项关键突破成为基础支撑:

        1.视觉Transformer与多模态对齐技术让AI能理解图像语义;

        2.自监督学习与对比学习算法解决了医学数据稀缺问题;

        3.高性能计算与分布式训练支持了百TB级病理数据处理;

        4.大语言模型融合让AI具备推理与交互能力。

病理AI不再只是“图像算法”,而是连接生物医学、信息科学与临床知识的综合智能体。

五、结语:AI不是取代医生,而是重塑医学

病理AI正在构筑一套新的医学智能体系——医生提供经验与判断,AI提供记忆与洞察;医生聚焦病理机制,AI解析数据规律;二者共同构成未来“人机协同诊断”的主干。

可以预见,病理AI将从“辅助诊断”迈向“智能认知”,成为医疗体系中最值得信赖的同事。届时,医生看到的不仅是细胞,更是生命数据的语言;而AI,将成为人类医学的“第二视野”。 

文献来源:

1. Berloco F, Zaccaria GM, Altini N, et al. A multimodal framework for assessing the link between pathomics, transcriptomics, and pancreatic cancer mutations. Comput Med Imaging Graph. [2025-07]. doi: 10.1016/j.compmedimag.2025.102526.

2. hms-dbmi/CHIEF[EB/OL]. [2025-11-03]. https://github.com/hms-dbmi/CHIEF

3. AI工具集 [EB/OL].(2025-01-01)[2025-11-03]. https://ai-bot.cn/titan/

4. Chen X, Xu H, Yu S, et al. AI-Driven Transcriptome Prediction in Human Pathology: From Molecular Insights to Clinical Applications. Biology (Basel). 2025, 14(6): 651. doi: 10.3390/biology14060651.

5. George Shaikovski, Eugene Vorontsov, Adam Casson, et al. PRISM2:Unlocking Multi-Modal General Pathology AI with Clinical Dialogue. arXiv. [2025-06-16]. https://doi.org/10.48550/arXiv.2506.13063

6. A clinical-grade universal foundation model for intraoperative pathology[EB/OL]. (2025-10-14)[2025-11-03]. https://assets-eu.researchsquare.com/files/rs-7805546/v1_covered_59aafa68-9fd7-437d-b64c-ccb534d3ee95.pdf?c=1760453989