2026年4月16日,OpenAI 正式发布 GPT-Rosalind 早期版本,这是该公司首个专为生命科学领域打造的前沿推理模型。以 DNA 结构发现者罗莎琳德·富兰克林(Rosalind Franklin)命名,致敬其在分子生物学领域的开创性贡献,也预示着 AI 将在这一领域开启全新的探索时代。

在美国,一款新药从靶点发现到监管部门批准上市,平均需要 10 至 15 年。早期发现阶段的每一分进展,都会在后续开发中产生复合效应——更精准的靶点选择、更强的生物学假设、更高质量的实验设计。生命科学的研究进展,不仅受制于基础科学本身的难度,更受限于科研工作流程的复杂性。科研人员需要在海量文献、专业数据库、实验数据和不断演进的假设之间来回穿梭,这些流程往往既耗时又碎片化,难以规模化扩展。
OpenAI 认为,先进 AI 系统可以帮助研究人员更快地穿越这些流程——不仅是让现有工作更高效,更是帮助科学家探索更多可能性,发现原本可能被错过的关联,更早得出更好的假设。GPT-Rosalind 通过支持证据合成、假设生成、实验规划和多步骤研究任务,旨在帮助研究人员加速早期发现阶段。长期来看,这些系统有望帮助生命科学组织实现原本不可能实现的突破,成功率也将大幅提升。
一、专为生命科学打造的核心能力
GPT-Rosalind 基于 OpenAI 通用 GPT-4o 架构,针对性增加了生命科学领域的大规模预训练语料,涵盖 PubMed 论文摘要、PDB 蛋白质结构数据、UniProt 蛋白质注释及 ChEMBL 药物活性数据等多源异构生物医学知识。在评估中,该模型在涉及分子、蛋白质、基因、信号通路和疾病相关生物学的推理任务上表现最优,在文献综述、序列到功能解读、实验规划和数据分析等多步骤工作流程中,使用科学工具和数据库的能力也更为突出。
该模型还引入了专门为生命科学设计的 Codex 插件,可免费接入超过 50 种科学工具和数据源,让 AI 能够实时调用最新的科研资源和专业数据库,大幅提升了回答的时效性和准确性。
二、合作生态与行业落地
GPT-Rosalind 目前已在 ChatGPT、Codex 和 API 中以研究预览版形式上线,并通过 OpenAI 可信访问计划(Trusted Access Program)为符合资质的客户提供服务。OpenAI 已与多家行业领军机构展开合作,包括全球知名制药公司Amgen(安进)、mRNA 技术先驱Moderna(莫德纳)、艾伦脑科学研究所(Allen Institute)以及科学仪器巨头Thermo Fisher Scientific(赛默飞世尔)等,携手探索将 AI 能力深度融入真实研发工作流程。
以 Amgen 为例,药物研发团队可以利用GPT-Rosalind 快速分析疾病相关信号通路,推荐潜在的药物作用靶点,并预测化合物的ADMET(吸收、分布、代谢、排泄和毒性)属性,从而在早期发现阶段就筛选出更具成药性的候选分子,大幅缩短传统研发周期。
三、AI + 生命科学的未来图景
GPT-Rosalind 的发布,标志着 AI 在生命科学领域的应用从通用辅助走向专项深耕。以往通用大模型在专业生物医学场景中常常「泛泛而谈」,难以深入到具体的分子机制或实验细节。而专项优化的GPT-Rosalind 不仅能理解蛋白质三维结构图和生化通路图,还能在跨模态信息之间建立深层关联,为靶向药物设计、精准医疗和酶工程等前沿方向提供更有价值的计算支持。
OpenAI 表示,GPT-Rosalind 是生命科学模型系列的首个版本,后续将继续扩展模型在长周期、高工具依赖的科学工作流程中的生物化学推理能力。该公司的大规模计算基础设施,也为持续训练、评估和改进日益强大的领域模型提供了坚实支撑。随着模型能力不断进化,生命科学研究的范式或许正在迎来一个重要的转折点。


