
周三,OpenAI发布了GPT-Rosalind。这是一个专为生命科学领域设计的模型,其名字致敬了罗莎琳德·富兰克林(Rosalind Franklin)——那位拍摄出DNA双螺旋X光衍射照片、贡献被埋没数十年的女科学家。
如果你仅仅将其视为“OpenAI又发布了一个新模型”,很可能会错过这次发布传递出的最重要信号。
过去几年,许多AI产品都在尝试回答同一个核心问题:通用大模型如何深入具体的行业场景?一个被广泛接受的答案是:由垂直领域的创业公司,基于通用模型,结合工具调用和行业数据进行微调来解决。在这个生态里,OpenAI扮演通用底层的角色,垂直公司则在上面构建应用生态。
然而,GPT-Rosalind的发布,是OpenAI首次明确打破这种分工。
Situation:制药行业的“10-15年时间黑洞”
OpenAI在公告中给出了一个令人印象深刻的数字:在美国,一款新药从靶点发现到最终获得FDA批准,平均需要10-15年。
在这漫长的周期里,AI技术其实早已渗透到许多环节。2020年,AlphaFold解决了蛋白质结构预测的难题;ESM系列模型实现了从序列到功能的预测;像Insilico Medicine、Recursion、Isomorphic Labs(DeepMind的子公司)这样的垂直领域公司,也在利用AI进行苗头化合物筛选、毒性预测和临床试验设计。
但这些工具普遍存在一个共同点:每一个都只解决特定环节的问题,没有任何一个能够贯穿新药研发的全流程。生物学家们的日常工作依然繁琐:在PubMed中查阅文献,在UniProt查询蛋白质序列,在ChEMBL查找活性数据,在ClinVar分析变异致病性,最后还得回到Excel里手动整合数据。面对50多个专业数据库、数十个分析工具以及海量的实验记录,流程断裂感非常强。
这正是当前AI技术难以真正“嵌入”科研核心的痛点:单点工具并不缺乏,真正稀缺的是一个能像高级研究助理一样,理解上下文、调度专业工具、综合多方证据、并最终提出可验证的研究假设的“智能大脑”。
Task:OpenAI想在这条链路里塞入什么?
通用的GPT模型难以胜任如此专业的任务,原因主要归结为三点:
- 专业知识深度不足:GPT-4知道P53是什么,但它无法深入了解你正在研究的某个特定IDH1突变在2024年某篇《Cell》论文中揭示的最新机制。
- 工具调用过于分散:通用模型的Function Calling功能适合调用少量标准API,但要协调调度50多个生命科学专业数据库和工具,现有的方案极易失控。
- 可验证性要求苛刻:科学研究对“幻觉”的容忍度为零。生物学家绝不会接受一个偶尔会编造文献引用或实验数据的“助理”。
OpenAI给自己设定的挑战,正是要一次性解决这三个难题——并且要做到比第三方公司使用GPT-4o加上RAG(检索增强生成)和工具链拼凑出来的方案显著更好。
Action:拆解Rosalind背后的4个关键产品决策
决策一:专用预训练,而不仅仅是微调
Rosalind并非只是在GPT-4o基座上简单加一层LoRA微调。它是在GPT基座之上,进行了大规模生命科学语料的继续预训练(continued pretraining)和强化学习。这意味着OpenAI自己投入了大量资金和算力,将PubMed全库、专利数据库、序列库、实验协议库这些“昂贵且杂乱”的数据源,按照生命科学的内在逻辑结构重新组织并训练到了模型中。
这种预训练级别的投入,在过去是OpenAI留给“通用大模型”的专属待遇。此次破例,清晰地传递出一个信号:OpenAI判断生命科学这个市场的体量和战略价值,已经值得它打出“专用基座模型”这张王牌。这并非任何一家垂直领域创业公司能够轻易复制的路径。
决策二:深度集成50+专业科学工具
与模型发布同步,OpenAI推出了“Life Sciences Research Plugin for Codex”,直接连接了50多个科学数据源和工具。这里的关键词是“Plugin”——这不仅仅是“模型支持调用API”,而是OpenAI已经将这些工具的接口规范、认证流程、错误处理和输出格式全部预先封装好。
为什么这一点至关重要?因为集成50多个专业工具所耗费的工程工作量,通常是许多垂直领域AI创业公司赖以构建的“护城河”。一旦OpenAI亲手将这条护城河填平,那些主要依靠“我们整合了N个生物信息学数据库”作为核心差异化的工具型公司,其竞争优势将瞬间瓦解大半。
决策三:紧密绑定顶级行业合作伙伴
安进(Amgen)、莫德纳(Moderna)、诺和诺德(Novo Nordisk)、艾伦研究所(Allen Institute)、赛默飞世尔科技(Thermo Fisher Scientific)——这五个全球生命科学领域的顶尖名字被直接列在了官方公告中。此外还包括Dyno Therapeutics(基因治疗AI公司)和洛斯阿拉莫斯国家实验室(蛋白质设计合作方)。
列出这些合作伙伴绝非凑数,而是一项深思熟虑的产品策略:
- 数据飞轮:这些头部公司的内部研究数据,可以通过合规渠道反馈给Rosalind模型,用于下一代模型的持续优化,形成闭环。
- 场景定义权:科学界对于AI模型“好不好用”的评价标准,将由这几家顶级用户的真实反馈来定义,而不再仅仅依赖于Hugging Face等平台上的通用排行榜。
- 构建进入壁垒:已经与OpenAI建立直接合作的顶级药企,短期内很难再有动力去尝试初创公司的垂直工具。
决策四:限定访问,主动放弃To C流量
Rosalind并没有像普通功能一样向所有ChatGPT Plus用户开放。它只对通过资质审核的美国企业级客户开放,并且需要进行“资格与安全审查”。
这个决策有些反直觉,因为OpenAI一贯奉行流量优先、ChatGPT入口优先的策略。但Rosalind主动拒绝大众访问,背后有两个关键原因:
- 生物安全考量:该模型确实存在加速病原体设计等潜在风险(即“两用研究关切”),OpenAI必须从入口端进行严格管控。
- 明确的信号传递:此举旨在向市场和监管机构明确表明“这是一个面向专业用户的严肃工具”,为未来在生命科学领域涉及合规、医保支付乃至与FDA沟通铺平道路。

Result:基准测试、合作进展与行业反响
基准测试:在BixBench上取得SOTA结果
OpenAI公布了一个关键数据:在BixBench这个专注于真实生物信息学与数据分析任务的基准测试中,Rosalind取得了已发布结果中的最高分。BixBench的特点在于其任务通常是多步骤、需要调度多种工具、并综合多个数据源——这恰恰是Rosalind被设计用来解决的核心问题类型。
需要客观看待的是,BixBench是OpenAI自己挑选出来用于突出优势的基准,并不意味着Rosalind在所有维度都已全面领先。然而,BixBench所选取的题型,恰好是Insilico、Recursion等垂直领域公司一直主打的招牌场景。OpenAI在此类题型上公开宣称取得“第一”,本身就是一个非常强烈的竞争信号。
合作进展:一次性囊括多家头部机构
在发布之日,已有7家顶级机构开始使用Rosalind。对比过去18个月里,许多生命科学AI创业公司为了签下一家“战略合作伙伴”而付出的巨大努力,OpenAI几乎是一次性“收割”了整个赛道的顶级客户。
行业初步反应
在公告发布后的24小时内,市场出现了连锁反应:
- 几家上市的AI药物发现公司股价出现小幅下跌。
- 风险投资社群开始重新评估垂直领域AI创业公司的估值逻辑与投资叙事。
- 有趣的是,Hugging Face上几个开源的生命科学模型star数量增速反而上升(部分开发者开始押注“开源对抗闭源”的路径)。
方法论:解读“通用模型”与“垂类模型”的双线策略
将Rosalind放入OpenAI近两年的产品节奏中观察,其战略结构就变得非常清晰:
| 时间 |
动作 |
信号 |
| 2024 |
GPT-4系列持续扩大规模 |
通用基础能力仍是核心壁垒 |
| 2025 上半年 |
推出Operator/浏览器智能体 |
将基础能力转化为智能体应用流量 |
| 2025 下半年 |
扩张开发者生态(如Apps SDK、AgentKit) |
鼓励他人在我的平台上构建生态 |
| 2026 Q1 |
发布GPT-4o-Cyber(限定访问) |
在网络安全等敏感领域试水“专用+限定”模式 |
| 2026 Q2 |
发布GPT-Rosalind |
正式下场打造垂直领域基础模型 |
这并非路线切换,而是一种“双注策略”:
- 通用模型路线继续推进(发展GPT-N,无限堆叠能力,获取To C流量)。
- 垂类模型路线同步开启(采用专用预训练+限定访问+顶级合作,攻占To B高价值场景)。
OpenAI此前之所以未亲自下场深耕垂直领域,是因为通用模型的能力还在快速提升,吃透通用流量的边际收益远高于细分垂类。而Rosalind的发布则表明:OpenAI内部判断“通用能力提升的边际效应”已经到达一个拐点。他们认为,仅靠等待未来的GPT-5或GPT-6,可能也无法完美解决生命科学领域的特定问题,因此必须现在就着手构建专用基座模型。
给AI从业者的三点启示
过去几年在AI智能体领域的实践让我深刻体会到:你所构建的东西,OpenAI随时都有可能做得更好——前提是它愿意去做。
而判断“它是否愿意进入你所在的领域”,过去往往只能依靠直觉。Rosalind的发布为我们提供了一套明确的评估信号:
信号一:评估所在行业是否具备“值得进行专用预训练”的特征。
具体可以审视三条标准:领域语料是否海量且独特(如PubMed);行业数据飞轮是否具有高价值(如药企的私有研究数据);监管与合规壁垒是否足够高(如FDA将通用流量隔绝在外)。同时满足这三条的行业(例如医疗、法律、金融核心场景),在未来18-24个月内,OpenAI很可能会以“GPT-X-[行业名]”的形式正式进入。
信号二:重新审视你的核心护城河是否是“工具集成的数量”。
如果是,那么你需要尽快寻找新的壁垒。因为一旦OpenAI决定进入,50+工具的深度集成可能被一次性完成。真正的护城河,应该来自于用户的私有数据、深厚的行业客户关系、以及唯有身在其中才能积累的工艺知识与工作流经验——这些是OpenAI在短期内难以获取的。
信号三:认清竞争的本质可能不是“通用vs垂类”,而是“国内vs国外”。
Rosalind明确限定为美国企业客户,这本身就是一个强烈的信号:它短期内不会来争夺中国市场。而国内的合规要求、本地化的客户关系、特有的数据资源(如中文文献库、国内基因数据库、医保数据体系)构成了坚实的本土化护城河。这部分市场是真实存在的,并且存在至少24个月的战略窗口期。对于国内的开发者社区和创业者而言,深入理解并深耕这些本地化优势,是构建竞争力的关键。
我自己的几个产品方向,都在依据以上三条进行重新审视。或许你也应该如此。OpenAI的这次出手远非终点,而是一个明确的分水岭:接下来的12个月,我们很可能会看到至少3个以“GPT-X-行业”命名的垂直模型相继发布。提前做好准备,远比事后追赶要成本低廉得多。
当年罗莎琳德·富兰克林拍摄那张DNA衍射照片时,或许并未完全意识到她的“照片51号”将彻底改变生物学的进程。今天,OpenAI用她的名字为这个模型命名,显得尤为贴切——因为在未来的几年里,整个生物医药行业的“形状”,都很有可能被这个模型重新定义。
而每一个其他行业的从业者,或许都该开始思考:当轮到我的行业时,我准备好了吗?

参考来源
- Introducing GPT-Rosalind for life sciences research
- OpenAI debuts GPT-Rosalind, a new limited access model for life sciences
- OpenAI launches biotech-specific AI model dubbed GPT-Rosalind
- What to know about OpenAI‘s new model for life sciences research GPT-Rosalind