OpenAI近期重磅推出了其GPT-5模型的升级版本。新的GPT-5.1家族包含三个针对不同场景优化的子模型:GPT‑5.1 Instant、GPT‑5.1 Thinking 和 GPT‑5.1-Codex-Max。
GPT‑5.1 Instant作为默认的聊天模型,其指令遵循能力有所提升。GPT‑5.1 Thinking作为推理模型,响应速度更快,并能生成更易于理解的结果。而专门针对编程场景的 GPT‑5.1-Codex-Max 模型,则通过训练学会了使用“代码压缩”技术来处理更长时间运行的任务,以优化资源使用。
Instant和Thinking模型被应用于ChatGPT中,并由一个自动路由模型根据场景选择使用。OpenAI表示,为了响应用户希望与AI进行更愉快对话的需求,公司改变了模型的默认响应风格。本次更新还加强了对聊天语气和风格的自定义控制。除了已有的预设风格外,此次新增了三种新风格:“古怪”、“直率”和“专业”。用户还可以通过个性化设置和自定义指令来进一步微调响应风格。
在OpenAI今年早些时候推出GPT-5时,曾因移除旧模型选项、中断了许多用户的工作流而引发争议。尽管公司仍然坚持由ChatGPT自动选择最适合当前对话的模型,但OpenAI已放弃了立即淘汰旧模型的计划。其表示,未来引入新的ChatGPT模型时,将给予用户充足的评估和反馈时间,并在淘汰旧模型前提供明确且充分的通知。
此次对模型响应风格的调整,是OpenAI为了让用户更容易塑造符合个人偏好的ChatGPT“人格”而做出的努力。不过,部分社区用户对此表示质疑。在Hacker News的讨论中,有人指出“高效”(原“机器人”)预设就是为了满足偏好简洁回答的用户而存在的。
GPT‑5.1-Codex-Max是OpenAI编程模型的增强版。在SWE-bench Verified基准测试中,GPT‑5.1-Codex-Max在消耗更少推理令牌的同时,性能超越了前代模型。该模型还新增了“超高”推理级别,此前仅提供低、中、高三个级别。
GPT-5.1-Codex-Max Benchmark Performance
GPT-5.1-Codex-Max 基准测试性能表现(图片来源:OpenAI博客)
社区开发者对该模型的功能表示欢迎,并希望未来能通过ChatGPT聊天界面直接访问此模型,即便需要隐藏在“其他模型”下拉菜单中也无妨。
目前,新的Codex模型已在Codex CLI及多个IDE扩展中可用,API访问权限“即将推出”。
|