5332 积分	0 好友	687 主题

发消息

前阿里千问后训练负责人郁博文加盟字节Seed，强化多模态布局

发表于 2026-3-12 03:15:56 | 查看: 176| 回复: 0

字节跳动公司ByteDance大楼外观

据行业媒体最新消息，原阿里巴巴通义实验室千问（Qwen）大模型后训练负责人郁博文，已于近期正式加入字节跳动。他将担任Seed团队视觉模型与多模态交互团队的后训练负责人一职。此次变动距离郁博文于今年3月初从阿里离职仅过去很短时间，职业动向迅速明朗，引发了业界对字节跳动在大模型领域，尤其是多模态方向战略布局的进一步关注。

郁博文本科毕业于中南大学，之后考入中国科学院信息工程研究所攻读研究生，并于2022年获得中国科学院大学博士学位。在校期间，他的研究方向聚焦于自然语言处理与信息抽取。他曾在ACL、EMNLP等国际顶级学术会议上发表多篇论文，创新性地提出将信息抽取任务转化为图结构问题，有效应对了实体重叠、嵌套等复杂场景下的识别挑战。凭借卓越的学术成果，他曾获得中国科学院院长奖。

2022年博士毕业后，郁博文通过阿里集团顶级校招项目“阿里星”加入阿里巴巴达摩院，担任算法专家（P7）。他深度参与了通义千问大模型的早期研发工作，快速成长为团队核心成员，并最终负责起整个千问大模型的后训练工作。

作为后训练负责人，郁博文在大模型的“对齐”与“精调”方面建树颇丰。他主导了Qwen系列Chat模型的研发，通过监督微调（SFT）、强化学习（RLHF）、直接偏好优化（DPO）等一系列技术，成功将通用基础模型转化为符合人类偏好与价值观的对话模型。针对不同参数量级的模型，他还设计了“四阶段进化论”和知识蒸馏策略，显著提升了Qwen系列在长文本生成、复杂推理及多模态理解等任务上的性能。这使得Qwen模型在LMSYS Chatbot Arena等全球权威评测中多次位列前十。

据了解，2026年3月，阿里通义实验室进行了组织架构调整，计划将原本垂直整合的Qwen团队拆分为预训练、后训练、文本、多模态等多个平行模块。这一调整导致郁博文的管理职责范围收窄，并且与他所坚持的“预训练与后训练必须深度耦合”的技术理念产生了分歧。同时，来自公司层面日益增长的大模型商业化考核压力，也加剧了团队内部的不确定性。多重因素影响下，郁博文于2026年3月3日提交辞呈，次日正式离职。其职位由前Google DeepMind高级资深研究员周浩接任。

字节跳动Seed团队近年来持续加码大模型与多模态领域的技术投入。郁博文这样一位在模型后训练、特别是对话模型对齐方面拥有深厚经验和成功实践的核心人才加入，无疑将显著增强Seed团队在视觉与多模态交互模型的后训练与优化能力。这标志着字节跳动在人工智能领域的竞争布局正在向更深层次、更专业化方向发展。

上一篇：OpenClaw爆火引担忧，飞书CEO谢欣：企业级AI Agent不解决安全越强大越危险
下一篇：AI代理效率新发现：仅11%输出被实际使用，精简内容或成关键

人工智能, 大模型, 人才流动, 阿里巴巴, 字节跳动

前阿里千问后训练负责人郁博文加盟字节Seed，强化多模态布局

相关帖子