找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3318

积分

0

好友

429

主题
发表于 2 小时前 | 查看: 3| 回复: 0

字节跳动公司ByteDance大楼外观

据行业媒体最新消息,原阿里巴巴通义实验室千问(Qwen)大模型后训练负责人郁博文,已于近期正式加入字节跳动。他将担任Seed团队视觉模型与多模态交互团队的后训练负责人一职。此次变动距离郁博文于今年3月初从阿里离职仅过去很短时间,职业动向迅速明朗,引发了业界对字节跳动在大模型领域,尤其是多模态方向战略布局的进一步关注。

郁博文本科毕业于中南大学,之后考入中国科学院信息工程研究所攻读研究生,并于2022年获得中国科学院大学博士学位。在校期间,他的研究方向聚焦于自然语言处理与信息抽取。他曾在ACL、EMNLP等国际顶级学术会议上发表多篇论文,创新性地提出将信息抽取任务转化为图结构问题,有效应对了实体重叠、嵌套等复杂场景下的识别挑战。凭借卓越的学术成果,他曾获得中国科学院院长奖。

2022年博士毕业后,郁博文通过阿里集团顶级校招项目“阿里星”加入阿里巴巴达摩院,担任算法专家(P7)。他深度参与了通义千问大模型的早期研发工作,快速成长为团队核心成员,并最终负责起整个千问大模型的后训练工作。

作为后训练负责人,郁博文在大模型的“对齐”与“精调”方面建树颇丰。他主导了Qwen系列Chat模型的研发,通过监督微调(SFT)、强化学习(RLHF)、直接偏好优化(DPO)等一系列技术,成功将通用基础模型转化为符合人类偏好与价值观的对话模型。针对不同参数量级的模型,他还设计了“四阶段进化论”和知识蒸馏策略,显著提升了Qwen系列在长文本生成、复杂推理及多模态理解等任务上的性能。这使得Qwen模型在LMSYS Chatbot Arena等全球权威评测中多次位列前十。

据了解,2026年3月,阿里通义实验室进行了组织架构调整,计划将原本垂直整合的Qwen团队拆分为预训练、后训练、文本、多模态等多个平行模块。这一调整导致郁博文的管理职责范围收窄,并且与他所坚持的“预训练与后训练必须深度耦合”的技术理念产生了分歧。同时,来自公司层面日益增长的大模型商业化考核压力,也加剧了团队内部的不确定性。多重因素影响下,郁博文于2026年3月3日提交辞呈,次日正式离职。其职位由前Google DeepMind高级资深研究员周浩接任。

字节跳动Seed团队近年来持续加码大模型与多模态领域的技术投入。郁博文这样一位在模型后训练、特别是对话模型对齐方面拥有深厚经验和成功实践的核心人才加入,无疑将显著增强Seed团队在视觉与多模态交互模型的后训练与优化能力。这标志着字节跳动在人工智能领域的竞争布局正在向更深层次、更专业化方向发展。




上一篇:OpenClaw爆火引担忧,飞书CEO谢欣:企业级AI Agent不解决安全越强大越危险
下一篇:AI代理效率新发现:仅11%输出被实际使用,精简内容或成关键
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-12 05:54 , Processed in 0.424558 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表