云栈社区»论坛 › 技术文档「 Note & Doc 」 › 专家-路由器耦合损失（ERC）优化MoE模型训练，字节团队提出控制 ...

发回帖发新帖

3637 积分	0 好友	479 主题

发消息

专家-路由器耦合损失（ERC）优化MoE模型训练，字节团队提出控制专家专业化新方法

发表于 2026-1-10 23:16:15 | 查看: 58| 回复: 0

上一篇：C++编码错误：详解银狐远控源码中的缓冲区溢出与内存越界问题 (VS2022工程)
下一篇：Golang Hook设计实战：解耦业务逻辑，让订单系统更灵活

MoE, Transformer, 深度学习, 模型训练, PyTorch

相关帖子

收藏0 回复显示全部楼层举报

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-28 02:12 , Processed in 0.518294 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表