云栈社区»论坛 › 开发者广场「Dev Plaza」 › 日本AI模型Rakuten AI 3.0上线半天，配置文件“自曝”抄袭DeepSe ...

5828 积分	0 好友	768 主题

发消息

日本AI模型Rakuten AI 3.0上线半天，配置文件“自曝”抄袭DeepSeek V3

发表于 2026-3-20 11:45:57 | 查看: 129| 回复: 0

日本“最强” AI大模型，上线仅仅半天就被技术社区发现抄袭中国模型 DeepSeek 的证据。

3月17日，日本乐天集团（Rakuten）高调宣布推出了号称“日本最强”的AI大模型 Rakuten AI 3.0。

然而颇具戏剧性的是，模型上线仅12小时后，就被细心的技术爱好者发现，乐天上传至 HuggingFace 开源平台的文件存在“硬伤”。在模型的核心配置文件里，architectures 字段赫然写着 DeepseekV3ForCausalLM，而 model_type 字段也同样是 deepseek_v3。

此外，该配置文件显示的模型总参数量（671B）、激活参数量（37B）以及上下文窗口长度（128K）也与DeepSeek V3公布的参数完全一致。这些证据几乎坐实了乐天模型直接套用DeepSeek V3架构的事实。

更具争议的是，乐天最初在上传模型文件时，还删除了DeepSeek模型的MIT开源协议文件。直到抄袭行为被曝光后，才匆忙重新上传文件进行补救。

尽管DeepSeek V3使用的是宽松的Apache 2.0开源许可证，允许商业使用，但乐天此次行为的争议点在于其背景。据报道，乐天曾获得日本政府高达84亿日元（约合3.6亿元人民币）的补贴，专门用于支持其AI算力建设。在投入如此巨大的公共资源后，最终却拿出一个被指直接“套壳”开源模型的作品，难免引发外界对其研发效率和资金使用效率的质疑。

这一事件在技术社区迅速发酵，成为了关于人工智能研发、开源协议合规性以及产业补贴效率的热议话题。不少开发者调侃道，这可能是史上“自曝”最快的抄袭案例。

对于此事，你怎么看？欢迎在云栈社区的开发者广场分享你的观点。

上一篇：5步搭建自动化知识库：OpenClaw + 飞书知识问答实战教程
下一篇：STM32CubeMX2体验：告别Java，拥抱Electron的全新配置工具

人工智能, 开源模型, 大语言模型, 日本企业, DeepSeek

日本AI模型Rakuten AI 3.0上线半天，配置文件“自曝”抄袭DeepSeek V3

相关帖子