日本“最强” AI大模型,上线仅仅半天就被技术社区发现抄袭中国模型 DeepSeek 的证据。
3月17日,日本乐天集团(Rakuten)高调宣布推出了号称“日本最强”的AI大模型 Rakuten AI 3.0。
然而颇具戏剧性的是,模型上线仅12小时后,就被细心的技术爱好者发现,乐天上传至 HuggingFace 开源平台的文件存在“硬伤”。在模型的核心配置文件里,architectures 字段赫然写着 DeepseekV3ForCausalLM,而 model_type 字段也同样是 deepseek_v3。
此外,该配置文件显示的模型总参数量(671B)、激活参数量(37B)以及上下文窗口长度(128K)也与DeepSeek V3公布的参数完全一致。这些证据几乎坐实了乐天模型直接套用DeepSeek V3架构的事实。
更具争议的是,乐天最初在上传模型文件时,还删除了DeepSeek模型的MIT开源协议文件。直到抄袭行为被曝光后,才匆忙重新上传文件进行补救。
尽管DeepSeek V3使用的是宽松的Apache 2.0开源许可证,允许商业使用,但乐天此次行为的争议点在于其背景。据报道,乐天曾获得日本政府高达84亿日元(约合3.6亿元人民币)的补贴,专门用于支持其AI算力建设。在投入如此巨大的公共资源后,最终却拿出一个被指直接“套壳”开源模型的作品,难免引发外界对其研发效率和资金使用效率的质疑。
这一事件在技术社区迅速发酵,成为了关于 人工智能 研发、开源协议合规性以及产业补贴效率的热议话题。不少开发者调侃道,这可能是史上“自曝”最快的抄袭案例。
对于此事,你怎么看?欢迎在云栈社区的开发者广场分享你的观点。
|