找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4455

积分

0

好友

615

主题
发表于 1 小时前 | 查看: 2| 回复: 0

日本“最强” AI大模型,上线仅仅半天就被技术社区发现抄袭中国模型 DeepSeek 的证据。

3月17日,日本乐天集团(Rakuten)高调宣布推出了号称“日本最强”的AI大模型 Rakuten AI 3.0。

然而颇具戏剧性的是,模型上线仅12小时后,就被细心的技术爱好者发现,乐天上传至 HuggingFace 开源平台的文件存在“硬伤”。在模型的核心配置文件里,architectures 字段赫然写着 DeepseekV3ForCausalLM,而 model_type 字段也同样是 deepseek_v3

此外,该配置文件显示的模型总参数量(671B)、激活参数量(37B)以及上下文窗口长度(128K)也与DeepSeek V3公布的参数完全一致。这些证据几乎坐实了乐天模型直接套用DeepSeek V3架构的事实。

更具争议的是,乐天最初在上传模型文件时,还删除了DeepSeek模型的MIT开源协议文件。直到抄袭行为被曝光后,才匆忙重新上传文件进行补救。

尽管DeepSeek V3使用的是宽松的Apache 2.0开源许可证,允许商业使用,但乐天此次行为的争议点在于其背景。据报道,乐天曾获得日本政府高达84亿日元(约合3.6亿元人民币)的补贴,专门用于支持其AI算力建设。在投入如此巨大的公共资源后,最终却拿出一个被指直接“套壳”开源模型的作品,难免引发外界对其研发效率和资金使用效率的质疑。

这一事件在技术社区迅速发酵,成为了关于 人工智能 研发、开源协议合规性以及产业补贴效率的热议话题。不少开发者调侃道,这可能是史上“自曝”最快的抄袭案例。

对于此事,你怎么看?欢迎在云栈社区的开发者广场分享你的观点。




上一篇:5步搭建自动化知识库:OpenClaw + 飞书知识问答实战教程
下一篇:STM32CubeMX2体验:告别Java,拥抱Electron的全新配置工具
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-20 13:35 , Processed in 0.753324 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表