
DeepSeek-V4.1或将在6月发布。
据智东西5月8日消息,The Information援引两位知情人士报道称,DeepSeek创始人兼CEO梁文锋可能会在公司成立以来的首轮融资中,个人投入高达200亿元人民币,占募资总额的40%,成为本轮融资中的最大投资者。
DeepSeek希望在本轮融资中筹集到500亿元人民币,这将是中国AI公司史上规模最大的一轮融资。另据一位知情人士透露,中国国家人工智能产业投资基金(大基金)预计将成为DeepSeek本轮融资中的第二大投资者。
与此同时,这轮融资也促使DeepSeek加快创收和商业化进程。两位参与洽谈的人士透露,DeepSeek最近向一些投资者表态,将计划加快模型发布的节奏,使其更接近行业常规速度。其中一位知情人士称,公司计划在6月发布其V4模型的更新版本V4.1。这或许意味着,一向以研究为导向的实验室,也开始向更具商业节奏的开发模式靠拢。
DeepSeek的新模型V4.1将为企业用户提供更多工具,并更好地支持MCP协议。一位知情人士称,DeepSeek还计划让V4.1能直接处理图像和音频信息,尽管其生成的内容仍仅限于文本。 这种多模态输入但文本输出的策略,在实际应用中会带来怎样的新体验?
DeepSeek的本轮融资于4月启动,其预期估值已从早期的超100亿美元(约合人民币680亿元)急剧攀升。4月22日,The Information曾援引四位知情人士消息报道,腾讯和阿里巴巴正洽谈投资DeepSeek。
此轮融资完成后,DeepSeek的估值或将超过3500亿元人民币。
尽管估值迅速飙升,但一些曾与DeepSeek进行洽谈的投资者,对DeepSeek创造持续性收入以及加快模型发布速度的能力表示担忧。DeepSeek一直以研究型实验室的声誉著称,将模型开发置于商业化之上。毕竟,从实验室里的技术突破到市场上能稳定收费的产品,这中间还有很长的路要走。
DeepSeek正致力于将技术转化为可供收费的产品和服务,其员工一直在向各行各业的企业推广其模型,希望能激发合作兴趣。据两位知情人士透露,DeepSeek还从字节跳动的产品开发团队及其他国内科技公司招兵买马。
The Information认为,此轮融资和商业化举措,标志着DeepSeek的一次重大战略转向。梁文锋在业内以技术理想主义者著称,他曾希望让DeepSeek远离商业压力。中国AI界的许多人将DeepSeek的成功归功于没有外部投资者,从而也无需承受将技术商业化的压力。但随着算力成本飙升和顶尖人才争夺的白热化,这种模式越来越难以为继,DeepSeek近期多位研究员的流失就是一个例证。
通过引入外部资金,DeepSeek可以在算力上加大投入,并为员工提供更高薪酬。DeepSeek未来还可能开始发放股票期权,作为员工薪酬的补充。在当前的人工智能赛道上,资金与人才的双重投入几乎成了决赛圈入场券。
这笔巨额融资最终能否帮助DeepSeek平衡理想与现实?在云栈社区,不少开发者正密切关注着DeepSeek从开源先驱到商业巨头的转身之路。
|