云栈社区»论坛 › 开发者广场「Dev Plaza」 › AI大模型鏖战正酣，梁文锋与DeepSeek的沉默与市场期待 ...

发回帖发新帖

4032 积分	0 好友	528 主题

发消息

AI大模型鏖战正酣，梁文锋与DeepSeek的沉默与市场期待

发表于 2026-2-15 06:08:58 | 查看: 283| 回复: 0

DeepSeek创始人梁文锋在演讲

大战已至。

此刻，诸神就位。

互联网巨头纷纷争上牌桌，它们的野心昭然若揭：都希望自家的AI大模型应用能成为那个最强的流量入口。而在AI大模型这片赛场，有一个男人曾是不折不扣的主角。

回到一年前，他正巧成名。2025年春节前一周，梁文锋带领DeepSeek团队发布了推理大模型R1。它以意想不到的低成本，锤炼出可与世界顶级模型同台竞技的性能。自此，这股来自东方的神秘力量成功征服了全球科技圈。

这位来自广东湛江的85后，极少公开露面，身家上百亿。他所创立的DeepSeek江湖地位已无需多言。然而，值此中国AI大模型鏖战之际，DeepSeek却似乎选择了隐身。2月11日，DeepSeek只是悄悄进行了一次升级更新，当外界纷纷猜测“DeepSeek新版本要来了吗”时，梁文锋及DeepSeek团队依然保持着沉默。

有时候，越是平静，对手越是感到不安。

AI战事正酣，梁文锋却静悄悄

这是中国AI史上一个非常微妙的时刻。

先看大众体感最强烈的“撒钱”大战——1月底，腾讯元宝撒出10亿元现金红包激励用户；几乎同一时间，百度投入5亿现金红包推广文心助手。很快，阿里通义千问就带着30亿元红包“干爆”了奶茶店。紧接着，宇宙厂字节也放出大招，在豆包APP上参与新春抽奖最高可领8888元现金红包。

经费在燃烧，用户在狂喜，而这背后透射出的，是头部AI大模型关于未来命运的激烈博弈。

产品侧，字节点了一把大火。2月14日，字节豆包大模型2.0官宣发布。而在此前的2月7日，字节视频生成模型Seedance 2.0已经刷爆全网，网友直呼：“一个文艺复兴和科技革命同时发生的时刻到来”。几乎同一时间，阿里火线出击，发布新一代图像生成基础模型Qwen-Image 2.0，智谱、MiniMax也赶来齐发新模型。

这番“招招有回应”，颇有一种诡异的竞争默契。而蓦然回首，那个曾经掀起大模型开源革命的DeepSeek，就显得有些过于冷静了。

实际上，早前已有一些消息流出。据外媒The Information报道，DeepSeek计划于2月中旬，即春节前后，发布代号为V4的新一代旗舰级人工智能模型，剑指Coding AI王座。但旋即，又有报道称V4可能不会按时发布，并提到DeepSeek内部对发布时间保持沉默。

就在2月11日，DeepSeek悄悄更新，将上下文窗口长度从此前的128K token直接拉到了1M（百万）token。在外界纷纷猜测该版本可能是V4的Preview时，官方依然沉默如常。

但这匹“不问战事”的神秘黑马，总是吸引着外界的目光。2026年1月，DeepSeek团队密集发布了两篇由梁文锋署名的论文——mHC（流形约束超连接）及Engram（条件记忆）。当时市场就开始揣测：这是否与DeepSeek V4的核心技术相关？

投资界也注意到，正值许多公司招聘节奏放慢的年关，DeepSeek仍在各个平台持续招人。例如在其官方渠道上，2月5日仍更新了产品经理、客户端研发工程师等多个岗位的招聘信息。

“我们大部分公司习惯follow，而不是创新。”梁文锋曾如此谈及。眼下，诸神混战之际，外界都在期待那个曾经用创新创造过奇迹的颠覆者——梁文锋。

县城状元，与中国DeepSeek时刻

中国大陆最南端，广东湛江的米历岭村一度游人如织。

1985年出生的梁文锋就来自这里。父母都是当地小学老师，他从小成绩优异，在初中就学完了高中数学，甚至已经开始接触大学数学。但相比考试排名，“今天解决了什么问题”才是梁文锋少年时期里，父母更关注的核心。

如此的成长底色，与许多年后他在AI圈里被称作“难得拥有纯粹技术理想的人”的评价相得益彰。

17岁那年，作为当地吴川一中的高考状元，梁文锋考入浙江大学电子信息工程专业。2007年，他继续在浙大信息与通信工程专业读研，师从项志宇，主要研究方向是机器视觉。

说起来，在当时计算机其实算个冷门专业，土木、电气自动化、金融国贸等才是更热门的选择。一种刻板印象认为，学计算机的毕业后就要去电脑城修电脑卖电脑，“是个打工的”。但梁文锋偏偏做出了这个选择。个人兴趣与时代巨变，为这位天才少年的未来埋下了草蛇灰线。

2008年金融危机席卷全球，彼时还是学生的梁文锋敏锐地捕捉到危机背后的机遇，与同学一起组建团队，开始使用机器学习等技术探索全自动量化交易。2015年，梁文锋与浙大同学徐进正式创立杭州幻方科技有限公司——这便是后来大名鼎鼎的幻方量化。

AI从始至终贯穿于幻方的发展。在早期，幻方就几乎在所有量化策略中都采用了AI模型进行计算。2019年及2021年，幻方更是投入超过10亿元建设自主研发的深度学习训练平台“萤火一号”及“萤火二号”。

一路高歌猛进，到2021年，幻方量化成功跻身千亿量化私募之列。这一年，幻方量化拿到了英伟达A100显卡，并且其AI集群搭载的显卡数量达到了“万卡级别”。值得注意的是，此时国内拥有超过1万枚GPU的企业屈指可数，除了幻方量化，其余几乎都是互联网大厂。

38岁这一年，已成为金融大佬的梁文锋做了一个决定：创办DeepSeek，目标是做出通用人工智能。

在他眼里，这或许是满足对技术世界好奇心的一部分。DeepSeek要做的不止是复刻当时已经名声大噪的GPT，而是如其公司名一般，深度求索——真正去做关于大模型底层的研究，并试图引领行业生态。

愿景很快变为现实，并且出场方式极其震撼。2025年1月，距离春节还有一周，彼时规模近百人团队的DeepSeek上线了DeepSeek R1版本，并直接慷慨开源。其推理能力比肩世界顶尖水平，但研发成本仅约几十万美元，彻底颠覆了“顶级模型需要千万美元级别投入”的行业认知。

至此，梁文锋在中国AI进程史上留下了珍贵的一笔：DeepSeek时刻。

诸神之战，中国AI崭新时代

“AI还是要给人用的”，这个道理在如今显得更为迫切。

诚如一向追求效能、致力于底层研究的DeepSeek，也开始俯身关注具体的C端用户。在其近期一则产品经理岗位的招聘中，职责一栏写道：

主导DeepSeek C端产品的功能规划与体验设计，敏锐洞察用户需求，不断推动产品创新和体验优化；
定位并拆解问题，降低用户使用成本，关注用户增长，提升使用深度、粘性和转化；
......

而在过去一年多的时间里，许多DeepSeek的C端用户一度怀疑DeepSeek没有产品经理。“页面和入口十分简单，好像不需要赚钱一样”，一位DeepSeek个人用户曾这样调侃，甚至笑称：它终于发现我们C端用户是实现AGI（通用人工智能）的关键一环了。

相比DeepSeek的内秀与含蓄，更渴望快速商业化的互联网大厂们，出招则令人应接不暇。

正如阿里砸下30亿红包让通义千问帮用户点奶茶，看似在烧钱买量，实则是AI时代培育用户心智必须迈出的一步。通过“免单”这种大众再熟悉不过的补贴打法，先吸引普通人把千问用起来，再试图让他们意识到AI是能“点单”甚至“能做事”的。

同样，要在春晚送礼的字节豆包，早已在众多生活场景中寻找立足之地：帮人指导韩系帅哥穿搭，给宠物拍艺术照，辅导小孩写作业……在这些角色扮演和情感对话中，豆包的月活跃用户已然突破了2亿。

如此种种，揭开了大模型竞争进入后时代的一个趋势：AI在C端应用的需求爆发点即将到来。

这也让竞争回归到最朴素的本质：谁能真正解决用户的真实需求和具体问题，谁就能成为AI时代的超级入口。而对于历来需要流量滋养的互联网巨头们而言，这场战争意义更为重大——定义下一个十年互联网秩序的机会，或许就在眼前。

这场关于未来的较量，不仅关乎技术，更关乎生态与入口。想了解更多技术趋势与开发者生态的深度讨论，欢迎关注云栈社区的后续内容。

上一篇：高通骁龙X2 Elite性能首测，多核领先苹果M5，Win11 26H1将成专属优化版本
下一篇：与“Agent橘”大橘子的两小时对话：关于Agent原生创业的14个真实思考

DeepSeek, 大模型, 梁文锋, 幻方量化, 人工智能

AI大模型鏖战正酣，梁文锋与DeepSeek的沉默与市场期待

AI战事正酣，梁文锋却静悄悄

县城状元，与中国DeepSeek时刻

诸神之战，中国AI崭新时代

相关帖子