本周,清华大学唐杰教授在社交媒体上分享了他对人工智能发展的最新思考,内容涵盖模型预训练、激活对齐、Agent机制、记忆实现及大模型演进趋势等多个核心维度,为行业提供了前瞻性视角。
在分享中,多个观点极具启发性。
首先,他将AI Agent定义为“模型能力扩展的里程碑”,强调这是AI从知识积累走向现实生产力的关键跃迁。
其次,他预判“明年将是AI替代不同工种的爆发年”,并指出AI应用的第一性在于替代或辅助人类工作,而非单纯创造新应用。
第三,他犀利指出“领域大模型是个伪命题”,认为AGI的终局将是通用化,领域数据与流程终将汇入主模型。
此外,关于“激活对齐长尾能力”、“增强推理能力”、“模型记忆必须实现”以及“在线学习与自我评估将是下一个Scaling范式”等论述,同样深刻指出了当前技术演进的核心挑战与未来方向。这些见解共同勾勒出一幅AI向通用化、实用化深度进化的清晰图景。
AI发展的重心正从“模型能力”的绝对提升,转向“能力与现实接口”的构建与对齐。唐杰教授的观点说明,接下来的关键突破在于如何让模型像人一样,在动态、复杂且长尾的真实世界中持续学习、有效行动并积累经验。“领域大模型是伪命题”的论断,恰恰揭示了这一趋势——当通用基座足够强大,所谓的领域护城河将逐渐消融,真正的竞争力将体现在谁能更快、更精准地将通用能力与具体工作流、物理环境“焊接”起来。
图:唐杰教授分享的AI发展核心观点

以下是微博原文内容:
“最近的一些感悟,分享一下,希望对大家有用。
预训练使得大模型已经掌握世界常识知识,并且具备简单推理能力。更多数据、更大参数和更饱和的计算仍然是Scaling基座模型最高效的办法。
激活对齐和增强推理能力,尤其是激活更全面的长尾能力是保证模型效果的另一关键。通用benchmark的出现一方面评测了模型通用效果,但也可能使得很多模型过拟合。真实场景下是如何让模型更快、更好的对齐长尾的真实场景,增强实际体感。Mid和Post Training使得更多场景的快速对齐和强推理能力成为可能。
Agent是模型能力扩展的一个里程碑,也是体现AI模型进入人类真实(虚拟/物理)世界的关键。没有Agent能力,大模型将停留在(理论学习)阶段,就类似一个人不断学习,哪怕学习到博士,也只是知识积累,还没有转化为生产力。原来的Agent是通过模型应用来实现,现在模型已经可以直接将Agent数据集成到训练过程,增强了模型的通用性。其实难题还是不同Agent环境的泛化和迁移并不是那么容易,因此最简单办法也只有不断增加不同Agent环境的数据和针对不同环境的强化学习。
实现模型记忆成为一个必须做的事情,这也是一个模型应用到真实环境必须有的能力。人类记忆分为短期(前额叶)、中期(海马体)、长期(分布式大脑皮层)、人类历史(Wiki或史书)四个阶段。大模型如何实现不同阶段的记忆是个关键。Context、RAG、模型参数可能分别对应了人类的不同记忆阶段,但如何实现是个关键。一种办法是压缩记忆,简单存在Context。如果大模型可以支持足够长的Context,那基本有可能实现短中长期的记忆。但如何迭代模型知识,更改模型参数这还是个难题。
在线学习与自我评估。有了记忆机理,在线学习成为一个重点。目前的大模型定时重新训练,这有几个问题:模型无法真正的自我迭代,但模型的自学习自迭代一定会是下一个阶段必然具有的能力;重新训练还比较浪费,同时也会丢掉很多交互数据。因此如何实现在线学习是个关键。自我评估是在线学习的一个关键点,要想模型自我学习,模型首先要知道自己对还是不对,如果知道了(哪怕概率知道)模型就知道了优化目标,能够自我改进。因此构建模型自我评价机制是个难题。这也可能是下一个Scaling范式。Continual Learning/Real Time Learning/Online Learning?
最后,大模型的发展越来越端到端,不可避免的要把模型研发和模型应用结合起来。AI模型应用的第一性不应该是创造新的App,他的本质是AGI替代人类工作,因此研发替代不同工种的AI是应用的关键。Chat部分替代了搜索,部分其实融合了情感交互。明年将是AI替代不同工种的爆发年。
写在最后的是多模态和具身。多模态肯定是个未来也很有前景,当下的问题是多模态不大能帮助到AGI的智能上界,而通用AGI的智能上界到底在哪儿还不知道。可能最有效的方式还是分开发展:文本、多模态、多模态生成。当然适度的探索这三者的结合肯定能发现一些很不一样的能力,这需要勇气和雄厚的资本支持。
同理,如果看懂了Agent就知道具身的痛在哪里了,太难通用了(也不一定),但至少少样本去激活通用具身能力基本不可能。那怎么办呢?采数据,或者合成数据,都不是那么容易,也贵。但反之一旦数据规模上去了,通用能力出来了自然会形成门槛。当然这只是智能方面的难题,对于具身,机器人本身也是个问题,不稳定,故障频繁都限制了具身智能的发展。2026年这些都将取得长足进步。
也讨论一下领域大模型和大模型应用。我一直认为领域大模型就是个伪命题,都AGI了哪有什么Domain-specific AGI……但,AGI还没实现,领域模型会长时间存在(多长,不好说,AI发展实在太快了)。领域模型的存在本质上是应用企业不愿意在AI企业面前认输,希望构建领域Know-how的护城河,不希望AI入侵,希望把AI驯化为工具。而AI的本质是海啸,走到哪里都将一切卷了进去,一定有一些领域公司走出护城河,自然就卷进了AGI的世界。简而言之,领域的数据、流程、Agent数据慢慢的都会进入主模型。
而大模型的应用也要回到第一性原理,AI不需要创建新的应用。AI的本质是模拟人或者代替人或者帮助人实现人类的某些必须要做到事(某些工种)。可能就是两种,一种就是AI化以前的软件,原来需要人参与的改成AI,另一种就是创造对齐人类某个工种的AI软件,替代人类工作。所以大模型应用需要帮助到人、创造新的价值。如果做一个AI软件没人用,不能产生价值,那这个AI软件肯定没有生命力。”
这些关于技术范式与开发者职业未来的深度思考,值得在技术社区进行更广泛的探讨。更多前沿技术动态与深度解析,欢迎关注云栈社区。