凌晨看完最新的代码竞技场(Code Arena)榜单,我睡不着了。
Anthropic刚丢出来的Claude Opus 4.7 Thinking,直接把天花板给捅穿了。综合得分,甩开第二阵营的GLM-5.1整整40分。在最卷的React榜单上,更是把自家老版本按在地上摩擦。
注意,这不是实验室里刷出来的数据自嗨。这是在真实业务里建网站、写App,被用户用脚投出来的第一。
这意味着什么?
以前的AI写代码,充其量是个记忆力好的打字员。你得把逻辑嚼碎了喂给它。现在的Opus 4.7,实质上已经是个“技术总监”。
你扔个全栈需求过去。它不会傻乎乎直接敲键盘。它会在后台自己跟自己说话,推演逻辑,拆解模块,预判暗坑。在脑子里把整栋楼建好了,才开始输出图纸。
程序员明天就要下岗了?先别急。
硬币的另一面,写着残酷的商业现实。这玩意儿有个致命弱点:太贵,且太慢。
带“思考”标签的模型,本质上是拿庞大的算力和漫长的时间,去换逻辑的准确率。你要是只写个一百行的Python爬虫,用它?纯属高射炮打蚊子。等你盯着屏幕等它“深思熟虑”完,便宜的模型早就改完三个版本了。
那到底该怎么用它搞钱?
一句话:精准匹配,别当算力的冤大头。
从零起盘复杂系统、重构没人敢碰的祖传代码,毫不犹豫请它出山。花钱买全局视野,省下你掉头发排Bug的时间。
至于简单的接口对接、边角料活儿,老老实实薅GLM-5.1这类性价比杀手的羊毛。在商业世界里,算不平账的技术,再颠覆也是扯淡。
把时间轴拉长看,Opus 4.7的登顶,是在残忍宣告:靠当“代码搬运工”吃红利的时代,彻底翻篇了。
未来的互联网战场,不再是谁能雇几百个外包垒砖头。而是“一人公司”带着一群AI冲锋陷阵的智力局。
底层的代码护城河正在干涸。取而代之的,是你对商业本质的洞察。谁能把模糊的现实需求,最精准地翻译给AI,谁就拿到了新时代的印钞机。
湖南,18小时前
|