
豆包并非仅仅想造一部手机,其更深层的野心,是成为未来所有智能硬件的统一入口。
今年1月26日,在腾讯公司的年会上,马化腾罕见地对豆包手机发表了评论。他明确表示,腾讯反对将用户的手机屏幕内容传输至云端进行处理,认为这种做法“极其不安全、不负责任”。
对此,豆包手机方面迅速做出回应,强调将严格遵守用户授权,并承诺云端数据处理遵循“不存储、不训练”的原则。
马化腾的这番评价,实际上也揭示了豆包手机此前遭遇的一场危机。早在2025年12月,字节跳动旗下的豆包手机在发布仅一天后,便经历了一场严重的“围剿”。由于其AI智能体触及了各大超级App的流量与核心数据,引发了包括美团、微信、阿里系在内的互联网厂商联合封锁,导致其AI功能几乎陷入瘫痪。
然而,豆包手机的故事并未就此终结。
据独家消息,字节跳动已于2025年底启动了“豆包手机助手”正式版项目,新一代硬件预计将在2026年第二季度中晚期正式发布。
有供应链人士透露,字节对新机的市场预期较第一代测试版有大幅提升。在产品模式上,豆包二代手机依旧与中兴旗下努比亚品牌合作,由中兴负责硬件研发与制造,豆包则专注于AI能力整合。
对于相关问询,字节方面目前暂无官方回复。
如何避免重蹈覆辙,不再被各大应用“围剿”,无疑是第二代产品的核心挑战。据了解,豆包手机团队过去一段时间一直在与多数主流应用厂商进行谈判,目前已经与部分涉及打车、外卖、订票等服务的互联网公司就部分常用权限达成了协议。
不过,谈判获取权限,并不意味着豆包手机会放弃其原有的系统级GUI Agent技术路线。需要解释的是,豆包手机的GUI Agent路线本质上是利用操作系统的高级权限,让AI能够像真人一样“看懂”手机屏幕并模拟点击操作,从而实现“自动操作手机”的效果。这种方式的一大优势在于,它无需应用厂商额外开放API接口授权。
一位手机行业人士分析认为,这也是一种博弈策略。在豆包手机初代产品尚不具备与互联网大厂谈判的足够筹码时,先通过系统级GUI Agent路线做出产品原型,以此来绕开接口授权难题,不失为一种可行的切入方式。
除了深耕自有硬件,豆包手机也在尝试“两条腿走路”,积极与众多手机厂商接洽不同形式的合作。据悉,其与手机厂商的谈判主要分为两种模式:
对于OPPO、vivo、荣耀这类自研生态(包括模型、算力、入口、操作系统)相对完善的手机大厂,豆包与其合作仍集中在技术层面。这可能包括豆包大模型的打通调用,或是合作推出“豆包输入法”等模块化产品。
可以预见,这类厂商绝不会轻易让出核心入口的控制权。未来在应用层,手机厂商仍将保留各自的语音助手入口,例如OPPO的小布同学、vivo的蓝心小V等。
但对于国内市场占有率较低、被归为“Others”阵营的手机厂商,如传音、魅族、联想,豆包手机则采取了更为激进的谈判策略——直接在其手机系统中内置一个豆包AI入口,类似于“赛力斯-华为”的合作模式。
一位字节跳动知情人士表示,在商业模式上,手机厂商需要向字节支付技术授权费以及AI服务订阅费。
从与努比亚合作造手机打样,到以软件入口形式联合一众手机厂商,豆包在移动领域的突围策略已经相当清晰。端侧智能体厂商“万象智维”发起人任炬分析指出,豆包手机第一代之所以迅速被“围剿”,原因在于其用户基数尚小,且与努比亚某一特定机型强绑定。“互联网厂商要封禁很简单,只要针对特定机型进行小范围的定点狙击即可。”
他表示,如果“豆包手机助手”是以独立软件的形式进入海量不同品牌的手机中,不与特定机型捆绑,且用户量达到一定规模后,“围剿”的难度和成本就会大幅增加。
对于大量身处“Others”阵营的手机厂商而言,接入豆包AI的能力,也提供了一种“农村包围城市”的市场可能性。近年来中国手机市场的最大特点,便是华为、小米、OPPO、vivo、苹果、荣耀这六大厂商的市占率高度接近,基本在15%上下浮动,大量中小品牌共同瓜分仅剩的约5%的生存空间。
在内存成本上涨、市场大盘整体下滑的背景下,这些长尾手机品牌的生存处境已然相当艰难。它们中的一些也公开表达过对豆包的兴趣。例如,魅族曾公开喊话“期待有机会深入合作”;而联想集团董事长兼CEO杨元庆的态度则更为暧昧,谈及豆包手机时,他表示“硬件厂商和模型厂商是一种互补关系”。
值得注意的是,除了手机,豆包在硬件形态上选择了多重下注。在今年,我们或许将看到更多搭载豆包AI能力的硬件产品,例如豆包智能眼镜和耳机。
一位与字节跳动眼镜项目合作的供应链人士透露,字节的眼镜团队规模已是“国内最大的团队之一”,甚至在北美也保留了一支研发团队,“用来安置从Meta(原Facebook)挖来的顶尖人才”。
据了解,字节的智能眼镜在工业设计阶段就有三个不同的团队参与竞稿,最终敲定了两个不同的构型方向——一个是带有显示的AI眼镜,计划于2026年第四季度发布;另一个是不带显示的AI眼镜,预计在今年第一季度(大概率在春节后)发布。
与豆包等字节成熟业务生态的协同,将成为这些新硬件的主要卖点。一位看过字节眼镜原型的人士透露,其AI眼镜将主打“全天候拍照”功能。此前也有媒体报道称,字节第一代眼镜将主要面向豆包的资深用户推出。
除了眼镜,供应链消息显示,字节跳动还在开发一款带摄像头的AI耳机项目。
一位智能眼镜行业人士分析认为,无论是眼镜还是耳机,在当前阶段都仍是手机的“附庸”,而AI手机的成熟将给这些外设品类带来巨大的想象空间。他举了一个例子:未来,当你想让豆包手机帮你处理事务时,可能无需举起手机,直接对着眼镜或耳机说出指令即可。手机在云端处理完毕后,结果或确认信息可以直接通过骨传导或音频方式从耳机中反馈,真正实现解放双手。
从豆包的一系列硬件布局来看,其野心显然不止于制造一台手机。更深层的目标是,让内置豆包模型能力的智能体(Agent),成为未来所有智能硬件的标准配置,乃至统一入口。
当用户习惯了这种更高效、自然的人机交互方式,由此形成的生态粘性与用户习惯,其价值将远超过任何单一硬件产品本身。
随着豆包模型能力不断向硬件端下沉,类似的叙事也在海外同步上演。豆包的竞争对手谷歌,今年以来也在积极将其Gemini大模型能力下放到各类硬件设备中。为此,谷歌不仅与曾经的“死对头”苹果合作,共同打造新一代Siri,还在尝试将Gemini应用于AI眼镜、具身智能机器人等多种形态。
有知情人士透露,为了拓展海外市场,豆包手机近期也在与vivo等手机厂商协商,推动在其海外发售的机型中预装“豆包手机助手”,不过具体合作细节仍在谈判中。
对于字节跳动而言,在模型、人才、算力、数据等AI时代的关键要素上,它已具备国内顶级的储备。它所欠缺的,正是一个能够集中输出这些能力的、直达用户的硬件入口。而“豆包”作为一个日活用户破亿的超级AI应用,积累了海量的中文使用数据并拥有显著的品牌效应,无疑是一个最合适的载体。
“在AI时代的硬件终局尚未明朗之前,像字节这样资源充沛的巨头,完全可以同步进行多路径探索,并不计短期投入。”一位行业观察者如此判断。
在这场围绕下一代交互入口的竞争中,豆包正试图通过手机、眼镜、耳机等一系列硬件的布局,构建一个属于自己的生态护城河。对于开发者与技术爱好者而言,理解这些AI与硬件结合的前沿动态,无疑有助于把握未来的技术趋势。如果你想深入探讨移动开发、AI应用或智能硬件的更多可能性,欢迎来到 云栈社区 与同行交流。