2025 年至今,各类 AI 硬件产品呈爆发之势,从录音卡片、智能眼镜到 AI 毛绒玩具、智能指环,新品层出不穷。
然而,绝大多数用户对当下的 AI 硬件并不满意。在相关调研中,“不尽如人意”、“做得不够好”是频繁被提及的评价。
可以说,整个 AI 硬件市场仍处于极早期阶段。目前几乎所有产品都只在 2% 的技术尝鲜者和 10% 的早期采用者中打转,尚未触及主流大众。
因此,在一场 AI 硬件主题的线下闭门讨论中,创业者与深度用户们回归原点,探讨了几个核心问题:AI 硬件的不可替代性究竟在哪?在手机这个强大的计算中心面前,独立的 AI 硬件凭什么能让用户额外付费且持续使用?
以下是我们对现场核心观点与讨论的整理。
01 使用频率最高、持续使用最久的 AI 硬件,为什么是 Plaud?
在现场调研中,针对“过去 30 天内,你实际在使用的 AI 硬件是哪些?”这个问题,以 Plaud 为代表的 AI 录音卡片“一骑绝尘”,成为用户使用频率最高、持续使用最久的品类。
找到合适的生态位,精准切入苹果用户的「录音」痛点
Plaud 的成功并非因为它要做一个颠覆性的录音机,而在于它精准地解决了苹果生态系统中的“通话录音”这一刚需痛点。
Plaud 这款产品首先切中了一个非常好的使用场景,它解决的核心问题,就是苹果手机无法正常进行通话录音的痛点。
在拆机后也能发现,它用了骨传导传感器来拾取声音,就是专门针对苹果这个刚需场景来的。苹果对隐私要求极高,官方很难直接提供录音服务,这就给了 Plaud 一个完美的切入点。
但在这种模式下,硬件只是它的入口。Plaud 在接入 OpenAI 相关能力之后,在会议纪要、内容总结这些后续 AI 服务 上做得十分出色,这才是它能够顺利从 0 到 1、再从 1 到 100 实现规模化推广的关键。这也印证了当下 Data Science 和 Computing Power 如何通过特定硬件形态转化为实际生产力。
精准锚定特定人群,把产品做成「生产力工具」
Plaud 这类产品的核心逻辑,并非依靠数据或体验全面超越手机,而是精准锚定特定职业与人群。
它最初主攻美国市场的投资人、销售、医生、小微企业主,这类人群对信息留存、客户沟通记录有很高的需求。设备对他们而言,是能提升效率、节省时间、直接创造收益的工具,这才是核心价值。
Plaud 很快就抓住了这群愿意为效率提升支付高额溢价的用户。所以它的硬件售价能做到 BOM 成本的 6 到 7 倍,这在普通消费电子中几乎是不可能的。
Plaud 本质上是找到了特定群体的极致细分需求,并针对性打造产品。因此,从定位上看,Plaud 更像垂直领域的专业生产力工具,而非大众消费品。
作为独立的 AI 硬件,强调与手机「解耦」
同时,Plaud 从一开始就强调与手机的“解耦”。即使用户在手机上进行其他操作,Plaud 也能独立、稳定地完成录音工作,互不干扰。这种“解耦”带来的稳定性和专注性,恰恰是许多重度用户所看重的。
大厂的入局逻辑:「生态优先」
在 Plaud 之后,钉钉、飞书联合安克等大厂也迅速入局,推出了形态各异的录音设备。但从销量和市场反馈来看,Plaud 依旧处于领先位置。
阿里、腾讯这类大厂做产品的逻辑和打法,更多是“生态优先”,和创业公司完全不同。
它们首先会盘点自身已有的庞大资源,比如如钉钉和飞书的会议生态,然后开发一款硬件来更好地服务于这个生态。思路是“用硬件强化已有的 1,再利用生态里的一堆 0 来放大体量”。
钉钉、飞书本身就以会议场景为核心,平台上有大量会议、录音相关的信息源和使用场景,所以它们做硬件的起点,就是绑定自身已有的会议生态,这和 Plaud 从空白细分痛点切入的底层逻辑是完全不同的,发展方向自然也不一样。
但 Plaud 面临的后续竞争压力并不小
Plaud 在国内起步早,确实抢占了先机和市场,但后续发展压力并不小:一是产品定价偏高;二是国内互联网大厂在这个赛道的内卷会越来越激烈。
一位嘉宾透露,国内有厂商正在研发成本极致压缩的录音硬件,比如一个 99 块钱的录音按钮,然后用付费订阅制来打市场。
这也可以预见,录音硬件赛道未来的竞争会异常激烈,硬件本身将越来越“白菜价”,真正的战场在于后端 AI 服务的能力和体验。
02 AI 智能眼镜,一个极度内卷的赛道
智能眼镜,已经成了一个极度内卷的赛道。这个赛道的主要玩家是 Meta、Google、苹果这类科技巨头,它们在资金、生态上都具备优势,赌的是将眼镜打造成下一个替代手机的计算平台。
相比之下,创业公司更像是一场艰难的“求生”,更多地是在某一个细分场景里做到极致,实现“小而美”的 PMF(产品市场契合)。
科技巨头,希望构建一个全新的独立生态系统
智能眼镜赛道的主要玩家是 Meta、Google、苹果这类科技巨头。它们的战略目标是把眼镜打造成未来能够替代甚至能绕开手机的核心终端,通过眼镜直接搭载应用和 AI 大模型,构建一个全新的独立生态系统。
巨头、大厂做智能眼镜,是把它当成战略产品。它们的目标从一开始就是冲击早期大众市场,达不到这个量级,对它们来说就是失败。也正是因为目标太高、难度太大,巨头们的研发也经常出现推进、暂停反复的情况,这个行业整体都处在不断探索甚至阶段性迷茫的状态。
目前,只有 Meta 和雷朋联名的 AI 眼镜,是最有希望冲击千万销量。这款眼镜能卖这么好,核心原因是选对了市场和产品形态。
- 攻美国市场,做成当地人习惯佩戴的“墨镜”形态;
- 与雷朋联名,直接利用其品牌认知和销售渠道,降低了市场教育成本;
- 定价非常巧妙。智能款只比普通雷朋墨镜贵几十美元,让消费者感觉“性价比超高”,实际上是 Meta 在用技术补贴硬件换市场。
为什么是墨镜?我听过一个很有意思的观点:做墨镜款比做近视镜款容易太多了。一是,墨镜不用一直戴,续航问题可以暂时搁置;二是,墨镜镜腿更粗,内部容纳硬件的空间更大,硬件设计要求更低,成本也能控制,更容易走量。
创业公司,做「小而美」的极致单品
创业公司没法和巨头拼资源、拼生态,所以,唯一的出路是在细分场景里做到极致,实现“小而美”的 PMF。
在部分参与的嘉宾看来,国内有两款 AI 眼镜产品,算是做到了 PMF:
- 一款是 Viture,定位非常准,就是给 Switch 玩家做的“随身大屏”。本质是一个游戏外设,甚至为了续航专门做了个挂脖充电宝。虽然研发起步比 XREAL 晚,融资也比 XREAL 少,但因为场景切得够细,做成了小而美的 PMF。
- 另一款是 Even Realities,瞄准的是高端商务人群,比如科技公司 CEO。外观是普通的高端眼镜,主打低调、舒适,核心价值不是功能性,是身份彰显。这款在欧洲卖得特别好,因为消费者愿意为这种先锋、高端的定位买单。这也是一个很典型的小众 PMF。
但是反观 XREAL、雷鸟这些产品,总想做全能型,什么场景都想覆盖,反而很难做出核心竞争力。
但这里也存在一个矛盾:如果切的场景太小,市场规模就有限,后续融资、商业化都会很困难。
找到手机无法替代的「魔法时刻」
无论是巨头还是创业公司,做 AI 眼镜都必须回答一个问题:在什么场景下,我的体验是手机完全无法替代的?“骑行导航”被认为是一个核心场景。
开车有车载大屏,坐地铁可以看手机,唯独骑车时,看手机既不方便又不安全。这时候,智能眼镜的优势就体现出来了。
以前骑车导航只能靠耳机听语音,但我想听歌怎么办?用眼镜,转向提示直接显示在眼前,既不挡视线,也不影响我听歌。这就是一个极度细分,但体验提升非常明显,且手机完全无法替代的场景。
现阶段,智能眼镜的两个核心问题
一是,功能虽然能大量堆砌,但还没有出现真正能击穿用户痛点、无可替代的核心体验;
这也是大厂产品的一个典型特点:功能堆砌过多。想切换个功能,你得抬着手在镜腿上滑半天,操作两分钟胳膊就酸了,体验非常差。
二是,现有操控方式存在明显缺陷:抬手触控不实用,语音交互又尴尬。
未来大概率会衍生出专用的小型操控硬件来解决这个问题。我觉得,最优形态大概率是智能戒指。你可以把手放在身边,用最小的动作完成操控,既隐蔽又省力。如果只靠语音在公共场合重复“下一个、下一个”,在别人看来也很奇怪。
对于创业者来说,需要思考的就是一整套交互系统,不仅仅是单个设备的交互。这涉及到更深层次的 System Design 与用户体验整合。
03 「纯陪伴」不成立,情感价值需要一个「场景锚点」
除了工具属性外,另一大方向是满足情感陪伴和生活记录需求的情感陪伴类 AI 硬件产品。但这类单纯贩卖“陪伴感”的产品,商业模式被认为非常脆弱。
且在现场讨论中,大家普遍认为,国内外这类产品还没做到位,很多情感交互、记忆功能做得太生硬。使用者现在更多还是“尝鲜”,目前看不是一个可持续的需求。
全脱离实际功能的「纯陪伴」产品,商业模式非常脆弱
在现场的一个共识是,完全脱离实际功能的“纯陪伴”产品,很难走通。
很多做 AI 陪伴的软件团队,都觉得需要一个硬件载体来提供真实感,但真做出来之后,市场又不太买单,这是个很尴尬的点。
“陪伴”是有价值的,但“纯陪伴”本身是不成立的。
如果一个主场景已经成立了,比如养老机器人、教育机器人,你再额外提供陪伴的情绪价值,那是合理的。但如果它什么实际功能都没有,只能陪伴,这件事就不成立。就像约会,我们总得一起看个电影、吃个饭,总得有个共同要做的事,如果只是说“我来陪陪你”,就会很尴尬。
Looki 的探索很典型,要实现真正的「Proactive AI」
在 AI 陪伴类产品中,Looki 提供了一个另类、但很有价值的视角:它不是在“陪伴”你,而是在帮你“看见”自己。
我最喜欢它的“故事模式”,每 2 分钟自动拍一段 9 秒的视频,这种记录频率是手机做不到的。一天下来,它能记录 200 多个片段,几乎把我一天的活动都覆盖了。
我之前写过一篇帖子,是说 Looki 提供了一种新的心智,叫“自我照见”。看它帮我拍的片段,就像在重新认识自己。一般人很少会主动回顾自己的一天,它帮我做到了。比如,别人说我上班时表情很严肃,我自己没意识到,用它在工位上拍一天,才发现确实是这样。
它还有一个很柔软的点:它能帮你记录下那些平凡的点滴,然后自动剪成 vlog 或 AI 漫画推给你,让你觉得,原来我的日常也值得被记录。这个视角我很喜欢。
Looki 的最终目标,是实现真正的“Proactive AI”。即设备不再是按照固定的时间频率进行记录,而是能够通过内置的传感器感知环境变化,比如声音、震动、光线,在它认为重要或有趣的时刻主动发起记录。
理想的 AI 硬件形态,应该像「行人记录仪」
理想的 AI 记录硬件,应该像“行车记录仪”一样,平时感觉不到它的存在,但在你需要的时候,能随时调出来回看。可以分为两种价值逻辑:
- 负向价值,像买保险一样。就像行车记录仪,你买它不是为了天天看,是为了防止被碰瓷讹钱。这种逻辑成立的前提是,出问题后的损失巨大,用户才愿意为这个低频需求付费;
- 正向价值,创造惊喜。Looki 走的就是这条路,主动为你记录和创造,提供额外的生活洞察和乐趣。目前市面上的 AI 产品,基本都是试图提供这种正向价值。
可穿戴式设备都有一个弱项:耗电
无论是哪种形态,所有可穿戴设备都面临着来自电池和物理尺寸的硬约束。
手表、戒指、耳机这类产品,最大的弱项就是耗电。电池技术的发展速度,跟不上我们对功能的需求。
像戒指,如果要做录音,有一个关键问题:麦克风阵列需要一定的物理距离,比如两个麦克风间距至少要 30 毫米以上。要想达到好的收音效果,体积就不可能做得很小,那佩戴体验就做不好。
所以,像 Plaud 这种卡片形态,虽然戴着不舒服,但可以放桌上,功能单一、纯粹,不受手机打断,也不用过分担心续航。它牺牲了便携性,换来了功能的稳定,这也是一种成立的逻辑。
04 硬件最后拼的是软件,接下来是「软件定义硬件」的时代
硬件只是「传感器」,真正的价值在软件和 AI 服务
在 AI 时代下,硬件的角色正在发生变化。硬件更像是一个信息采集更稳定、更持续的传感器,核心价值完全体现在软件上。
无论是 Looki 还是 Plaud,它们的核心价值其实都在软件上。Plaud 大量的商业化都在软件会员服务上,硬件只是一个让录音这件事比手机更稳定、更持续的传感器。
像传统的专业录影设备,更多是拼硬件参数,但 AI 硬件,最后拼的都是软件。用户最终愿意付费的,是像飞书妙记那样能生成结构化纪要、提炼待办事项的 AI 服务,而不是录音卡片本身。
同时,AI 模型的能力正在成为关键因素。
我是做 AI 的,感觉很多硬件厂商把这波想得太简单了,当成和移动互联网时代一样。这次更像制造业,模型能力很关键。像阿里、字节这种大厂,模型做好后,就是降维打击。所以,硬件的先发优势只是暂时的,能不能活到最后,还是看你能不能用 AI 真正满足用户需求。
「软件定义硬件」:从功能出发,反向设计硬件形态
产品开发流程正在被颠倒过来,不再是先有硬件再找应用,而是先有明确的软件服务需求,再反向定制最适合它的硬件形态。
我现在的观点是,这波真正进入了“软件定义硬件”的时代。以前老说汽车是软件定义汽车,但汽车很多东西软件定义不了。而 AI 硬件,越来越是针对某个明确的功能,去开发对应的硬件,不管是可穿戴设备还是桌面机器人,都是在为某个软件功能服务。
在这种逻辑下,硬件的形态会因场景而异,变得更加灵活和专注。
从做产品的角度来看,评估场景时分成两种:
- 工作场景:追求功能优先。最理想的形态可能就是一个 99 块的手机壳,上面带双麦克风,和手机协同工作,不用操心续航和额外携带。
- 个人生活场景:追求无感记录。那就用 OWS 耳机,不堵耳朵,全天佩戴也很自然。
生活里很多事都还没有被数据化
Plaud 的骨传导、Looki 的可穿戴相机,这些硬件形态的一个共同点就是能够以一种独特的方式采集到手机难以获取的高质量、带有场景上下文的数据。
生活里很多东西其实都没被数据化,我们也不知道自己错过了什么。我之前把 OWS 耳机放在孩子身边,他念叨什么、问什么,都能记录下来,是一份很有意思的生活日志。
有了这些持续记录的数据,再用上现在免费的 AI 工具,你会发现生活里很多事都没有被数据化,而这些数据是宝贵的资产,几十块的耳机就能解决。AI 能以很轻的负担,帮你获得额外的洞察和认知,这是生活里成本很低的解决方案。
需要对硬件制造抱有敬畏之心
“硬件最后拼的是软件”,这话是在硬件没差异化的前提下才成立。但一开始,必须要做出差异化,同时先发优势依然重要。
做软件的人别一上来就说硬件无所谓。硬件里有个体系叫 IPD,超级复杂。IPD 是产品集成开发流程,最早是 IBM 的,后来华为引进,现在车厂、小米手机都在用。硬件看短板,IPD 能把短板拉高,最后能不能卖出去,就看短板有没有补齐,技术体验够不够好,然后才看软件。
要有敬畏之心,才能把事做好。
现在做硬件的门槛,比五年前、三年前低太多了。所以说,“软件定义硬件”,设备最后拼的是服务,用户愿意为 AI 服务付费,硬件只是入口。硬件由服务定义体验,所以很难做差异化,这是个“死胡同”。
同样,现在产品的差异化,其实就是看大家有没有真的重视。
比如 LOVOT 为什么做得好?你拆开看它的传感器、关节设计,会发现它有生命力,摸到它会有心与心的感应。这些都是一点点抠出来的。
大家还是要敬畏,知道这事有多难,去关注细节,才能找到差异化,而不是一上来就抄别人。
05 商业模式决定产品形态,硬件可能只是「入口」
在智能手机这个功能极其强大的中心化计算设备面前,独立的 AI 硬件凭什么让用户额外付费并持续使用?
核心在于,总有一部分用户对特定体验的要求,超出了大众的平均阈值。他们愿意为更优质、更稳定的专属体验付费。
同样,AI 硬件产品的商业模式,就是围绕如何服务这群人来设计的,这个模式,将从第一天起就决定产品的最终形态。
一个观点是,未来的硬件竞争,可能会走向“硬件免费,服务收费”的订阅制模式。
未来的录音设备可能会把硬件成本打到极致,比如只卖 99 块钱。在这种模式下,硬件本身不赚钱,主要通过后端的 AI 转写、总结等服务进行按月订阅收费。硬件本身只是一个低成本的“获客入口”。
商业模式,决定了硬件的设计思路:
如果商业模式是“订阅服务”,那硬件设计的首要目标就是低成本、高可靠性。需要尽可能降低用户的入门门槛,让更多人愿意尝试你的服务。硬件的外观、材质可以妥协,只要能稳定地完成数据采集任务就行。
如果商业模式是“靠硬件盈利”,那产品设计的重点就完全不同了。设计上就需要更注重材质、品牌溢价和用户感知价值。
过往 Meetup 集锦:
对技术趋势的深度洞察,离不开持续的交流与碰撞。欢迎来到 云栈社区,与更多开发者和技术爱好者一起,探讨人工智能与硬件结合的未来可能。