
先看两条评论:
A:【路过被香味拽进来的,没想到居然没踩雷,强烈推荐招牌烧鹅,招牌烧鹅外酥里嫩,酸梅汁层次拉满,干炒牛河锅气十足,碳水爱好者闭眼冲】
B:【垃圾玩意,害我吃胖了五六斤】
你能分清哪条是AI写的,哪一条是真人写的吗?
对于刚接触互联网的朋友,可能会觉得第一条充满了“生活家”的精致感。但如果你被各种“好评返现”坑过无数次,就会立刻发现A句透着一股“玻尿酸成精”的伪人感,而B句才是碳基生物的真诚吐槽。
如今,在大众点评这类生活服务平台上,A所代表的评论已经泛滥到让人不忍直视。AI评论的泛滥,不是天灾,而是人祸,它是被人为养出来的“蛊”。商家需要精美的谎言吸引客流,用户需要华丽的废话换取优惠,大家都不想动脑,又都想产出漂亮话。于是,AI评论应运而生。
表面上看,商家获得了引流手段,消费者拿到了“免费甜品”,似乎是各取所需。但最终被耍得团团转的,还是普通用户。过去,我们的痛点是信息不足,恨不得有人把攻略喂到嘴边。现在的问题是信息严重过剩,而AI还在这条路上猛踩油门。
消费者做决策时,甚至不用去思考信息对不对,因为从获取信息的第一步开始,就可能已经被当成“狗”来溜了。你在AI评论里看到的描述,和你到店后看到的实际情况,其差距堪比方便面包装和实物——图片上是牛肉跟你热情打招呼,实物里只有脱水蔬菜跟你说拜拜。
即便你当场掀桌走人,浪费掉的时间、油费和那份期待的心情,也没人能赔给你。如果信息不能保真,那么一切消费决策都无异于在“撞大运”。如何“去伪存真”,就是这个行业当前面临的最大痛点,同时也蕴含着最大的机遇。
最近,大众点评发布了一份报告,首次披露了其在AIGC治理方面的数据。他们显然意识到,如果放任AI生成的虚假内容泛滥,最终只会导致平台生态崩坏,所有参与者一起完蛋。这已经不单单是与水军对抗,更像是全人类在AI浪潮下,为保卫正在变得极为稀缺的“真实感”而筑起的一道防线。
1. 第一层攻防:文本侧写,识别“工业流水线”痕迹
治理“AI写评价”这件事,说起来原理不复杂,但具体执行起来非常考验功力。毕竟,流程上考清华北大也只需要填满答题卡,但关键是怎么填?
最基础的打法可以称之为 “文本侧写” 。尽管当前的大模型已经进化到能让你“变身奥特曼”,但批量生产的AI文本,依然带着一股浓烈的工业流水线味道,充满了“伪人”的共性。

那些量贩式的AI评价,翻来覆去就那么几个固定句式。最典型的就是“不是……而是……”、“首先……其次……最后……”这种强调对比和论证的结构,外加一堆生硬的排比,刻板得像个复读机。因为AI是纯逻辑的产物,它天生就擅长对比、论证和分点列举。
同时,由于AI的训练语料来自互联网,所以会高频出现诸如“老友般的服务”、“以火功精湛著称”、“舌尖上的华尔兹”这类尴尬到让人脚趾抠地的“翻译腔”或过度修饰的词句,笨拙得像个第一天上班、生怕老板看不出自己在努力的实习生。
对于追求效率的水军来说,他们不会像做鬼畜视频一样死磕提示词,更不会上手逐字修改,有那个耐心和功夫就不干这行了。他们通常的做法是直接批量复制粘贴,有时甚至连标点符号都懒得改动。
这种高度的一致性,就在统计学层面形成了一种独特的 “AI指纹” 。因此,大众点评的做法之一,就是对AI回答的典型句式、语法结构、高频用词甚至字词的出现频率进行技术总结,建立模型,从而能快速筛掉一大批低级的复制粘贴货色。
但这,仅仅是热身。
2. 第二层防御:行为分析,揪出“三体人式”的账号
AI会在模仿中不断进化,其句式会变得更丰富,语气也会更自然。但有趣的是,人,有时候也会变得越来越像AI——毕竟,AI的语料库本来就是从人类生产的内容里扒出来的。
那么,如何区分进化后的AI和模仿AI的人呢?关键在于 【行为模式】。
一个账号一个月发一篇点评,和另一个账号一天发三十篇点评,即使用阑尾思考也知道后者大概率是“代码在蹦迪”。毕竟,就算是牛魔王来耕地,恐怕也没有这么高的生产力。
所以,光看文本内容不够,还必须分析账号的 行为轨迹。
正常用户的行为轨迹是混乱而充满烟火气的:吃完不一定写,因为懒;写了不一定配图,因为会忘;IP地址长期固定在一个城市,偶尔切换到外地,那是因为出差或旅游;活跃时间集中在晚上、周末或假期,因为平时要上班没空……这些轨迹拼凑起来,就是一个活生生的、偶尔怨气冲天的打工人画像。
但水军账号的“生命轨迹”,往往是一条笔直的、毫无波动的直线:几十上百个账号共用同一个IP地址;注册时间整齐划一得像军训方阵;能够7x24小时不间断地稳定输出“小作文”;句式结构完美得堪比语文老师范文……
把这些特征拼凑起来,你甚至会怀疑是不是三体人提前降临地球,就为了帮街角那家猪脚饭刷好评。当一个账号的内容生产力高到让老黄牛都想辞职的时候,它的背后要么是八百个探店主播在拼号,要么就是一串冰冷的代码。
将这些异常行为特征组合在一起,就能构建出一道清晰的防火墙。大众点评可以利用大模型来对撞、识别这些行为模式,并对相关操作进行打击。
这一步,有技术难度,但仍在可理解的范畴内。真正让大众点评和其他平台拉开差距的,是它的第三层,也是最核心的防御机制:来自物理世界的锚定。
3. 第三层核验:物理锚点,让虚假信息“裸奔”
仅靠分析文本内容和线上行为,是远远不够的。AI背后也是人在操作,这些人并不蠢。资深的灰产从业者会使用分布式IP地址,会错开发布时间,甚至会在生成的文本里故意加入错别字和口语化表达来模拟“真人感”,这招可以称之为“看我装傻,阴他一手”。
打击力度不够等于没用,而饱和式打击又容易误伤真实用户。这里还存在一个“赛博哲学”难题:有些人确实去真实消费了,但懒得写评论,于是去问AI要了一段评论发布。文字是AI生成的假文字,但消费行为是真人发生的,这到底算真评价还是假评价?
是不是感觉有点无解了?其实不然。因为 AI本身不会消费。它要是真能下单消费,那它评价写得再浮夸,你也得认。而大众点评的优势在于,它不只看线上的账号IP和行为,还能通过丰富的门店信息和真实的交易核销记录来进行交叉验证。
举个例子:如果一家店的首页明确写着“老板今日有喜,休息一天”,但它的评价区却新增了一条“今天打卡,皮酥肉嫩、入口即化”的评论。请问,这个评论是怎么来的?是鬼魂在自嗨,还是AI在作怪?答案不言而喻。
再比如,一家主打正宗粤菜的餐厅,正常的评价都是“虾饺好评”、“老火汤浓郁”。突然冒出一条“战斧牛排外焦里嫩,汁水四溢”,可这家店的系统里压根就没有“战斧牛排”这道菜。这又是怎么回事?是Wi-Fi串了台,还是代码在胡来?
当平台掌握这些来自物理世界的、难以篡改的真实信息后,就能以此为“原点”进行反向追溯。通过这个异常评价,定位到发出评价的异常账号,再顺藤摸瓜,关联到同一批操作账号、这些账号集中评价过的店铺,最终将背后的IP、团伙一锅端掉。
这个逻辑链条中最关键的一环,就是 “知道这家店今天开没开”、“有没有这道菜”、“停车场是否收费” 这些具体的物理世界信息。大多数纯线上平台只有虚拟数据,他们能看到账号、文本和行为轨迹,但看不到物理世界真实发生了什么。没有物理数据锚定的算法,就像没有承重墙的摩天大楼,外表再华丽也掩盖不住“豆腐渣”的本质。
是否存在一个“无法篡改的物理锚点”,本身就是这个时代最值钱的信息壁垒。 这也是为什么目前看来,大众点评在治理AIGC虚假评论上能做得相对深入——因为它手中握有海量的到店消费数据、交易核验链条和真实的用户线下轨迹。线上线下一核对,所有脱离现实的虚假信息都跟“裸奔”一样无所遁形。
当然,要做到这一点极其困难。它需要确保物理世界信息的准确性和及时性,这背后是巨大的人力与物力投入,也需要平台生态内具备商家核销、用户打卡乃至骑手提报等形成数据闭环的能力。之后还要进行数据提炼、模型训练、结果校对和人工核验,每一步都是巨大的成本和付出。但反过来想,如果不难,这项能力的壁垒又在哪里?
根据报告,过去一年,大众点评处置的AIGC违规评价超过1160万条。这个庞大数字的背后,正是上述层层递进的技术和资源投入。

4. 主观意愿:保卫“不完美的真实”
理论上能做到,不代表现实中一定会做。因为这里还横亘着一个无法绕过的东西——平台的主观意愿。
很多公司其实早就知道自家平台上的评论水分很大,只是不想管,或者不敢管。在他们看来,评论多了,热度就上来了,日活数据也好看了,这是“好事”啊。对外有漂亮的数据,对上有光鲜的业绩。
但这种思维,无异于一种慢性自杀。因为它所消耗的,是商业世界中最为珍贵的资产——用户的信任。
任何一笔消费的背后,都藏着人对生活的一份“盼头”。这种情感价值,是无法用日活、ROI(投资回报率)等任何冰冷指标来计算的。当你在一周的疲惫工作后,根据评价找到一家心仪已久的美食店,与朋友度过一个完美的夜晚,这种正向情绪对平台品牌的加成,远超任何一次广告投放。
反之,如果你被天花乱坠的AI评价忽悠,在一个难得的周末,带着家人朋友奔波许久,结果换来一次糟糕透顶的体验,损失金钱、浪费时间、破坏心情。这时,你对平台的感受会是什么?但凡骂得轻一点,都是对自己的不尊重。用户的期待有多高,事后的愤怒就有多深;之前的吹捧有多狠,后面的反噬就有多惨。
虚假评论泛滥的恶果已经显现:很多消费者开始“不看好评,专看差评”,因为大家本能地觉得好评都是刷的,只有差评才可能是真实的。而商家则陷入另一个极端,觉得好评才是真的,差评都是竞争对手在抹黑。于是,一场“魔法对轰”开始了,双方竞相投入资源去刷好评、刷差评,整个评价体系的可信度崩塌。
如果到处都是虚假信息,以至于真实信息也被误认为是假的,最终用户选择回归原始——吃饭前不去平台搜索,而是去问街坊邻居,那么像大众点评这类平台存在的核心价值又是什么?因此,大众点评有最强烈的内生动力去治理AIGC,因为 “真实的评价”是其生存的根基,而它恰好也拥有捍卫这一根基的独特武器——丰富的物理世界信息。
它的治理逻辑也趋于清晰:你可以用人工智能辅助创作,但不能纯AI复制粘贴;你确实去消费了但不会写,可以让AI帮忙润色,但可能需要加以声明;你根本没去、店里根本没这道菜、根本没这项服务,那么这类信息从一开始就不该出现在评价里。
真的就是真的,假的就是假的。 一切虚假的繁荣,不过是裹着糖霜的奥利给,尝过一次就知道恶心。
5. 结语:在AI时代,何为奢侈?
在信息严重过剩的今天,那些辞藻华丽、逻辑满分、构图精准的“完美”点评,正在日益沦为“电子垃圾”。相反,那些带着错别字、吐槽摆盘丑、抱怨拍照光线差,甚至只是毫无章法的情绪宣泄所汇聚而成的 “古法手搓”式评价,反而成了数字时代的“奢侈品”。
因为在那堆杂乱无章的文字背后,跳动的是这个时代最稀缺的东西——真实的人类情绪。
大众点评死磕AIGC治理,其本质就是在保卫人类这种 “不完美的真实” 。这是一场在AI包围的荒诞未来中,试图构建起一道名为“真实”的护城河的艰难战役。这条路当然很难,需要持续的技术迭代和巨大的资源投入。但也正应了文中的那句话:不难,凭什么是你?
对于广大开发者和关注技术伦理的从业者而言,这场发生在我们身边的、关于真实与虚假的攻防战,或许比任何教科书案例都来得更加生动和深刻。技术的进步不应以牺牲信任为代价,如何在利用AIGC提升效率的同时,守住真实性的底线,将是整个行业长期面临的挑战。关于这场技术与人性的博弈,也欢迎大家在 云栈社区 的 开发者广场 板块继续探讨。