要是有一份工作,要求你一整天对着 AI “挑刺、找茬、刻意刁难”,而且还能拿到日薪 800 美元(约合人民币 5521 元),你会不会觉得这像个玩笑?
最近,一家名为 Memvid 的初创公司发布了一则颇具争议的招聘:寻找一名“职业 AI 喷子”,用整整一天时间,对主流聊天机器人进行高强度压力测试,核心任务只有一个——把 AI 的“记忆缺陷”问题彻底暴露出来。
他们提供的报酬也很直接:100 美元一小时,一天 800 美元。

“AI 喷子”这份工作,本质是在做压力测试
过去几年,大模型的进步有目共睹。从代码生成到多轮对话,LLM 在“表达能力”上已经非常接近人类,在很多场景中甚至还表现得更高效。
但问题在于——它们擅长“说”,却不擅长“记”。
相信很多开发者都有类似体验:你刚刚在对话里设定了背景信息,甚至明确给出关键约束条件,但只要对话轮次一多,模型就开始:忘记前文设定、混淆上下文信息、输出自相矛盾的内容……
这种“短期失忆”,本质上并不是 Bug,而是当前大模型架构的天然限制。大模型并没有真正的长期记忆,它只是基于当前的输入窗口进行概率生成,一旦信息被“挤出窗口”,就相当于彻底消失。
而 Memvid 的这次招聘,其实就是冲着这个老问题去的——AI 的记忆能力几乎是“残缺”的。招聘“职业 AI 喷子”的做法看似在玩梗,实际上 Memvid 是计划对 AI 进行一次“压力测试”。
“大多数聊天机器人虽然乍看之下很聪明,但它们往往记不住你之前说过的话,无法理解对话的上下文,还让你不得不一遍又一遍地重复——这就是这份工作的棘手之处。
我们正在招聘一个人,通过整天对聊天机器人的记忆进行压力测试,公开揭露这个问题。”
据招聘页面介绍,这个岗位按小时计费(100 美元/小时),支持远程,为期一天,总报酬 800 美元。而简单来说,这名“职业 AI 喷子”的工作内容就是:让 AI 反复“翻车”。
- 不断要求 AI 记住某些信息
- 在后续对话中反复验证
- 记录 AI 出现混乱、遗忘、答非所问的情况
- 整理成完整的失败案例报告
某种程度上,这更像是一场公开的、极端条件下的 AI 可用性测试。值得一提的是,这一过程不仅需要手动记录,Memvid 还会全程录像(屏幕+摄像头),确保素材真实可靠。
除此之外,这个岗位还有点“反常识”的要求:不需要任何 AI 专业背景,但必须有丰富的“被技术坑过”的经历;能耐心把同样的问题对 AI 问四遍(生气也要坚持);对当今 AI 有强烈的不满情绪,最好是那种“一提 AI 就想吐槽”的人。
换句话说,至少对于这个岗位,Memvid 要找的不是专家,而是情绪到位的真实用户:
你将花上一整天的 8 个小时与顶尖 AI 聊天机器人互动——而你的唯一任务,就是毫不留情地指出它们有多令人失望。让 AI 记住一些事情,看着它们忘记,然后再问一次,记录下过程中的混乱。
请尽情地抱怨吧,然后,你就能拿到报酬了。
给 AI 加一个“外挂大脑”?
至于为什么要公开 AI 的“记忆问题”,Memvid 联合创始人兼 CEO Mohamed Omar 给出的解释很直接:
“一个真正好用的聊天机器人,核心能力就是——持续记住信息并保持对话连贯。”
如他所说,在各种实际应用中,AI 的“记忆能力”直接决定了它的上限:
- 在客服系统中,无法记住用户历史信息 → 体验割裂
- 在编程助手中,忘记上下文 → 代码质量下降
- 在企业知识库中,无法持续理解语境 → 检索失效
更严重的是,很多被称为“AI 幻觉”的问题,其实并不完全是模型“胡编”,而是因为上下文丢失后被迫重新“猜测”。也就是说,所谓“幻觉”,有一部分本质是“记忆失败”。
因此,Memvid 招聘“职业 AI 喷子”只是第一步,其真正目的是:通过公开 AI 的记忆问题,来推销自家的核心产品——一个“自进化的 AI 记忆层”。
简单来说,他们推出了一套基于文件的持久化存储方案,可跨对话保留上下文,能动态更新和优化记忆内容。它试图让 AI 不再是“一次性对话机器”,而是一个具备连续认知能力的系统。
此外,Memvid 还提供了两种使用方式:集成聊天机器人产品(Kora)和面向开发者的工具接口。官方宣称,这套方案不仅能提升回答准确率,还能改善响应延迟和基础设施效率。
他们真的在找一个“AI 黑粉”
最后,回到 Memvid 花 800 美元找“AI 喷子”的操作,其目的显然有两层:一方面:确实指出了行业痛点;另一方面:也是一次非常聪明的营销——用“雇人骂 AI”这种极具传播力的方式,把技术问题变成公众话题,本身就很“互联网”。
据了解,Memvid 这个岗位的招聘将在几周内结束,他们明确表示,希望找到一个“真的不喜欢 AI 的人”。听起来有点讽刺,但背后的逻辑其实很清晰:最真实的批评,往往来自最不买账的人。
与其让工程师在理想环境中测试模型,不如让一个“暴躁用户”在现实语境中不断挑战系统边界。
不少网友也关注到了这个消息,并引起了许多讨论:
- “这看起来像个大型广告。他们很可能真的会雇一个人来做这份‘工作’,同时收集其他人的数据,然后再向你推销他们的产品。”
- “算我一个,反正我已经在免费做这件事了!”
- “一边折磨 AI,一边被拍摄和录音,肯定不会有好结果。”
那么,你对于这件事又有何看法呢?这场关于大模型能力的极限测试,是揭示了真实的技术瓶颈,还是一场精心策划的营销秀?不妨来云栈社区分享你的观点。
参考链接: https://www.techspot.com/news/111794-job-posting-seeks-human-ai-bully-harass-chatbot.html