4992 积分	0 好友	709 主题

职业AI压力测试员日薪5500元？初创公司Memvid重金招聘只为“骂崩”AI

发表于 2026-3-27 04:00:24 | 查看: 165| 回复: 0

要是有一份工作，要求你一整天对着 AI “挑刺、找茬、刻意刁难”，而且还能拿到日薪 800 美元（约合人民币 5521 元），你会不会觉得这像个玩笑？

最近，一家名为 Memvid 的初创公司发布了一则颇具争议的招聘：寻找一名“职业 AI 喷子”，用整整一天时间，对主流聊天机器人进行高强度压力测试，核心任务只有一个——把 AI 的“记忆缺陷”问题彻底暴露出来。

他们提供的报酬也很直接：100 美元一小时，一天 800 美元。

Memvid招聘AI压力测试员广告

过去几年，大模型的进步有目共睹。从代码生成到多轮对话，LLM 在“表达能力”上已经非常接近人类，在很多场景中甚至还表现得更高效。

但问题在于——它们擅长“说”，却不擅长“记”。

相信很多开发者都有类似体验：你刚刚在对话里设定了背景信息，甚至明确给出关键约束条件，但只要对话轮次一多，模型就开始：忘记前文设定、混淆上下文信息、输出自相矛盾的内容……

这种“短期失忆”，本质上并不是 Bug，而是当前大模型架构的天然限制。大模型并没有真正的长期记忆，它只是基于当前的输入窗口进行概率生成，一旦信息被“挤出窗口”，就相当于彻底消失。

而 Memvid 的这次招聘，其实就是冲着这个老问题去的——AI 的记忆能力几乎是“残缺”的。招聘“职业 AI 喷子”的做法看似在玩梗，实际上 Memvid 是计划对 AI 进行一次“压力测试”。

“大多数聊天机器人虽然乍看之下很聪明，但它们往往记不住你之前说过的话，无法理解对话的上下文，还让你不得不一遍又一遍地重复——这就是这份工作的棘手之处。
我们正在招聘一个人，通过整天对聊天机器人的记忆进行压力测试，公开揭露这个问题。”

据招聘页面介绍，这个岗位按小时计费（100 美元/小时），支持远程，为期一天，总报酬 800 美元。而简单来说，这名“职业 AI 喷子”的工作内容就是：让 AI 反复“翻车”。

某种程度上，这更像是一场公开的、极端条件下的 AI 可用性测试。值得一提的是，这一过程不仅需要手动记录，Memvid 还会全程录像（屏幕+摄像头），确保素材真实可靠。

除此之外，这个岗位还有点“反常识”的要求：不需要任何 AI 专业背景，但必须有丰富的“被技术坑过”的经历；能耐心把同样的问题对 AI 问四遍（生气也要坚持）；对当今 AI 有强烈的不满情绪，最好是那种“一提 AI 就想吐槽”的人。

换句话说，至少对于这个岗位，Memvid 要找的不是专家，而是情绪到位的真实用户：

你将花上一整天的 8 个小时与顶尖 AI 聊天机器人互动——而你的唯一任务，就是毫不留情地指出它们有多令人失望。让 AI 记住一些事情，看着它们忘记，然后再问一次，记录下过程中的混乱。
请尽情地抱怨吧，然后，你就能拿到报酬了。

至于为什么要公开 AI 的“记忆问题”，Memvid 联合创始人兼 CEO Mohamed Omar 给出的解释很直接：

“一个真正好用的聊天机器人，核心能力就是——持续记住信息并保持对话连贯。”

如他所说，在各种实际应用中，AI 的“记忆能力”直接决定了它的上限：

更严重的是，很多被称为“AI 幻觉”的问题，其实并不完全是模型“胡编”，而是因为上下文丢失后被迫重新“猜测”。也就是说，所谓“幻觉”，有一部分本质是“记忆失败”。

因此，Memvid 招聘“职业 AI 喷子”只是第一步，其真正目的是：通过公开 AI 的记忆问题，来推销自家的核心产品——一个“自进化的 AI 记忆层”。

简单来说，他们推出了一套基于文件的持久化存储方案，可跨对话保留上下文，能动态更新和优化记忆内容。它试图让 AI 不再是“一次性对话机器”，而是一个具备连续认知能力的系统。

此外，Memvid 还提供了两种使用方式：集成聊天机器人产品（Kora）和面向开发者的工具接口。官方宣称，这套方案不仅能提升回答准确率，还能改善响应延迟和基础设施效率。

最后，回到 Memvid 花 800 美元找“AI 喷子”的操作，其目的显然有两层：一方面：确实指出了行业痛点；另一方面：也是一次非常聪明的营销——用“雇人骂 AI”这种极具传播力的方式，把技术问题变成公众话题，本身就很“互联网”。

据了解，Memvid 这个岗位的招聘将在几周内结束，他们明确表示，希望找到一个“真的不喜欢 AI 的人”。听起来有点讽刺，但背后的逻辑其实很清晰：最真实的批评，往往来自最不买账的人。

与其让工程师在理想环境中测试模型，不如让一个“暴躁用户”在现实语境中不断挑战系统边界。

不少网友也关注到了这个消息，并引起了许多讨论：

那么，你对于这件事又有何看法呢？这场关于大模型能力的极限测试，是揭示了真实的技术瓶颈，还是一场精心策划的营销秀？不妨来云栈社区分享你的观点。

参考链接： https://www.techspot.com/news/111794-job-posting-seeks-human-ai-bully-harass-chatbot.html