日薪5500+元的「AI喷子」火了?这家公司找人“专职骂AI”:目标是把它骂崩溃、反复“翻车”_Memvid_记忆_问题
要是有一份工作,要求你一整天对着 AI “挑刺、找茬、刻意刁难”,而且还能拿到日薪800 美元(约合人民币 5521 元),你会不会觉得这像个玩笑?
最近,一家名为 Memvid 的初创公司发布了一则颇具争议的招聘:寻找一名“职业 AI 喷子”,用整整一天时间,对主流聊天机器人进行高强度压力测试,核心任务只有一个——把 AI 的“记忆缺陷”问题彻底暴露出来。
他们提供的报酬也很直接:100 美元一小时,一天 800 美元。
“AI 喷子”这份工作,本质是在做压力测试
过去几年,大模型的进步有目共睹。从代码生成到多轮对话,LLM 在“表达能力”上已经非常接近人类,在很多场景中甚至还表现得更高效。
但问题在于——它们擅长“说”,却不擅长“记”。
相信很多开发者都有类似体验:你刚刚在对话里设定了背景信息,甚至明确给出关键约束条件,但只要对话轮次一多,模型就开始:忘记前文设定、混淆上下文信息、输出自相矛盾的内容……
这种“短期失忆”,本质上并不是 Bug,而是当前大模型架构的天然限制。大模型并没有真正的长期记忆,它只是基于当前的输入窗口进行概率生成,而一旦信息被“挤出窗口”,就相当于彻底消失。
而 Memvid 的这次招聘,其实就是冲着这个老问题去的——AI 的记忆能力几乎是“残缺”的。招聘“职业 AI 喷子”的做法看似在玩梗,实际上 Memvid 是***对 AI 进行一次“压力测试”。
“大多数聊天机器人虽然乍看之下很聪明,但它们往往记不住你之前说过的话,无法理解对话的上下文,还让你不得不一遍又一遍地重复——这就是这份工作的棘手之处。
我们正在招聘一个人,通过整天对聊天机器人的记忆进行压力测试,公开揭露这个问题。”
据招聘页面介绍,这个岗位按小时计费(100 美元/小时),支持远程,为期一天,总报酬 800 美元。而简单来说,这名“职业 AI 喷子”的工作内容就是:让 AI 反复“翻车”。
不断要求 AI 记住某些信息
在后续对话中反复验证
记录 AI 出现混乱、遗忘、答非所问的情况
整理成完整的失败案例报告
某种程度上,这更像是一场公开的、极端条件下的 AI 可用性测试。值得一提的是,这一过程不仅需要手动记录,Memvid 还会全程录像(屏幕+摄像头),确保素材真实可靠。
除此之外,这个岗位还有点“反常识”的要求:不需要任何 AI 专业背景,但必须有丰富的“被技术坑过”的经历;能耐心把同样的问题对AI问四遍(生气也要坚持);对当今 AI 有强烈的不满情绪,最好是那种“一提 AI 就想吐槽”的人。
换句话说,至少对于这个岗位,Memvid 要找的不是专家,而是情绪到位的真实用户:
你将花上一整天的 8 个小时与顶尖 AI 聊天机器人互动——而你的唯一任务,就是毫不留情地指出它们有多令人失望。让 AI 记住一些事情,看着它们忘记,然后再问一次,记录下过程中的混乱。
请尽情地抱怨吧,然后,你就能拿到报酬了。
给 AI 加一个“***大脑”?
至于为什么要公开 AI 的“记忆问题”,Memvid 联合创始人兼 CEO Mohamed Omar 给出的解释很直接:
“一个真正好用的聊天机器人,核心能力就是——持续记住信息并保持对话连贯。”
如他所说,在各种实际应用中,AI 的“记忆能力”直接决定了它的上限:
在编程助手中,忘记上下文 → 代码质量下降
在企业知识库中,无法持续理解语境 → 检索失效
更严重的是,很多被称为“AI 幻觉”的问题,其实并不完全是模型“胡编”,而是因为上下文丢失后被迫重新“猜测”。也就是说,所谓“幻觉”,有一部分本质是“记忆失败”。
因此,Memvid 招聘“职业 AI 喷子”只是第一步,其真正目的是:通过公开 AI 的记忆问题,来推销自家的核心产品——一个“自进化的 AI 记忆层”。
简单来说,他们推出了一套基于文件的持久化存储方案,可跨对话保留上下文,能动态更新和优化记忆内容。它试图让 AI 不再是“一次性对话机器”,而是一个具备连续认知能力的系统。
此外,Memvid 还提供了两种使用方式:集成聊天机器人产品(Kora) 和面向开发者的工具接口。官方宣称,这套方案不仅能提升回答准确率,还能改善响应延迟和基础设施效率。
他们真的在找一个“AI 黑粉”
最后,回到 Memvid 花 800 美元找“AI 喷子”的操作,其目的显然有两层:一方面:确实指出了行业痛点;另一方面:也是一次非常聪明的营销——用“雇人骂 AI”这种极具传播力的方式,把技术问题变成公众话题,本身就很“互联网”。
据了解,Memvid 这个岗位的招聘将在几周内结束,他们明确表示,希望找到一个“真的不喜欢 AI 的人”。听起来有点讽刺,但背后的逻辑其实很清晰:
最真实的批评,往往来自最不买账的人。
与其让工程师在理想环境中测试模型,不如让一个“暴躁用户”在现实语境中不断挑战系统边界。
不少网友也关注到了这个消息,并引起了许多讨论:
“这看起来像个大型广告。他们很可能真的会雇一个人来做这份‘工作’,同时收集其他人的数据,然后再向你推销他们的产品。”
“算我一个,反正我已经在免费做这件事了!”
“一边折磨 AI,一边被拍摄和录音,肯定不会有好结果。”
那么,你对于这件事又有何看法呢?
【活动分享】"48 小时,与 50+ 位大厂技术决策者,共探 AI 落地真路径。"由 CSDN&奇点智能研究院联合举办的「全球机器学习技术大会」正式升级为「奇点智能技术大会」。2026 奇点智能技术大会将于 4 月 17-18 日在上海环球港凯悦酒店正式召开,大会聚焦大模型技术演进、智能体系统工程、OpenClaw 生态实践及 AI 行业落地等十二大专题板块,特邀来自BAT、京东、微软、小红书、美团等头部企业的 50+ 位技术决策者分享实战案例。旨在帮助技术管理者与一线 AI 落地人员规避选型风险、降低试错成本、获取可复用的工程方法论,真正实现 AI 技术的规模化落地与商业价值转化。这不仅是一场技术的盛宴,更是决策者把握 2026 AI 拐点的战略机会。
返回搜狐,查看更多
同类文章排行
- 哪里有免费的电子书下载?
- 如何评价张靓颖刘宇宁《九万字》?
- J***a 除了 Spring 还有什么?
- 有人说x86是条必沉的船,苹果早就跳船了,微软也有弃船的意图,你怎么看?
- 学编程要不要买电脑?
- 怎么评价国内AI企业人肉背15块80TB硬盘,飞去马来西亚用英伟达训练数据,以规避美国禁令?
- 五常的一票否决权,是否存在bug?
- 为什么很多知乎的回答推崇日本式的市区、市郊通勤铁路?
- 为什么韩国的热辣舞团无法征服中国的男性市场??
- 月之暗面 Kimi 首个 Agent 开启内测,可生成易追溯的万字报告,有哪些技术亮点?
最新资讯文章
- 公司老板不想续费3w一年的云服务器,合理吗?
- 如何评价腾讯元宝桌面端使用 Rust 的 Tauri 框架?
- 现在个人博客不能备案了吗?
- 有谁现在正在使用苹果mac mini 吗?能分享一下使用感受不?
- 阿里云为什么没有一年的免费云服务?
- 如何从零开始开发一款独立游戏?
- 平面设计主KV做成这样,在你的城市薪资一般多少?
- 为什么 lua 在游戏开发中应用普遍?
- 为什么 Linux 软件安装包会有依赖关系,而 Windows 软件安装包不需要?
- Golang与Rust哪个语言会是今后的主流?
- 毕设答辩,老师说node不可能写后台怎么办?
- 独立开发***能盈利吗?感觉好累...
- 如何看待M4单核性能吊打9950x?
- 2025 国内公司前端团队都在搞些什么?
- 储存很多文件,是要用云盘还是用硬盘?
- 我弟弟做桌面运维工作的,好像只会简单的数据库增删改查备份恢复和打印机电脑的维护等一年多没工作了咋办?
- 自己拥有一台服务器可以做哪些很酷的事情?
- 小区车位10万一个,租的话一个月300元,还有必要买车位吗?
- 谁是对Mac有成见然后用完Mac后真香的?
- 为什么从事技术的人普遍都比较难沟通?





