Claude会「做梦」了,梦里还在卷_Agents_记忆_工作
闻乐 发自 凹非寺
量子位 | 公众号 QbitAI
Claude开始做梦了。
人有时候白天想不通的事,睡一觉起来就突然明白了。
现在,Claude也学会了这招。Anthropic旗下Claude Managed Agents,上线了一项新功能,Dreaming——
让AI在工作间隙“睡觉”反思,清理记忆、总结规律、甚至自我升级。
说白了,就是AI的睡眠整理术。
Claude Code泄露源码里的Dreaming函数,现在终于知道是啥了(doge)。
Claude的「梦」,到底在做什么
咱和AI聊天的时候,每次对话它都会往记忆库里塞内容,时间长了,记忆库就变成了杂货铺。
重复的、过时的、没用的全堆在一起,AI自己都分不清该用哪个。
结果就是AI越来越慢、越来越不准。
Claude这次推出的Dreaming,就是要解决这个问题。
它是一段在对话间隙悄悄运行的异步任务,而且是跨智能体集体反思。
Dreaming会自动读取记忆库和最多100条历史会话,然后开始干三件事:
第一,合并重复,清理噪音。
把大同小异的记忆条目合并,删掉记忆库里无用的冗余信息。
第二,替换旧内容,更新知识。
第三,交叉分析,挖掘规律。
单个Agent看自己的经历看不出啥,但把多个Agent的历史放在一起对照,就能挖出单AI发现不了的隐藏模式。
比如反复出现的错误、多个Agent最终收敛的最优工作流、整个团队统一的偏好习惯。
Dreaming的设计也比较安全可控,它不修改原始记忆数据,所有整理、优化后的结果,都会输出到一个全新的记忆库。
也就是说,你对“梦境”不满意直接删掉这个新库就行,也不会影响原有数据。
Anthropic官方是这么说的:
Memory是工作时当场记住学到的东西;
Dreaming是工作间隙想明白这些经验意味着什么。
一个是即时学习,一个是深度反思,这和人类睡觉时,大脑自动整理白天记忆、沉淀经验、强化技能的逻辑几乎一样。
目前Dreaming还处于研究预览阶段,但也有公司已经尝鲜了。
法律科技公司Harvey接入Dreaming后,表示其长文法律文书起草的完成率涨了大约6倍;写作工具Spiral用Dreaming记住用户的个人风格偏好,配合多Agent协作,内容越写越对味。
三件套齐发
当然了,这次Claude Managed Agents更新,也不只是做梦。
在Dreaming之外,还有Outcomes、多智能体编排功能,这两个已经进入了公开测试阶段。
Outcomes可以看成是AI的自我质检员。
思路很简单:你先写一份评分标准,AI干完活后,一个独立的Grader Agent在隔离的上下文窗口里对着标准打分。
这个打分AI不受执行AI的干扰,不达标就指出问题,执行AI会自动修改,直到合格。
内部测试数据显示,Outcomes能让任务成功率最高提升10个百分点,docx文件生成质量提升8.4%,pptx提升10.1%,对细节要求高、主观标准强的任务,效果尤其明显。
多智能体编排则是让AI组团干活,一个Lead Agent当队长,把复杂任务拆成几块,分给不同的Specialist Agent并行处理。
每个Specialist可以是不同的模型、不同的prompt、不同的工具集,上下文互相隔离但共享文件系统。
Lead Agent可以随时找之前调过的Agent继续聊,对方还记得上次做了什么。
Netflix已经实践过,平台工程团队用它并行分析几百个build的日志,多个Agent各扫各的批次,最后只浮出反复出现的问题模式,一次性噪音全被过滤掉了。
这三个功能合在一起,其实解决的是同一件事——
让AI不用人盯着,也能独立完成复杂工作。
再加上和SpaceX合作拿到Colossus 1数据中心全部算力***、Pro和Max用户的Claude Code调用限额翻倍……也能看出Anthropic正在搭建的是一整套AI自主工作的基础设施。
创始人Dario Amodei还在Code with Claude大会上放了个预测:
首家由一人+AI运营、估值达到10亿美金的公司,将在2026年诞生。
未来一个人做成10亿美金公司不再是梦,或许这个10亿美金公司,得先从Claude做个好梦开始…
参考链接:
[2]***s://claude***/blog/new-in-claude-managed-agents
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完—
5月20日,我们将在北京金茂万丽酒店举办一年一度的中国AIGC产业峰会。
首波嘉宾阵容已公布!昆仑万维方汉、智谱吴玮杰、EverMind邓亚峰、风行在线易正朝、百度秒哒朱广翔、Fusion Fund张璐、香港大学黄超、MarsW***e冯雷
请你和我们一起,不再只是讨论AI的未来,而是现在就用起来。👉 返回搜狐,查看更多
同类文章排行
- 中餐炒菜那么好吃,为什么欧美人不学去?
- 国家为什么特别青睐雷军?
- 中医把脉是***吗?
- 在哪一瞬间,你意识到那个人不能深交?
- 如何看待不超过1879元的Mac mini(M4+16/256GB+票),易用性吊打同级其他台式电脑?
- 为什么Rust的包管理器Cargo这么好用?
- 百度网盘怎么实现不限速的高速下载?
- Electron 和当下其他的桌面开发方法相比如何?
- 你相亲被恶心过么??
- 如何评价电影《碟中谍8:最后清算》?
最新资讯文章
- 高校里那些「非升即走」后「走」了的青年教师都怎么样了?
- Jetpack Compose 和 Flutter 应该先学哪个呢?
- C++ 中的左值、右值、左值引用、右值引用、引用分别是什么,有哪些关系?
- 游戏服务器程序何去何从?
- obsidian用一两年后会有多大?全文搜索还快吗?
- 为什么剪映是剪辑软件鄙视链的最底层?
- 编程语言 MoonBit 发布 Beta 版,正式进入企业场景应用,会带来哪些影响?
- 如果北京放开车牌,未来会怎样?
- ***拍大尺度片子时摄影师不会看光吗?
- 有个漂亮女朋友是种怎样的体验?
- 你理想中的完美户型长什么样?
- 女主播和榜一大哥现实碰面会做什么?
- 据说Rust和WASM可以让J***ascript变得更强,有值得推荐的项目吗?
- 美国***下令美使领馆暂停留学生新签证面谈,将带来哪些影响?美国大学在全球人才竞争中还有优势吗?
- 大一计算机新生怎么合理利用github?
- 陌生人晕倒了,帮他拨打120后,病人不支付120出车费,这个费用谁来承担?
- 比亚迪最近绩效减半,这是卸磨杀驴么?
- 为什么大部分人都认为2560x1440是2K?
- 微软暂停专用 Xbox 掌机开发,转而优化 Windows 11 的掌机游戏体验,这背后原因有哪些?
- 邻居家小孩来敲门问WiFi密码,告诉他之后,他竟然几部手机电视全用上。你说该怎么办?





