林俊旸从阿里离职后首发长文:复盘千问路线受阻,断言AI演进全面转向智能体_思考_模型_推理
3月27日,前阿里千问技术负责人林俊旸离职后发表长文,明确指出 AI 大模型的发展路线正在经历重大跨越,核心竞争焦点正从“推理型思考(Reasoning Thinking)”全面转向“智能体思考(Agentic Thinking)”。
文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一***理模型浪潮,指出这标志着行业从扩大预训练规模,正式步入扩大强化学习(RL)后训练规模的新阶段,数学与代码等可验证领域成为优化模型正确性的核心试金石。
林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他透露,千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量 Token 进行复杂推演,两者在数据分布和行为目标上存在根本冲突。若数据筛选不当,强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求,Qwen 在后续的 2507 版本中选择推出了分离的 30B 和 235B 指令与思考变体。与之形成对比的是,Anthropic 和 DeepSeek 等厂商则继续在统合推理与工具调用的混合架构上进行探索。
针对下一阶段的技术演进,林俊旸断言,单纯延长模型内部推理轨迹的时代即将过去,未来的主导将是在与环境交互中持续迭代***的智能体思考。他指出,智能体强化学习(Agentic RL)彻底改变了原有的技术栈要求,训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限,防范奖励***(Reward Hacking)将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身,而是转移至高质量环境设计、防***协议以及多智能体协同编排等系统工程能力上。
来源:凤凰网科技返回搜狐,查看更多
同类文章排行
- Avalonia UI和Electron哪个性能高?
- 为什么香港艺人不显老?
- 养了近十年的草龟要不要放生?
- 为什么上海、宁波那么近要搞两个港口?不会恶性竞争么?
- 毕设答辩,老师说node不可能写后台怎么办?
- 如何看待时下被部分网民力推的“双输好过单输”观念?
- 以色列为什么突然敢打伊朗了?不怕被报复?
- 脸与身材不符是种怎样的体验?
- 在韩国生活有什么体验?
- 腾讯开源的 libco 号称千万级协程支持,那个共享栈模式原理是什么?
最新资讯文章
- 海贼王为什么现在被全网黑?
- 今年西瓜收购价只有 2 毛一斤,有瓜农把西瓜扔池塘,现在超市西瓜仍几元一斤,为何会这样?
- 程序员空闲时间应该继续卷技术,还是找其他副业?
- 战场上用沙袋来防***,真的有用吗?
- 能分享一下你写过的rust项目吗?
- NAS的盘是否需要一次性买齐?
- 手机的运行内存真的有必要上16GB吗?
- 陈楚生第一,马嘉祺淘汰,如何评价《歌手 2025》第六期所有歌手的演唱?
- 如何评价综艺《心动的信号》第七季?
- 曼德拉是南非的罪人吗?
- 程序中提升几毫秒、节省几 kB 的内存有必要吗?
- 为何一讨论Wi-Fi 7阉割6GHz+320MHz,很多人都说用不上所以根本不在意?
- 如何评价“寡姐”斯嘉丽·约翰逊的身材?
- 你看过哪些以为是段子新闻,结果发现居然是真的?
- 你看过哪些以为是段子新闻,结果发现居然是真的?
- 为什么魔兽争霸3比赛中几乎见不到吃尸体补血的技能?
- 为什么人类没有发现(公开)外星人?
- 想知道德普怎么看上艾梅柏·希尔德的?
- 微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?
- 现在的年轻人喜欢穿连裤袜吗?





