林俊旸从阿里离职后首发长文：复盘千问路线受阻，断言AI演进全面转向智能体_思考_模型_推理

发表时间：2026-03-27 09:45:03
来源：

3月27日，前阿里千问技术负责人林俊旸离职后发表长文，明确指出 AI 大模型的发展路线正在经历重大跨越，核心竞争焦点正从“推理型思考（Reasoning Thinking）”全面转向“智能体思考（Agentic Thinking）”。

文章复盘了以 OpenAI o1 和 DeepSeek-R1 为代表的第一***理模型浪潮，指出这标志着行业从扩大预训练规模，正式步入扩大强化学习（RL）后训练规模的新阶段，数学与代码等可验证领域成为优化模型正确性的核心试金石。

林俊旸在文中深度剖析了行业内尝试“融合思考与指令模式”所面临的落地困境。他透露，千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统，但在实际推进中发现，指令模型追求极简与低延迟，而思考模型需要消耗大量 Token 进行复杂推演，两者在数据分布和行为目标上存在根本冲突。若数据筛选不当，强行融合往往会导致模型在两端表现平庸。基于商业客户对高吞吐量和低成本的真实需求，Qwen 在后续的 2507 版本中选择推出了分离的 30B 和 235B 指令与思考变体。与之形成对比的是，Anthropic 和 DeepSeek 等厂商则继续在统合推理与工具调用的混合架构上进行探索。

针对下一阶段的技术演进，林俊旸断言，单纯延长模型内部推理轨迹的时代即将过去，未来的主导将是在与环境交互中持续迭代***的智能体思考。他指出，智能体强化学习（Agentic RL）彻底改变了原有的技术栈要求，训练与推理必须实现更纯粹的解耦。随着大模型获得搜索、代码执行等工具权限，防范奖励***（Reward Hacking）将成为极其危险的挑战。未来的行业护城河将不再局限于算法本身，而是转移至高质量环境设计、防***协议以及多智能体协同编排等系统工程能力上。

来源：凤凰网科技返回搜狐，查看更多

林俊旸从阿里离职后首发长文：复盘千问路线受阻，断言AI演进全面转向智能体_思考_模型_推理

苹果为什么要给每代MacOS起个名字，真以为人们记得住分得清吗？

美国搞出个“稳定币”，到底是什么？其它国家是如何看待稳定币的？

推荐资讯

2025-06-22 15:50:11歼20速度接近3马赫是什么水平？
2025-06-22 15:00:112025年了expo和Flutter学哪个？
2025-06-22 15:50:11为什么有些人认为中国武器装备看起来很土？
2025-06-22 16:00:11有一张巨强的显卡是什么体验？
2025-06-22 14:55:11为什么市面上没有单纯替代屏幕用的头戴显示器？
2025-06-22 15:55:11自己拥有一台服务器可以做哪些很酷的事情？
2025-06-22 16:20:11在韩国生活有什么体验？
2025-06-22 15:35:11新买的移动硬盘该格式化为 NTFS 还是 exFAT？
2025-06-22 16:25:11字节跳动技术副总裁开源了自己与Trae合作的首个项目，如何评价目前AI开发的水平？
2025-06-22 16:15:11程序员都在用什么显示器写代码?

推荐产品

postgres集群的选择?
我们需要谈谈困扰我几个月的事情。我一直看到独立黑客和初创公
伊朗这次会崩溃灭亡吗？
中欧班列通车了，直接到伊朗……15天从西安到德黑兰～每周一趟
***拍大尺度片子时摄影师不会看光吗？
我现在从事服装行业（内衣）。这么说把，现在的***，想接
为什么越来越多的国内男孩，要娶国外女孩?
我老婆和女儿....... 事实上中国男性在外面还是挺受