论文arxiv cs.CL · 2mo ago重要

The Scaling Laws of Skills in LLM Agent Systems

分类释义：学术论文 / 技术报告

TL;DR

研究分析了15个前沿模型在1141个技能、300万次决策中的表现，发现路由准确率随技能库规模对数衰减，错误会逐渐被过于通用的“黑洞技能”捕获。

关键要点

为什么值得关注

揭示了智能体系统性能不仅取决于模型能力，还受技能库结构和粒度的影响，为优化AI Agent设计提供了可操作的定律指导。

LLM 实时生成MiniMax-M2.7缓存命中

角色	你应该做什么
Tech Lead	在系统架构评审时加入技能库规模评估指标，设定技能数量上限阈值避免路由准确率衰减到不可接受范围
应用工程师	设计技能时优先采用细粒度划分，避免创建覆盖范围过大的"黑洞技能"，每个技能控制在明确的领域边界内
运维/平台	监控技能路由的准确率指标，当库规模扩展时及时触发告警，为技能库增长预留容量规划
产品/业务	暂无直接影响，了解即可

阅读原文 ↗来源：arxiv cs.CL