论文arxiv cs.CL · 1w ago重要

The Scaling Laws of Skills in LLM Agent Systems

分类释义:学术论文 / 技术报告

TL;DR

研究分析了15个前沿模型在1141个技能、300万次决策中的表现,发现路由准确率随技能库规模对数衰减,错误会逐渐被过于通用的“黑洞技能”捕获。

关键要点

  • 01研究分析了15个前沿模型在1141个技能、300万次决策中的表现
  • 02发现路由准确率随技能库规模对数衰减
  • 03错误会逐渐被过于通用的“黑洞技能”捕获
为什么值得关注

揭示了智能体系统性能不仅取决于模型能力,还受技能库结构和粒度的影响,为优化AI Agent设计提供了可操作的定律指导。

对你的工程实践意味着什么

LLM 实时生成MiniMax-M2.7缓存命中
角色你应该做什么
Tech Lead在系统架构评审时加入技能库规模评估指标,设定技能数量上限阈值避免路由准确率衰减到不可接受范围
应用工程师设计技能时优先采用细粒度划分,避免创建覆盖范围过大的"黑洞技能",每个技能控制在明确的领域边界内
运维/平台监控技能路由的准确率指标,当库规模扩展时及时触发告警,为技能库增长预留容量规划
产品/业务暂无直接影响,了解即可
阅读原文 ↗来源:arxiv cs.CL

同类资讯

本页 TL;DR 与「为什么」由 LLM 生成 · 模型:MiniMax-M2.7 / Claude Haiku 4.5