论文arxiv cs.CL · 2mo ago重要

Domain Adaptation of Large Language Models for Polymer-Composite Additive Manufacturing Using Retrieval-Augmented Generation and Fine-Tuning

分类释义：学术论文 / 技术报告

TL;DR

基于LLaMA-3-8B的实验表明，RAG系统在该增材制造领域任务中显著优于微调：75.5%的RAG回答更准确、85.2%被专家优先选择，而简单微调反而降低性能（仅5.6%更准确）。

关键要点

为什么值得关注

对工程垂直领域的LLM部署有直接指导意义——盲目微调非结构化技术文本可能适得其反，RAG是更可靠的领域适配路径。

LLM 实时生成MiniMax-M2.7缓存命中

角色	你应该做什么
Tech Lead	在做领域LLM选型时，优先评估RAG架构而非直接微调，尤其是涉及非结构化技术文档的场景
应用工程师	在构建领域知识问答或文档处理工具时，采用RAG+向量检索方案，替代直接fine-tuning路线
运维 / 平台	搭建RAG所需的基础设施：向量数据库、文档 chunking 策略、知识库更新流程，而非只准备GPU微调资源
产品 / 业务	向技术团队明确：垂直领域LLM落地的可靠路径是知识库+RAG，而非模型重训练，重新校准预期时间线

阅读原文 ↗来源：arxiv cs.CL