ggerganov/

llama.cpp

LLM inference in C/C++.

79k11k forksC++· 分析于 4w ago
一句话定位

本地跑大模型的发动机。GGUF 格式背后的引擎,从 Mac Studio 到 Raspberry Pi 都能塞下一只 7B。

判断
实用

学习价值高、生产用 ollama 包它更稳。

在合适的场景下值得直接采用,但不是普适必装。

30 秒上手

基于语言推断的标准命令
$ git clone https://github.com/ggerganov/llama.cpp && cd llama.cpp && cmake -B build && cmake --build build

本地编译

最适合的 3 个场景
  • 1笔记本本地推理,无网/隐私场景
  • 2评估一个新开源模型能否在你的硬件上跑
  • 3做边缘部署的底层基建
同类对比
vsvllm(GPU/服务端)
vsollama(包装得更好用)

完整对比报告(含矩阵评分)即将上线,订阅后第一时间收到。

值得追的健康信号

每周 LLM 自动巡检
总 Star
79k
Forks
11k
语言
C++
分析时间
4w ago
x
作者短评

符合「能用就用、不能用就放着」的标准。先收藏,等你下次遇到对应场景再 deep dive 不迟。

— xaikey · 基于 LLM 分析 + 个人判断
Topics
llminferenceggmllocal-llm

其他 C++ 趋势仓库

本页 LLM 分析由 MiniMax-M2.7 / Claude Haiku 4.5 等模型生成 · 不构成生产环境技术选型建议