https://github.com/ggerganov/llama.cpp
llama.cpp是Facebook的LLaMA模型的C/C++版本。该项目的目标是在MacBook上使用4位整数量化运行LLaMA模型,并且支持多种平台和模型。文章还提供了使用llama.cpp的详细步骤和使用指南。