LocalAI：开源本地化 AI 推理引擎，支持 CPU 运行大模型

LocalAI 是一个开源的本地 AI 推理引擎，可作为 OpenAI、ElevenLabs、Anthropic 等商业 API 的替代方案。它允许用户在消费级硬件（甚至无需 GPU）上本地运行以下任务：

零依赖 GPU 通过量化技术和高效后端（如 llama.cpp），在 CPU 上流畅运行 7B 参数级模型。
全栈多模态支持
- 文本：LLaMA、vLLM、Transformers
- 语音：Whisper、Coqui、Bark
- 图像：Stable Diffusion、Diffusers
- 高级功能：视觉问答、目标检测、文档重排序
开箱即用的兼容性 完全兼容 OpenAI API 规范，现有应用无需修改即可迁移。
跨平台支持
- CPU/GPU 镜像（NVIDIA CUDA、AMD ROCm、Intel oneAPI）
- macOS/Linux/Windows 原生应用
- Docker/Kubernetes 容器化部署

curl https://localai.io/install.sh | sh

local-ai run llama-3.2-1b-instruct:q4_k_m

local-ai start

或使用 Docker 一键运行：

docker run -p 8080:8080 localai/localai:latest

访问 http://localhost:8080 即可使用内置 WebUI 聊天、绘图、语音合成！

LocalAI 通过模块化后端支持 50+ 模型架构：

任务类型	支持后端	加速方案
文本生成	llama.cpp, vLLM, MLX（苹果芯片）	CUDA/ROCm/Metal
语音识别	Whisper.cpp, faster-whisper	多语言转录
图像生成	stablediffusion.cpp, Diffusers	Vulkan/Intel SYCL
目标检测	rf-detr	实时物体识别

更多推荐文章