本地部署 LLM 的几种实用方案
把大模型放到本地,通常不是为了'更酷',而是为了几件很现实的事:数据别出域、费用可控、响应尽量稳定。真要落地,选型往往比部署本身更费时间。Ollama、OpenLLM、LocalAI 和 Dify 这几套方案,解决的问题不一样,混着用也很常见。
Ollama:上手最快的一种
Ollama 更像是把'跑模型'这件事收敛成了少量命令。对于个人机器、实验环境、快速验证,它省掉了很多容器和脚本层面的麻烦。
安装
官方脚本是最快的入口。如果安装时碰到 error setting certificate verify locations,通常不是 Ollama 本身的问题,而是本机 CA 证书路径没配对。
先把证书路径指过去,再执行安装:
export CURL_CA_BUNDLE=/path/to/cacert.pem
# 示例:export CURL_CA_BUNDLE=/www/anaconda3/ssl/cacert.pem
curl -fsSL https://ollama.com/install.sh | sh
如果你更想把环境握在自己手里,直接装二进制也行:
sudo curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama
接着建系统用户,挂到 systemd 里:
sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama
[Unit]
Description=Ollama Service
After=network-online.target
[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
[Install]
WantedBy=default.target
sudo systemctl daemon-reload
sudo systemctl enable ollama
sudo systemctl start ollama
journalctl -u ollama
离线环境也能做,思路就是先在能联网的机器下载对应架构的安装包,再拷到目标机,后面的步骤不变。
模型存储和监听地址
模型默认落盘位置会因系统不同而变化:
- macOS:
~/.ollama/models - Linux:
/usr/share/ollama/.ollama/models - Windows:


