Ollama 简介
Ollama 是一个开源项目,专为在本地运行、管理和部署大型语言模型(如 Llama 3、Mistral、Gemma 等)而设计。
核心优势:
- 简单易用:通过简单的命令行工具,即可完成模型的下载(pull)、运行(run)和管理。
- 丰富的模型库:提供官方支持的模型库,包含 deep-seek、qwen 等数十种经过优化的大型语言模型。
- '开箱即用':自动处理模型运行所需的大部分复杂配置和环境依赖。
本地部署语言模型的优势与局限
优势
- 数据隐私与安全:所有对话提示和生成内容完全在本地处理。
- 完全离线可用:无需依赖互联网连接或担心 API 服务宕机。
- 可定制性:可尝试不同规模和专长的模型,支持自定义模型文件。
- 无使用成本:除硬件成本外,无按次收费或订阅费用。
局限
- 硬件要求高:对内存(RAM)和显存(VRAM)有较高要求。
- 性能差异:响应速度和能力通常无法与顶级付费 API 相提并论。
- 知识陈旧:知识库是静态的,取决于训练时间点。
环境准备
设备信息检查
lsb_release -a
检查存储空间及显存大小
- 储存空间至少预留十几 G,因为一个模型的大小都在几个 G 左右。
- 检查显存大小,显存大小决定了能运行模型的参数量。
nvidia-smi
Ollama 下载与安装
1. 下载链接
2. 运行安装脚本
curl -fsSL https://ollama.com/install.sh | sh
3. 管理 Ollama 服务
# 启动 Ollama 服务
sudo systemctl start ollama
# 停止 Ollama 服务
sudo systemctl stop ollama
# 重启 Ollama 服务
sudo systemctl restart ollama
# 设置开机自启
sudo systemctl enable ollama
# 查看服务日志
sudo journalctl -u ollama -f
4. 常用 Ollama 命令
# 查看所有命令帮助
ollama --
ollama run <model-name>
ollama run <model-name>
ollama pull <model-name>
ollama list
ollama <model-name>
ollama show llama3
ollama show llama3 --modelfile



