Ollama 本地大模型部署与使用指南 | 极客日志

编程语言AI算法

Ollama 本地大模型部署与使用指南

综述由AI生成Ollama 是一款支持在本地运行大型语言模型的开源工具，兼容 Linux、Windows 和 macOS 系统。 Ollama 的安装方法、常用命令、硬件配置要求及自定义模型文件 ModelFile 的配置方式。同时涵盖了 Web UI 交互工具的使用、API 接口调用以及日志调试技巧，帮助用户快速搭建私有化大模型环境并进行高效开发。

imJackJia发布于 2025/2/6更新于 2026/5/3120 浏览

Ollama 本地大模型部署与使用指南

1. Ollama 简介

Ollama 是一个开源工具，旨在让开发者能够在本地机器上轻松运行大型语言模型（LLM）。它支持 Linux、Windows 和 macOS 操作系统，通过一行命令即可启动服务。Ollama 简化了模型的管理、下载和推理过程，使得私有化部署 AI 模型变得更加便捷。

2. 安装部署

2.1 macOS 系统

推荐使用 Homebrew 进行安装：

brew install ollama

安装完成后，直接运行 ollama serve 启动服务，或者在后台运行：

ollama serve &

2.2 Linux 系统

Linux 用户可以使用官方提供的安装脚本：

curl -fsSL https://ollama.com/install.sh | sh

安装后，服务通常会自动配置为 systemd 服务并开机自启。如果未自动启动，可手动执行：

sudo systemctl enable ollama
sudo systemctl start ollama

2.3 Windows 系统

Windows 用户可以直接访问官网下载 .exe 安装包，双击运行即可。安装程序会自动创建桌面快捷方式并在后台启动服务。

2.4 Docker 部署

对于容器化环境，可以使用官方 Docker 镜像：

docker pull ollama/ollama
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

3. 常用命令与模型管理

3.1 拉取模型

使用 pull 命令从 Ollama 库中下载模型：

ollama pull llama3.1
ollama pull mistral
ollama pull phi3

3.2 运行模型

使用 run 命令启动交互式对话：

ollama run llama3.1

在终端中输入提示词，模型将实时生成回复。

3.3 删除模型

清理不再需要的模型以释放磁盘空间：

ollama rm llama3.1

3.4 列出已安装模型

查看本地已下载的模型列表：

ollama list

4. 硬件配置要求

不同规模的模型对本地硬件资源有不同的需求。以下是常见模型的参数及体积参考：

Model (大模型)	Parameters (参数量)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

FROM llama3.1
SYSTEM "你是一个专业的编程助手，请用简洁的语言回答代码问题。"
PARAMETER temperature 0.7
PARAMETER top_p 0.9

ollama create my-custom-model -f Modelfile

ollama run my-custom-model

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui ghcr.io/open-webui/open-webui:main

curl http://localhost:11434/api/generate -d '{
  "model": "llama3.1",
  "prompt": "为什么天空是蓝色的？",
  "stream": false
}'

curl http://localhost:11434/api/chat -d '{
  "model": "llama3.1",
  "messages": [
    {"role": "user", "content": "你好"}
  ]
}'

import requests

response = requests.post(
    'http://localhost:11434/api/generate',
    json={
        'model': 'llama3.1',
        'prompt': '请解释一下什么是人工智能',
        'stream': False
    }
)
print(response.json()['response'])

OLLAMA_DEBUG=true ollama serve

lsof -i :11434

Llama 3.1	8B	4.7GB	ollama run llama3.1
Llama 3.1	70B	40GB	ollama run llama3.1:70b
Llama 3.1	405B	231GB	ollama run llama3.1:405b
Phi 3 Mini	3.8B	2.3GB	ollama run phi3
Phi 3 Medium	14B	7.9GB	ollama run phi3:medium
Gemma 2	2B	1.6GB	ollama run gemma2:2b
Gemma 2	9B	5.5GB	ollama run gemma2
Gemma 2	27B	16GB	ollama run gemma2:27b
Mistral	7B	4.1GB	ollama run mistral
Moondream 2	1.4B	829MB	ollama run moondream
Neural Chat	7B	4.1GB	ollama run neural-chat
Starling	7B	4.1GB	ollama run starling-lm
Code Llama	7B	3.8GB	ollama run codellama
LLaVA	7B	4.5GB	ollama run llava
Solar	10.7B	6.1GB	ollama run solar

Ollama 本地大模型部署与使用指南

Ollama 本地大模型部署与使用指南

1. Ollama 简介

2. 安装部署

2.1 macOS 系统

2.2 Linux 系统

2.3 Windows 系统

2.4 Docker 部署

3. 常用命令与模型管理

3.1 拉取模型

3.2 运行模型

3.3 删除模型

3.4 列出已安装模型

4. 硬件配置要求

更多推荐文章

相关免费在线工具

5. ModelFile 自定义配置

5.1 基本结构

5.2 关键参数说明

5.3 构建自定义模型

6. Web UI 交互工具

6.1 Ollama WebUI

6.2 Open WebUI

7. API 接口调用

7.1 生成文本

7.2 聊天对话

7.3 Python 调用示例

8. 日志与调试

8.1 查看日志

8.2 开启 Debug 模式

9. 常见问题排查

9.1 服务无法启动

9.2 模型加载失败

9.3 性能优化

10. 总结

更多推荐文章

相关免费在线工具

Ollama 本地大模型部署与使用指南

Ollama 本地大模型部署与使用指南

1. Ollama 简介

2. 安装部署

2.1 macOS 系统

2.2 Linux 系统

2.3 Windows 系统

2.4 Docker 部署

3. 常用命令与模型管理

3.1 拉取模型

3.2 运行模型

3.3 删除模型

3.4 列出已安装模型

4. 硬件配置要求

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

5. ModelFile 自定义配置

5.1 基本结构

5.2 关键参数说明

5.3 构建自定义模型

6. Web UI 交互工具

6.1 Ollama WebUI

6.2 Open WebUI

7. API 接口调用

7.1 生成文本

7.2 聊天对话

7.3 Python 调用示例

8. 日志与调试

8.1 查看日志

8.2 开启 Debug 模式

9. 常见问题排查

9.1 服务无法启动

9.2 模型加载失败

9.3 性能优化

10. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具