Ollama 本地部署与运行大型语言模型指南 | 极客日志

Shell / BashAI算法

Ollama 本地部署与运行大型语言模型指南

Ollama 是一款专为本地机器设计的大型语言模型部署工具，支持多操作系统。涵盖安装配置、模型管理、API 调用及与 One-API、Open WebUI 的集成方案。内容包括 Linux/macOS/Windows 安装步骤、环境变量设置、GPU 加速配置、命令行操作详解以及 REST API 接口使用示例，并提供常见问题的排查方法。

宁静发布于 2025/2/6更新于 2026/6/219 浏览

Ollama 本地部署与运行大型语言模型指南

概述

Ollama 是一款专为在本地机器上便捷部署和运行大型语言模型（LLM）而设计的工具。它支持 macOS、Linux 和 Windows 多个平台，通过简单的命令行即可拉取并运行各种开源大模型。

官方网站：https://ollama.com/ Github：https://github.com/ollama/ollama

安装

Ollama 支持 macOS、Linux 和 Windows 多个平台运行。

Linux 安装

以 Linux 操作系统为例，使用以下命令直接安装：

root@master:~/work# curl -fsSL https://ollama.com/install.sh | sh

安装过程中会显示下载进度、创建用户、配置 systemd 服务等信息。例如：

>>> Downloading ollama...
>>> Installing ollama to /usr/local/bin...
>>> Creating ollama user...
>>> Adding ollama user to render group...
>>> NVIDIA GPU installed.

macOS 安装

macOS 用户可以通过 Homebrew 或官方安装包进行安装：

# 使用 Homebrew
brew install ollama

# 或使用官方安装包
curl -fsSL https://ollama.com/install.sh | sh

Windows 安装

Windows 用户可直接访问官网下载安装程序，或在 PowerShell 中执行：

irm https://ollama.com/install.ps1 | iex

Docker 安装

Docker Hub 上提供了官方镜像，适合容器化部署环境：

docker pull ollama/ollama
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

配置

安装成功后，可以通过编辑 vim /etc/systemd/system/ollama.service 文件来对 Ollama 进行配置。

1. 更改 HOST

由于 Ollama 的默认参数配置，启动时设置了仅本地访问。若需开启远程访问，需配置 HOST 监听任何来源 IP：

[Service]
Environment="OLLAMA_HOST=0.0.0.0"

2. 更改模型存储路径

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

[Service]
Environment="OLLAMA_MODELS=/data/ollama/models"

chown ollama:ollama /data/ollama/models

journalctl -u ollama

Environment="CUDA_VISIBLE_DEVICES=0,1"

systemctl daemon-reload
systemctl restart ollama

root@master:~# ollama
Usage:
  ollama [flags]
  ollama [command]

Available Commands:
  serve       Start ollama
  create      Create a model from a Modelfile
  show        Show information for a model
  run         Run a model
  pull        Pull a model from a registry
  push        Push a model to a registry
  list        List models
  ps          List running models
  cp          Copy a model
  rm          Remove a model
  help        Help about any command

root@master:~# ollama pull llama3:8b
pulling manifest 
pulling 00e1317cbf74... 100%
verifying sha256 digest 
writing manifest 
success

root@master:~# ollama list
NAME            ID              SIZE    MODIFIED      
llama3:8b       a6990ed6be41    4.7 GB  3 minutes ago

root@master:~# ollama run llama3:8b
>>> hi
Hi! How's your day going so far? I'm here to chat and help with any questions or topics you'd like to discuss. What's on your mind?

FROM ./Llama3-FP16.gguf

ollama create llama3 -f Modelfile

ollama run llama3

FROM llama3

# 设置温度参数
PARAMETER temperature 1

# 设置 SYSTEM 消息
SYSTEM """
作为 AI 智能助手，你将竭尽所能为员工提供严谨和有帮助的答复。
"""

curl http://IP:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "你好啊",
  "stream": false
}'

curl http://IP:11434/api/chat -d '{
  "model": "llama3",
  "messages": [
    {
      "role": "system",
      "content": "你是一个乐于助人的 AI 助手。"
    },
    {
      "role": "user",
      "content": "你好啊"
    }
  ],
  "stream": false
}'

拉取镜像：
```
docker pull justsong/one-api
```
创建挂载目录：
```
mkdir -p /usr/local/docker/oneapi
```

启动容器：

docker run --name one-api -d --restart always -p 3001:3000 -e TZ=Asia/Shanghai -v /usr/local/docker/oneapi:/data justsong/one-api

访问 IP:3001，初始账号用户名为 root，密码为 123456。

默认配置安装（计算机上有 Ollama）：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

Ollama 位于不同的服务器：

docker run -d -p 3000:8080 -e OLLAMA_BASE_URL=https://example.com -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

支持 Nvidia GPU：

docker run -d -p 3000:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda

捆绑 Ollama 支持：

docker run -d -p 3000:8080 --gpus=all -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama

systemctl stop ollama
systemctl disable ollama

rm /etc/systemd/system/ollama.service
rm $(which ollama)

rm -r /usr/share/ollama
userdel ollama
groupdel ollama

rm -rf /usr/share/ollama/.ollama/models

Ollama 本地部署与运行大型语言模型指南

Ollama 本地部署与运行大型语言模型指南

概述

安装

Linux 安装

macOS 安装

Windows 安装

Docker 安装

配置

1. 更改 HOST

2. 更改模型存储路径

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 更改运行 GPU

4. 应用配置

5. 访问测试

Ollama 命令

模型库

使用示例

下载模型

查看模型

运行模型并进行对话

自定义模型

从 GGUF 导入

自定义提示

从 PyTorch 或 Safetensors 导入

开启服务与 API

REST API

1. 生成回复

2. 与模型聊天

扩展集成

One-API

部署步骤

管理本地模型

Open WebUI

Docker 部署

配置

常见问题排查

卸载 Ollama

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具