跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
Shell / BashAI算法

Ollama 本地部署教程:Windows/Linux/Mac 安装与使用指南

Ollama 在 Windows、Linux 和 MacOS 上的本地部署方法,涵盖脚本安装、二进制安装及系统服务配置。内容包含基础命令使用、自定义模型路径设置、HuggingFace 模型导入以及常见问题排查。通过本教程,开发者可快速搭建本地大模型环境,实现离线运行与个性化配置。

安卓系统发布于 2025/2/7更新于 2026/6/1126 浏览
Ollama 本地部署教程:Windows/Linux/Mac 安装与使用指南

Ollama 本地部署教程

一、Ollama 介绍

1.1 基本介绍

Ollama 是一个支持在 Windows、Linux 和 MacOS 上本地运行大语言模型的工具。它允许用户非常方便地运行和使用各种大语言模型,比如 Qwen 模型等。用户只需一行命令就可以启动模型。

主要特点包括:

  1. 跨平台支持:兼容 Windows、Linux、MacOS 系统。
  2. 丰富的模型库:包括 Qwen、Llama 等 1700+ 大语言模型,可以在官网 model library 中直接下载使用。
  3. 自定义模型导入:支持用户上传自己的模型。用户可以将 huggingface 等地的 ggml 格式模型导入到 ollama 中使用。也可以将基于 pytorch 等格式的模型转换为 ggml 格式后导入。
  4. 参数配置:允许用户通过编写 modelfile 配置文件来自定义模型的推理参数,如 temperature、top_p 等,从而调节模型生成效果。
  5. 多 GPU 加速:支持多 GPU 并行推理加速。在多卡环境下,可以设置环境变量来指定特定 GPU。
  6. 社区支持:强大的技术团队支持,很多模型开源不到 24 小时就能获得支持。

总的来说,Ollama 降低了普通开发者使用大语言模型的门槛,使得本地部署体验大模型变得简单易行。对于想要搭建自己的 AI 应用,或者针对特定任务调优模型的开发者来说,是一个非常有用的工具。

二、系统安装

2.1 Windows 安装

直接从下载页面下载相对应系统的安装程序,选择 Download for Windows(Preview)。

下载好以后一路 install 安装即可。安装完成之后,打开一个 cmd 命令窗口,输入 ollama 命令,如果显示 ollama 相关的信息就证明安装已经成功了。

2.2 Mac 安装

直接从下载页面下载相对应系统的安装程序,点击 Download for Mac。

下载好后打开安装命令行,按照提示完成安装。

2.3 Linux 安装

在 Linux 系统上,可以通过脚本安装或源码编译的方式来安装 Ollama。

2.3.1 脚本安装

Ollama 提供了一键安装脚本,可以快速在 Linux 系统上安装 Ollama。安装步骤如下:

打开终端,执行以下命令下载安装脚本:

curl -fsSL https://ollama.com/install.sh | sh

等待安装完成。安装脚本会自动下载所需的组件,并完成 Ollama 的安装与配置。

安装完成后,可以通过以下命令启动 Ollama:

ollama serve
2.3.2 二进制安装

将 Ollama 的二进制文件下载到 PATH 中的目录:

sudo curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

将 Ollama 添加为自启动服务,首先,为 Ollama 创建用户:

sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama

然后在该位置 /etc/systemd/system/ollama.service 创建服务文件:

[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3

[Install]
WantedBy=default.target

设置开机自启动:

sudo systemctl daemon-reload
sudo systemctl enable ollama

启动 Ollama,使用以下命令启动 systemd:

sudo systemctl start ollama
2.3.3 安装特定版本

设置 OLLAMA_VERSION 字段,可以安装对应的版本:

curl -fsSL https://ollama.com/install.sh | OLLAMA_VERSION=0.3.13 sh
2.3.4 更新与卸载

更新:通过 shell 脚本更新 Ollama:

curl -fsSL https://ollama.com/install.sh | sh

或者下载 Ollama 二进制文件覆盖。

卸载:

  • 删除 Ollama 服务:
sudo systemctl stop ollama
sudo systemctl disable ollama
sudo rm /etc/systemd/system/ollama.service
  • 从 bin 目录中删除 Ollama 二进制文件:
sudo rm $(which ollama)
  • 删除下载的模型和 Ollama 服务用户和组:
sudo rm -r /usr/share/ollama
sudo userdel ollama
sudo groupdel ollama

三、常用交互命令

以下是 Ollama 使用常见的指令:

ollama serve         # 启动 ollama
ollama create        # 从模型文件创建模型
ollama show          # 显示模型信息
ollama run           # 运行模型
ollama pull          # 从注册表中拉取模型
ollama push          # 将模型推送到注册表
ollama list          # 列出模型
ollama cp            # 复制模型
ollama rm            # 删除模型
ollama help          # 获取有关任何命令的帮助信息

3.1 运行模型

拉取并运行一个模型(例如 llama3):

ollama run llama3

这将自动下载模型并在终端进入对话模式。你可以直接输入问题,模型会进行回答。

3.2 自定义 Prompt

在运行模型时,可以通过 -p 参数传递系统提示词:

ollama run llama3 -p "你是一个专业的编程助手,请用 Python 解释这段代码..."

3.3 查看模型列表

列出已下载的模型及其大小:

ollama list

四、设置自定义模型下载路径

默认情况下,ollama 模型的存储目录如下:

  • macOS: ~/.ollama/models
  • Linux: /usr/share/ollama/.ollama/models
  • Windows: C:\Users\<username>\.ollama\models

4.1 Windows 更改 Ollama 模型存放位置

在 Windows 系统中,若要更改 Ollama 模型的存放位置,可以按照以下步骤操作:

  1. 打开环境变量编辑界面。右键点击'此电脑'或'我的电脑',选择'属性'。
  2. 在系统窗口中选择'高级系统设置',在系统属性窗口中点击'环境变量'按钮。
  3. 在环境变量窗口中,点击'新建'创建一个新的系统变量或用户变量。
    • 变量名:OLLAMA_MODELS
    • 变量值:输入你希望设置的新模型存放路径,例如:D:\Ollama\Models
  4. 点击'确定'保存设置。
  5. 重启任何已经打开的 Ollama 相关应用程序,以便新的路径生效。

4.2 Linux/Mac 更改 Ollama 模型存放位置

在 Linux 或 Mac 系统中,更改 Ollama 模型存放位置的步骤如下:

  1. 打开终端。
  2. 创建一个新的目录作为模型存放位置:
mkdir -p /path/to/your/new/ollama/models
  1. 设置环境变量。在 Linux 系统中,可以通过编辑 ~/.bashrc 或 ~/.bash_profile 文件。在 Mac 系统中,可以通过编辑 ~/.zshrc 文件。
nano ~/.bashrc
  1. 在文件末尾添加以下行来设置 OLLAMA_MODELS 环境变量:
export OLLAMA_MODELS="/path/to/your/new/ollama/models"
  1. 保存并关闭文件。使环境变量生效:
source ~/.bashrc
  1. 重启任何已经打开的 Ollama 相关应用程序,以便新的路径生效。

五、导入 Hugging Face 模型

Ollama 从最新版 0.3.13 开始支持从 Huggingface Hub 上直接拉取各种模型,包括社区创建的 GGUF 量化模型。用户可以通过简单的命令行指令快速运行这些模型。

可以使用如下命令:

ollama run hf.co/{username}/{repository}

请注意,您可以使用 hf.co 或 huggingface.co 作为域名。

要选择不同的量化方案,只需在命令中添加一个标签:

ollama run hf.co/{username}/{repository}:{quantization}

例如:

ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:IQ3_M
ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:Q8_0

量化名称不区分大小写,因此以下命令同样有效:

ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:iq3_m

您还可以直接使用完整的文件名作为标签:

ollama run hf.co/bartowski/Llama-3.2-3B-Instruct-GGUF:Llama-3.2-3B-Instruct-IQ3_M.gguf

六、常见问题排查

6.1 查看日志

查看作为启动服务运行的 Ollama 的日志:

journalctl -e -u ollama

6.2 显存不足

如果遇到显存不足的问题,可以尝试使用更小参数的模型(如 3B 或 7B 版本),或者调整量化等级(如使用 Q4_K_M)。

6.3 无法连接网络

部分模型需要从 Hugging Face 下载,如果网络受限,可能需要配置代理或使用国内镜像源(如果可用)。

目录

  1. Ollama 本地部署教程
  2. 一、Ollama 介绍
  3. 1.1 基本介绍
  4. 二、系统安装
  5. 2.1 Windows 安装
  6. 2.2 Mac 安装
  7. 2.3 Linux 安装
  8. 2.3.1 脚本安装
  9. 2.3.2 二进制安装
  10. 2.3.3 安装特定版本
  11. 2.3.4 更新与卸载
  12. 三、常用交互命令
  13. 3.1 运行模型
  14. 3.2 自定义 Prompt
  15. 3.3 查看模型列表
  16. 四、设置自定义模型下载路径
  17. 4.1 Windows 更改 Ollama 模型存放位置
  18. 4.2 Linux/Mac 更改 Ollama 模型存放位置
  19. 五、导入 Hugging Face 模型
  20. 六、常见问题排查
  21. 6.1 查看日志
  22. 6.2 显存不足
  23. 6.3 无法连接网络
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Android Studio 结合 Claude AI 快速构建 WebView 项目模板
  • AI 热榜深度解读:5 大重点方向与行业风向变化
  • Copilot 人工智能助手及编程功能介绍
  • AD4630 四通道 SPI 模式配置与采集 FPGA 设计
  • Java API 详解:基础爬虫构建与带条件数据提取
  • Google Antigravity IDE 介绍:智能体驱动开发体验
  • 从编译器优化视角看C++ explicit关键字的深层影响
  • GGCNN 机器人抓取检测技术详解
  • macOS 本地部署 Llama3:Ollama 与 Enchanted 实战指南
  • MySQL 解压版安装与配置指南
  • Go 语言常用加密解密算法实现与总结
  • 比迪丽 AI 绘画多设备协同:PC 生成、手机审核与平板标注工作流
  • llama.cpp 性能优化实战:从诊断到部署
  • DeepSeek 深度使用指南:提示词工程与本地知识库搭建
  • 2024 开源图生视频模型横向评测:从 Stable Diffusion 到 SVD 的技术选型指南
  • 二分算法:8 道经典题目详解与实战
  • 基于 Python 的单脉冲雷达导引头回波生成技术
  • React + Ant Design 登录界面 UI 美化实战
  • Claude Code 规则配置与最佳实践
  • Python 入门教程:核心特性、学习路线与实战建议

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online