Ollama 本地大语言模型安装与部署指南

为了给以后的工作流和本地模型铺路，有必要说一下 Ollama 本地大语言后台的安装。

1. Ollama 简介

在安装之前，有必要先说明一下 Ollama 是什么。

Ollama 是一个大语言模型的服务后台，能够在零基础的前提下帮助用户轻松部署大语言模型。

特点

优点：

Ollama 后台服务能够帮助用户轻松搭建大语言模型服务。
提供相应的 API 以扩展到其他如 Dify 等 Web 前台以及 Obsidian 等笔记软件，以最快的速度形成 AI 问答/AGENT/工作流等工作形式。
提供模型免费下载，用户可以直接下载多种主流的开源大语言模型。
支持不同系统，如 Windows、Linux、MacOS 等。

缺点：

对于部分特殊的开源模型不支持或未收录，模型数量较大，用户需结合自己的需求自行分辨大语言模型的特点。

从多种角度来说，Ollama 是目前最为快速、最方便的本地化大语言模型后台。

2. Ollama 的安装

2.1 环境要求

在下载前需要注意：

Windows 系统：需要在 Windows 10 以上系统。
硬件配置：如果想要跑 7B 以上模型，建议显存在 6G 以上，内存 16G 以上，以独立显卡为佳，显卡以 Nvidia 为佳。非独立显卡将会用 CPU 来跑，速度会慢一大截。

2.2 下载与安装

Ollama 下载地址为：https://ollama.com

打开页面后出现官网，点击 Download 下载对应系统的安装包。

下载完毕后双击一路下一步即可运行。

2.3 查看安装是否成功

如果安装成功，Ollama 会出现在右下角任务栏图标中。打开浏览器，并输入 http://127.0.0.1:11434 或 http://localhost:11434。如果显示出一行小字则代表 Ollama 服务运行成功。

2.4 模型下载路径设置

如果不想你的 C 盘因为下载大模型（很多都是几 G 到十几 G 甚至几十 G）被占用太多空间，那么可以做如下设置，如果无所谓可忽略本条操作。

Windows 环境变量设置

点击 Windows 开始按钮或者直接点开开始菜单，选择设置，或者直接按下 Windows 快捷键 win+i 打开设置。
在搜索中输入系统变量，在弹出的窗口中选择环境变量。
在新窗口中的用户变量中点新建，在弹出的小窗口中输入：
- 变量名：OLLAMA_MODELS
- 变量值：你想要存放大语言模型的路径（例如：E:\Github code\OLLAMAMODEL）
点击确定，这个新变量会出现在你的用户变量中。

至于 OLLAMA_HOST 这个变量，在某种程度上对于 Docker 部署前台是不利的，所以不建议设置。

3. 试运行 Ollama

提前说明：如果上述操作成功，但以下操作未成功，需要重启一下电脑。

3.1 服务检查

对电脑的 windows 按钮点右键，选择终端管理员/终端，当然 win+r 输入 cmd 启动命令提示符亦可，但是建议使用管理员权限。

在打开的黑色窗口中输入 ollama，然后回车，如果出现帮助信息则表示服务正常。

Ollama 本地大语言模型安装与部署指南