Ollama 本地大语言模型安装与部署指南
为了给以后的工作流和本地模型铺路,有必要说一下 Ollama 本地大语言后台的安装。
1. Ollama 简介
在安装之前,有必要先说明一下 Ollama 是什么。
Ollama 是一个大语言模型的服务后台,能够在零基础的前提下帮助用户轻松部署大语言模型。
特点
优点:
- Ollama 后台服务能够帮助用户轻松搭建大语言模型服务。
- 提供相应的 API 以扩展到其他如 Dify 等 Web 前台以及 Obsidian 等笔记软件,以最快的速度形成 AI 问答/AGENT/工作流等工作形式。
- 提供模型免费下载,用户可以直接下载多种主流的开源大语言模型。
- 支持不同系统,如 Windows、Linux、MacOS 等。
缺点:
- 对于部分特殊的开源模型不支持或未收录,模型数量较大,用户需结合自己的需求自行分辨大语言模型的特点。
从多种角度来说,Ollama 是目前最为快速、最方便的本地化大语言模型后台。
2. Ollama 的安装
2.1 环境要求
在下载前需要注意:
- Windows 系统:需要在 Windows 10 以上系统。
- 硬件配置:如果想要跑 7B 以上模型,建议显存在 6G 以上,内存 16G 以上,以独立显卡为佳,显卡以 Nvidia 为佳。非独立显卡将会用 CPU 来跑,速度会慢一大截。
2.2 下载与安装
Ollama 下载地址为:https://ollama.com
打开页面后出现官网,点击 Download 下载对应系统的安装包。
下载完毕后双击一路下一步即可运行。
2.3 查看安装是否成功
如果安装成功,Ollama 会出现在右下角任务栏图标中。打开浏览器,并输入 http://127.0.0.1:11434 或 http://localhost:11434。如果显示出一行小字则代表 Ollama 服务运行成功。
2.4 模型下载路径设置
如果不想你的 C 盘因为下载大模型(很多都是几 G 到十几 G 甚至几十 G)被占用太多空间,那么可以做如下设置,如果无所谓可忽略本条操作。
Windows 环境变量设置
- 点击 Windows 开始按钮或者直接点开开始菜单,选择设置,或者直接按下 Windows 快捷键 win+i 打开设置。
- 在搜索中输入系统变量,在弹出的窗口中选择环境变量。
- 在新窗口中的用户变量中点新建,在弹出的小窗口中输入:
- 变量名:
OLLAMA_MODELS - 变量值:你想要存放大语言模型的路径(例如:
E:\Github code\OLLAMAMODEL)
- 变量名:
- 点击确定,这个新变量会出现在你的用户变量中。
至于 OLLAMA_HOST 这个变量,在某种程度上对于 Docker 部署前台是不利的,所以不建议设置。
3. 试运行 Ollama
提前说明:如果上述操作成功,但以下操作未成功,需要重启一下电脑。
3.1 服务检查
对电脑的 windows 按钮点右键,选择终端管理员/终端,当然 win+r 输入 cmd 启动命令提示符亦可,但是建议使用管理员权限。
在打开的黑色窗口中输入 ollama,然后回车,如果出现帮助信息则表示服务正常。


