本地电脑使用 Ollama 部署大模型及 Chatbox 客户端

在某些场景下，构建完全本地离线可用的大模型环境是必要的，这能保障数据隐私并降低网络依赖。Ollama 是目前最简单快捷的本地部署方案之一，支持 Qwen、Llama3、Mistral 等多种主流开源模型。本文将详细介绍如何在 Windows 环境下通过 Ollama 部署模型，并使用 Chatbox 图形界面进行交互。

一、环境准备与安装

1. 系统要求

操作系统：Windows 10/11, macOS, Linux
内存：建议 8GB 以上（运行 7B 参数模型）
显卡：推荐 NVIDIA 显卡（显存 4GB+），无显卡也可运行但速度较慢
磁盘空间：根据模型大小预留 5GB-20GB 空间

2. 下载与安装 Ollama

访问 Ollama 官网下载安装包，双击运行安装程序。安装过程中保持默认设置即可。

安装完成后，打开命令行工具验证安装是否成功：

ollama --version

若显示版本号，说明安装成功。

二、模型下载与管理

1. 选择模型

Ollama 支持多种模型，针对中文任务推荐使用 Qwen 系列，通用能力推荐 Llama3 或 Mistral。

Qwen:7b：适合中文对话，资源占用较低
Llama3:8b：英文能力强，逻辑推理佳
Mistral:7b：综合性能均衡

2. 拉取模型

在命令行中输入以下命令拉取模型（以 Qwen 为例）：

ollama run qwen:7b

首次运行时会自动下载模型文件，请耐心等待下载完成。下载完成后将进入交互式对话模式。

3. 模型管理命令

常用管理命令如下：

查看已安装模型：ollama list
删除模型：ollama rm <模型名>
复制模型：ollama cp <源> <目标>
创建自定义模型：通过 Modelfile 定义

三、命令行交互使用

安装并拉取模型后，可直接在终端中进行对话。输入问题后按回车等待回复，输入 /bye 退出当前会话。

示例交互：

>>> 你好，请介绍一下你自己。
我是 Qwen，一个由阿里巴巴通义实验室研发的超大规模语言模型...

四、配置图形界面 Chatbox

虽然命令行可用，但图形界面体验更佳。Chatbox 是一款支持 Ollama 的开源桌面客户端。

1. 下载与安装

下载 Chatbox 安装包并安装。首次运行需进行基础配置。

2. 连接 Ollama

打开 Chatbox 设置页面。
在 API 设置中选择 "Ollama" 作为后端。
确保 Ollama 服务正在运行（默认端口 11434）。

本地电脑使用 Ollama 部署大模型及 Chatbox 客户端