1. 快速体验
1.1 下载 Ollama
Ollama 官网:https://ollama.com/

1.2 下载模型
Ollama 已经有很多开源的模型可以直接下载。带 thinking 标签的是带深度思考,vision 是具有多模态视觉功能,tools 是可以使用 MCP 工具。

下载我们需要的模型,例如 gemma3。

打开命令行,直接输入 ollama run <模型名> 就会先下载,下载完成后就可以跟模型聊天了。
ollama run gemma3
1.3 模型命名规则
这里可以看到模型有很多版本,模型版本的命名是规则的。比如说我们 ollama run gemma3 后面什么后缀都没有带的,那下载的都是默认版本。
每个模型都会有一个默认下载版本,那如果要更进一步我们自己去判断,就需要去看它后面这些后缀了,一般这个起名字的款式都是:模型名 + 参数量 + 量化精度。
参数量越大,它的性能越好,量化的精度越大,原则上也是要更好的,缺点呢则是更占显存。

比如 gemma3-12b-it-q4_K_M 的意思就是:gemma 第 3 代_120 亿参数_指令微调版本_4-bit 量化_用的 K-quant 量化_中等规模量化。
1.4 更改模型下载地址(可选)
Ollama 默认的模型下载地址都是在本机系统盘的,所以我们需要模型的默认下载地址,把模型下在其他位置(比如外接硬盘)实现模型自由。
echo 'export OLLAMA_MODELS="/<文件夹路径>/models"' >> ~/.zshrc
source ~/.zshrc
1.5 基础使用
下载一些模型之后呢,我们再来学几条命令来管理这些模型。Ollama 的命令也都很好理解,基本就是 。








