Ollama 本地部署大语言模型使用指南 | 极客日志

编程语言AI算法

Ollama 本地部署大语言模型使用指南

Ollama 是一个支持在本地运行大语言模型的工具，兼容 Windows、Linux 和 MacOS。 Ollama 的安装步骤、常用模型下载、命令行交互方式以及基于 Docker 的图形界面部署方案。内容涵盖模型管理命令、API 调用示例及硬件优化建议，帮助用户搭建本地 AI 环境，实现数据隐私保护与离线使用。

SparkGeek发布于 2025/2/6更新于 2026/5/3125 浏览

Ollama 简介

大模型是当前技术领域的热点话题，无论是国外的 ChatGPT、Llama3，还是国内的文心一言、通义千问等，都备受关注。Ollama 是一个支持在本地运行大语言模型的工具，兼容 Windows、Linux 和 MacOS 操作系统。它允许用户无需联网即可在本地设备上运行开源大模型，保障数据隐私并降低延迟。

安装方法

Ollama 支持主流桌面操作系统，安装方式简单快捷。

macOS

brew install ollama

Linux

curl -fsSL https://ollama.com/install.sh | sh

Windows

访问官网下载 Windows 安装包进行安装，或直接在 PowerShell 中运行：

winget install Ollama.Ollama

安装完成后，服务会自动启动并在后台运行。

常用模型列表

Ollama 本身不包含预装模型，需要单独拉取。支持的模型库可在 ollama.com/library 查看。以下是部分常用模型及其参数信息：

Model	Parameters	Size	Download Command
Llama 3	8B	4.7GB	`ollama run llama3`
Llama 3	70B	40GB	`ollama run llama3:70b`
Phi 3 Mini	3.8B	2.3GB	`ollama run phi3`
Phi 3 Medium	14B	7.9GB	`ollama run phi3:medium`
Gemma	2B	1.4GB	`ollama run gemma:2b`
Mistral	7B	4.1GB	`ollama run mistral`
Code Llama	7B	3.8GB	`ollama run codellama`
LLaVA	7B	4.5GB	`ollama run llava`

示例： 拉取并运行 Qwen 模型（阿里通义千问）

ollama pull qwen
ollama run qwen

命令行交互

安装并拉取模型后，可直接在终端与模型对话。Ollama 默认监听本地端口 11434。

基础对话

ollama run llama3
> 你现在是一个程序员，请用 JS 写一个冒泡排序算法。
> 好的，这是一个简单的冒泡排序实现...

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

curl http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "为什么天空是蓝色的？"
}'

import requests

response = requests.post(
    'http://localhost:11434/api/generate',
    json={
        'model': 'llama3',
        'prompt': '解释一下量子力学的基本概念',
        'stream': False
    }
)
print(response.json()['response'])

Ollama 本地部署大语言模型使用指南

Ollama 简介

安装方法

macOS

Linux

Windows

常用模型列表

命令行交互

基础对话

更多推荐文章

相关免费在线工具

多轮对话

图形界面 (Open WebUI)

Docker 部署

API 调用示例

cURL 请求

Python 调用

模型管理命令

硬件要求与优化

总结

更多推荐文章

相关免费在线工具

Ollama 本地部署大语言模型使用指南

Ollama 简介

安装方法

macOS

Linux

Windows

常用模型列表

命令行交互

基础对话

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

多轮对话

图形界面 (Open WebUI)

Docker 部署

API 调用示例

cURL 请求

Python 调用

模型管理命令

硬件要求与优化

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具