使用 Ollama 在本地运行大模型指南 | 极客日志

Shell / BashAI算法

使用 Ollama 在本地运行大模型指南

Ollama 是一款开源的本地大模型运行工具，允许用户在个人电脑上通过 CPU 或 GPU 运行多种大型语言模型。 Ollama 的安装步骤、命令行使用方法、模型切换与管理技巧，以及通过 REST API 进行集成的方案。内容涵盖从基础对话交互到高级配置优化，帮助用户快速搭建本地 AI 环境，无需依赖云端服务即可体验大模型能力。

筑梦师发布于 2025/2/7更新于 2026/7/2037 浏览

使用 Ollama 在本地运行大模型指南

引言

随着人工智能技术的发展，大型语言模型（LLM）的应用日益广泛。然而，云端 API 往往存在延迟、隐私泄露风险及成本问题。本地部署大模型成为许多开发者和爱好者的需求。Ollama 是一个开源项目，旨在简化本地运行大模型的过程。它支持多种主流模型，无需复杂的配置，甚至可以在没有独立显卡的 CPU 环境下运行。

安装 Ollama

Windows 系统

访问 Ollama 官网下载 Windows 安装包。
运行安装程序，按照向导完成安装。
安装完成后，命令行工具将自动添加到环境变量中。

macOS 系统

通过 Homebrew 安装：brew install ollama
或直接下载 DMG 安装包进行安装。

Linux 系统

curl -fsSL https://ollama.com/install.sh | sh

快速开始

安装完成后，打开终端或命令行窗口，输入以下命令即可启动服务并运行模型。

ollama run llama2

首次运行时，Ollama 会自动下载模型文件（约 3-5GB），下载完成后即可进入对话模式。

示例交互

>>> who are you
I'm just an AI assistant trained by Meta AI, my primary function is to assist users with their inquiries and provide information on a wide range of topics.

模型管理

切换模型

Ollama 支持多种模型，可以通过 run 命令加载不同模型。

ollama run gemma
ollama run mistral

查看已下载模型

列出本地所有可用模型及其大小。

ollama list

删除模型

释放磁盘空间，移除不需要的模型。

ollama rm <model_name>

拉取新模型

手动从注册表获取模型。

ollama pull llama2:7b

API 集成

Ollama 提供本地 RESTful API，方便开发者集成到应用程序中。

启动服务

默认情况下，运行 ollama serve 会启动 API 服务，监听 http://localhost:11434。

Python 调用示例

import requests
import json

response = requests.post('http://localhost:11434/api/generate', json={
    : ,
    : ,
    : 
})
(response.json()[])

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

curl http://localhost:11434/api/generate -d '{"model": "llama2", "prompt": "你好"}'

FROM llama2
SYSTEM "你是一个专业的技术助手。"
PARAMETER temperature 0.7

ollama create my-model -f Modelfile

使用 Ollama 在本地运行大模型指南

使用 Ollama 在本地运行大模型指南

引言

安装 Ollama

Windows 系统

macOS 系统

Linux 系统

快速开始

示例交互

模型管理

切换模型

查看已下载模型

删除模型

拉取新模型

API 集成

启动服务

Python 调用示例

更多推荐文章

相关免费在线工具

cURL 调用示例

高级配置

Modelfile 自定义

性能优化

常见问题排查

结语

更多推荐文章

相关免费在线工具

使用 Ollama 在本地运行大模型指南

使用 Ollama 在本地运行大模型指南

引言

安装 Ollama

Windows 系统

macOS 系统

Linux 系统

快速开始

示例交互

模型管理

切换模型

查看已下载模型

删除模型

拉取新模型

API 集成

启动服务

Python 调用示例

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

cURL 调用示例

高级配置

Modelfile 自定义

性能优化

常见问题排查

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具