Ollama for macOS 完全指南：零配置本地运行 Llama、DeepSeek 等大模型，私享安全高效的 AI 能力

优质文章学习记录

07 Apr 2026 — 6 min read

Ollama for macOS 完全指南：零配置本地运行 Llama、DeepSeek 等大模型，私享安全高效的 AI 能力

🎯 核心摘要
💻 安装 Ollama
🚀 快速开始：运行你的第一个模型
- 1. 运行一个流行模型
- 2. 常用模型管理命令
🧠 模型选择建议
🎨 进阶使用：超越命令行
- 1. 使用图形化界面（Open WebUI）
- 2. 通过代码调用（API）
⚙️ 实用技巧与故障排除

🎯 核心摘要

这份指南将帮你快速在 macOS 上搭建起本地的 AI 助手。
《macOS上零配置运行本地AI模型指南》介绍了使用 Ollama 在Mac电脑上快速部署Llama3、DeepSeek等大语言模型的方法。文章详细讲解了两种安装方式（官方脚本和Homebrew）、模型管理命令，并针对不同Mac硬件配置提供了模型选择建议。此外，还介绍了图形界面(Open WebUI)和API调用等进阶用法，包括Python集成示例。指南涵盖从基础安装到故障排除的全流程，帮助用户安全高效地在本地运行AI模型。

整个过程可以概括为以下几个关键阶段，你可以一目了然地看到全貌：

准备阶段

安装Ollama

选择安装方式

官方一键脚本
推荐

Homebrew
可选

验证安装

获取与运行模型

基础使用
命令行对话

进阶应用

图形化界面
（Open WebUI）

API接口调用

Python集成

熟练使用

下面，我们就来详细讲解每个步骤的具体操作。

💻 安装 Ollama

在 macOS 上安装 Ollama 非常简单，主要有以下两种方式。

安装方式	适用情况	操作步骤
官方一键脚本（推荐）	绝大多数用户，最直接	打开终端，粘贴并执行：`curl -fsSL https://ollama.com/install.sh
Homebrew	习惯使用包管理器的用户	在终端中执行：`brew install --cask ollama` 。

验证安装：安装完成后，重启终端，然后输入以下命令，如果显示版本号则说明安装成功。

ollama --version

安装后，Ollama 服务会自动在后台启动，并为后续使用做好准备。

🚀 快速开始：运行你的第一个模型

Ollama 的核心是 run 命令。它会自动下载（如果本地没有）并运行模型，进入交互式聊天界面。

1. 运行一个流行模型

比如，要运行 Meta 发布的 Llama 3 模型，只需在终端输入：

ollama run llama3

首次运行需要下载模型文件，耗时取决于你的网速和模型大小（Llama 3 8B 参数版本约 4.7GB ）。下载完成后，会出现 >>> 提示符，你就可以开始对话了。

2. 常用模型管理命令

掌握以下几个命令，就能高效管理你的本地“模型库” ：

命令	作用	示例
`ollama list`	查看本地已下载的所有模型	`ollama list`
`ollama pull`	只下载模型，不立即运行	`ollama pull gemma:2b`
`ollama rm`	删除不再需要的模型，释放空间	`ollama rm mistral`
`ollama ps`	查看当前正在运行的模型	`ollama ps`

🧠 模型选择建议

根据你的 Mac 硬件配置选择合适的模型，是关键的一步。

硬件配置	推荐模型（参数量）	说明
Apple Silicon（M1/M2/M3系列）	Llama 3 (8B, 70B), Gemma (7B), Qwern (7B)	强烈推荐！ Ollama 对 Apple Silicon 芯片（M1/M2/M3）的 GPU 加速优化得极好，即使是 70B 的大模型也能流畅运行。
Intel 芯片 Mac	Gemma (2B), Phi (2.7B), Llama 3 (8B)	优先选择 7B 及以下的模型。运行速度取决于 CPU 性能和内存大小。
内存（统一内存）	8GB：可尝试 1B-7B 模型 16GB 或以上：可流畅运行 13B-70B 参数模型	模型运行时会完全加载到内存中，内存容量是主要限制。

简单来说：如果你的 Mac 是 M 系列芯片，可以直接从 llama3:8b 开始，体验会很好。如果是 Intel 芯片或内存较小，可以从 gemma:2b 或 phi 开始尝试。

🎨 进阶使用：超越命令行

虽然命令行简单直接，但通过以下方式可以获得更佳体验。

1. 使用图形化界面（Open WebUI）

Open WebUI 能为你提供一个类似 ChatGPT 的友好网页界面，管理对话和历史记录都非常方便。
通过 Docker 安装（推荐）：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

安装完成后，在浏览器中访问 http://localhost:3000，初始化账号后即可使用。Open WebUI 通常能自动发现本地运行的 Ollama 服务。

2. 通过代码调用（API）

Ollama 在本地 11434 端口提供了兼容 OpenAI 格式的 REST API，方便你用任何编程语言集成。
Python 调用示例：

首先安装官方库：pip install ollama 。

import ollama response = ollama.chat(model='llama3', messages=[{'role':'user','content':'为什么天空是蓝色的？请用简单的话解释。',},])print(response['message']['content'])

直接使用 curl 测试：

curl -X POST http://localhost:11434/api/generate -d '{ "model": "llama3", "prompt": "请用Python写一个计算斐波那契数列的函数。", "stream": false }'

⚙️ 实用技巧与故障排除

修改模型默认存储路径：模型默认下载到 ~/.ollama/models/ 目录。如果想更改位置（比如移到外接硬盘），可以在启动 Ollama 服务前设置环境变量：export OLLAMA_MODELS="/你的/新/路径" 。
Ollama 服务未启动：如果遇到连接错误，可以尝试在终端输入 ollama serve 来手动启动服务。
如何彻底卸载：要将 Ollama 及其所有模型数据完全清除，只需将应用程序目录中的 “Ollama” 应用拖到废纸篓并清空即可。模型文件位于 ~/.ollama 目录，可一并删除。

希望这份详细的指南能帮助你在 macOS 上顺利开启本地 AI 之旅！如果你在具体操作中遇到任何问题，欢迎随时提出。

2026最新保姆级教程：手把手教你零基础安装与配置本地 AI 智能体 OpenClaw

文章目录 * 前言 * 一、下载并安装 OpenClaw * 二、启动配置向导与绑定 AI 大脑 * 1. 启动向导 * 2. 确认账户类型 * 3. 选择快速入门模式 * 4. 选择大模型 (AI 大脑) * 5. 选择 API 接口区域 * 6. 填入你的专属 API Key * 三、连接通讯渠道 (Telegram) * 1. 选择 Telegram * 2. 绑定机器人的 Token * 第四步：安装扩展插件与重启服务 * 1. 技能插件 (Skills) * 2. 附加功能 (Hooks) * 3. 重启并应用配置 * 第五步：设备安全授权与最终测试 (见证奇迹！) * 1.

Flutter Web 开发：解决跨域（CORS）问题的终极指南

Flutter Web 开发：解决跨域（CORS）问题的终极指南在 Flutter Web 开发过程中，默认情况下浏览器会遵循同源策略。当你的应用尝试加载不同域名的网络资源（如 API 接口、图片等）时，经常会遇到 CORS（跨域资源共享）错误，导致请求失败。虽然生产环境应由后端配置 CORS 头来解决，但在本地开发和调试阶段，我们可以通过修改 Flutter 工具链源码来临时禁用浏览器的安全策略，从而顺利调试。以下是详细的操作步骤： 🛠️ 操作步骤第一步：定位 chrome.dart 文件首先，你需要找到 Flutter SDK 中负责启动 Chrome 浏览器的配置文件 chrome.dart。参考路径（请根据你的实际安装路径调整）： <你的

下班后上门装OpenClaw，一天赚1500元：普通人如何抓住AI时代的红利

最近，"上门安装OpenClaw"成了闲鱼、小红书上的热门关键词。单价从100元到1500元不等。很多人下班后做做，一天就能赚上千元。这本质上是一个信息差机会。勇敢的人已经先赚钱了。信息差永远存在 OpenClaw的安装，技术上说并不复杂。安装步骤也就几行命令：但对很多普通人来说，这几行命令就是整不明白。他们有需求，有预算，甚至愿意支付溢价，但他们需要有人帮他们。这就是信息差。技术对一部分人来说是日常，但对大部分人来说就是无法跨域。这中间，就是机会。为什么这个需求是真实的？很多人不理解：不就是安装个软件吗，为什么愿意花上千元？因为他们买的是"可用性"，不是"软件本身"。想象一下： * 你是自由职业者，每天要浪费时间收集素材，制作内容。如果能有一个AI助手24小时帮你处理这些事情。 * 你是投资者，需要获取市场的信息动态，如果有AI助手可以实时的抓取互联网信息，定时分析后推送给你，是不是可以辅助你做决策。 * 你是传统行业的小老板，听说了AI的风潮，

【AI大模型学习日志6：深度拆解字节跳动豆包系列——国民级全模态AI的普惠化突围之路】

在上一篇AI大模型学习日志中，我们完整拆解了xAI旗下的Grok系列，它凭借X平台实时数据原生接入、反过度对齐的极客风格，在海外巨头垄断的市场中撕开了差异化突围的口子，也让我们看到了大模型赛道“长板极致化”的破局逻辑。而当我们把视线拉回国内大模型赛道，真正把“普惠化”做到极致、彻底改写国内C端AI格局的产品，必然是字节跳动旗下的豆包系列。在豆包诞生之前，国内大模型赛道始终陷入“对标GPT堆参数、拼跑分、做企业服务”的同质化内卷，普通用户想要用上AI，要么面对高昂的付费门槛，要么要忍受有限的免费额度、复杂的操作流程，AI技术始终停留在极客圈层与企业场景，无法真正走进大众的日常生活。而豆包从诞生之日起，就跳出了这条内卷路径，以“让顶尖AI能力零门槛走进10亿中国人的日常”为核心使命，用两年多时间成长为国内月活破2亿的国民级AI产品，成为国内C端通用大模型的绝对标杆。本文所有核心信息均以字节跳动官方技术白皮书、产品发布会、官方技术论文与开源文档为唯一基准，严格遵循系列日志的统一框架，从官方定义与核心基本面、完整发展历程、解决的行业核心痛点与落地场景、核心优势与现存不足四大维度，完整拆

Ollama for macOS 完全指南：零配置本地运行 Llama、DeepSeek 等大模型，私享安全高效的 AI 能力

🎯 核心摘要

💻 安装 Ollama

🚀 快速开始：运行你的第一个模型

1. 运行一个流行模型

2. 常用模型管理命令

🧠 模型选择建议

🎨 进阶使用：超越命令行

1. 使用图形化界面（Open WebUI）

2. 通过代码调用（API）

⚙️ 实用技巧与故障排除

Read more

2026最新保姆级教程：手把手教你零基础安装与配置本地 AI 智能体 OpenClaw

Flutter Web 开发：解决跨域（CORS）问题的终极指南

下班后上门装OpenClaw，一天赚1500元：普通人如何抓住AI时代的红利

【AI大模型学习日志6：深度拆解字节跳动豆包系列——国民级全模态AI的普惠化突围之路】