Mac Mini M4 本地部署 AI 模型：Ollama 与 Stable Diffusion 实操

在 Mac Mini M4 上跑本地 AI，最现实的好处是省掉云 GPU 的租用和等待。M4 的芯片能力足够支撑一套日常可用的本地环境，代价是前期配置要收拾干净，尤其是 Python、模型权重和网络下载这几块，乱一点后面就会反复踩坑。

先把系统更新到较新的 macOS 版本。这里不是为了追新，而是为了让 Metal 图形接口和神经网络引擎少出幺蛾子。系统版本太旧时，很多工具链能装上，但运行时会莫名其妙卡在兼容性上。

安装 Homebrew：

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

更新 Homebrew：

brew update && brew upgrade

如果网络环境不稳定，GitHub 和 Hugging Face 的下载速度往往是整个流程里最磨人的部分。Homebrew 源可以按本地网络情况调整，模型权重建议挑网络顺的时候一次拉完，别等到要用时再临时下载。

用 Conda 管理 Python 环境会省很多事，至少不会把系统 Python 搞乱：

brew install --cask miniconda
conda create -n ai_m4 python=3.10 -y
conda activate ai_m4

本地跑大模型，Ollama 算是最省事的一类方案。它把模型拉取、启动和交互封装得比较完整，适合先把环境跑通，再考虑更细的调参。

通过 Homebrew 安装：

brew install ollama

启动服务：

ollama serve

拉取并运行模型，比如 Mistral 7B：

ollama run mistral

进入交互后，输入 /bye 退出。

Ollama 还支持用 Modelfile 自定义模型行为。这个功能不花哨，但很实用，尤其是你想固定提示词、上下文参数或者换掉默认配置的时候，比每次手工拼命令稳定得多。

更多推荐文章