Mac Mini M4 本地部署 AI 模型:Ollama 与 Stable Diffusion 实操
在 Mac Mini M4 上跑本地 AI,最现实的好处是省掉云 GPU 的租用和等待。M4 的芯片能力足够支撑一套日常可用的本地环境,代价是前期配置要收拾干净,尤其是 Python、模型权重和网络下载这几块,乱一点后面就会反复踩坑。
环境准备与基础配置
先把系统更新到较新的 macOS 版本。这里不是为了追新,而是为了让 Metal 图形接口和神经网络引擎少出幺蛾子。系统版本太旧时,很多工具链能装上,但运行时会莫名其妙卡在兼容性上。
安装 Homebrew:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
更新 Homebrew:
brew update && brew upgrade
如果网络环境不稳定,GitHub 和 Hugging Face 的下载速度往往是整个流程里最磨人的部分。Homebrew 源可以按本地网络情况调整,模型权重建议挑网络顺的时候一次拉完,别等到要用时再临时下载。
用 Conda 管理 Python 环境会省很多事,至少不会把系统 Python 搞乱:
brew install --cask miniconda
conda create -n ai_m4 python=3.10 -y
conda activate ai_m4
大语言模型引擎:Ollama
本地跑大模型,Ollama 算是最省事的一类方案。它把模型拉取、启动和交互封装得比较完整,适合先把环境跑通,再考虑更细的调参。
通过 Homebrew 安装:
brew install ollama
启动服务:
ollama serve
拉取并运行模型,比如 Mistral 7B:
ollama run mistral
进入交互后,输入 /bye 退出。
Ollama 还支持用 Modelfile 自定义模型行为。这个功能不花哨,但很实用,尤其是你想固定提示词、上下文参数或者换掉默认配置的时候,比每次手工拼命令稳定得多。

