Mac Mini M4 跑 AI 模型全攻略：从 Ollama 到 Stable Diffusion 的保姆级配置指南

优质文章学习记录

10 Apr 2026 — 4 min read

Mac Mini M4 本地AI模型实战：从零构建你的个人智能工作站

最近身边不少朋友都在讨论，能不能用一台小巧的Mac Mini M4，搭建一个属于自己的AI开发环境。毕竟，不是每个人都有预算去租用云端的高性能GPU，也不是所有项目都适合把数据传到云端处理。我折腾了大概两周，从Ollama到Stable Diffusion，把整个流程走了一遍，发现M4芯片的潜力远超预期。这篇文章，就是把我踩过的坑、验证过的有效配置，以及一些提升效率的小技巧，毫无保留地分享给你。无论你是想本地运行大语言模型进行对话和创作，还是想离线生成高质量的AI图像，这篇指南都能帮你把Mac Mini M4变成一个得力的AI伙伴。

1. 环境准备与基础配置

在开始安装任何AI工具之前，确保你的系统环境是干净且高效的，这能避免后续无数莫名其妙的依赖冲突。Mac Mini M4出厂预装的是较新的macOS版本，但这还不够。

首先，打开“系统设置” -> “通用” -> “软件更新”，确保你的macOS已经更新到可用的最新版本。苹果对Metal图形API和神经网络引擎的优化通常会随着系统更新而提升，这对于后续运行Stable Diffusion这类需要图形加速的模型至关重要。

接下来是包管理工具Homebrew。你可以把它理解为macOS上的“应用商店命令行版”，绝大多数开发工具都能通过它一键安装。打开终端（Terminal），输入以下命令来安装或更新Homebrew：

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

安装完成后，建议运行一下更新，确保brew本身和它的核心库是最新的：

brew update && brew upgrade

提示：如果你的网络环境导致从GitHub拉取代码缓慢，可以尝试更换Homebrew的源。不过，对于后续从Hugging Face等平台下载模型权重，网络速度可能仍是主要瓶颈，可以考虑在夜间进行大型文件下载。

Python环境是AI世界的基石。虽然系统自带了Python 3，但为了隔离项目依赖，强烈建议使用虚拟环境。我推荐使用conda或miniconda来管理Python环境，因为它能更好地处理非Python的二进制依赖（比如某些C++编译的库）。通过Homebrew安装Miniconda：

brew install --cask miniconda

安装后，关闭并重新打开终端，然后创建一个专用于AI项目的环境，比如命名为ai_m4，并指定Python版本为3.10（这是一个在兼容性和新特性之间比较平衡的版本）：

conda create -n ai_m4 python=3.10 -y conda activate ai_m4

看到命令行提示符前面出现(ai_m4)，就说明你已经在这个虚拟环境里了。之后所有pip安装的包，都只会影响这个环境，不会搞乱系统或其他项目。

2. 大语言模型引擎：Ollama的部署与精调

Ollama的出现，极大地简化了在本地运行大型语言模型的过程。它就像一个模型容器，帮你处理好了模型加载、对话上下文管理这些繁琐的事情。在M4芯片的Mac Mini上安装Ollama非常简单。

如果你的系统是macOS，可以直接从Ollama官网下载.dmg安装包进行图形化安装，这对于新手来说最友好。但对于喜欢命令行控制一切的朋友，依然可以通过Homebrew安装：

brew install ollama

安装完成后，不需要复杂的配置，直接在终端启动Ollama服务：

ollama serve

服务会在后台运行。此时，打开另一个终端窗口，你就可以拉取并运行模型了。Ollama支持众多模型，从轻量级的到超大规模的都有。对于Mac Mini M4（我们假设是8GB或16GB统一内存的版本），起步可以从7B参数量的模型开始。例如，拉取并运行Mistral 7B模型：

ollama run mistral

第一次运行会先下载模型文件，之后就会进入一个交互式对话界面。你可以直接输入问题，比如“用Python写一个快速排序函数”。模型会开始生成回答。要退出对话，输入/bye。

但Ollama的能力远不止于此。你可以创建自定义的模型文件（M

使用 Python 语言从 0 到 1 搭建完整 Web UI自动化测试学习系列 53--CI/CD 6--配置Jenkins构建新项目-定时自动执行测试代码

测试学习记录，仅供参考！配置Jenkins构建新项目-定时自动执行测试代码 1、启动服务，打开登录 Jenkins，找到新建项目，开始配置测试项目；配置项目 2、项目描述（选填项）；源码管理 3、源码管理，Jenkins 在执行时通过读取 Git 上的代码 1）、选中 Git 选项； 2）、URL：Git 上面项目里面的地址 4、添加 Git 用户名和密码 5、输入用户名、密码，其他自定义，单击“添加”按钮； 6、添加 Git 用户名密码成功后选中它；其他保持默认即可；构建触发器 7、构建触发器选择定时构建→设置定时时间（自行设置）； 8、

微信 H5 缓存控制：后端重定向 & 前端强制刷新

在 Web 开发中，缓存是一把双刃剑。对于静态资源，它能极大提升加载速度；但对于业务逻辑频繁变动的 H5 页面（如支付、订单页），缓存往往会导致用户看到过期的数据或界面。最近在维护一个 uni-app 项目时，遇到了一段关于 H5 缓存控制的逻辑，引发了我对于“后端重定向加时间戳”和“前端 JS 加时间戳”这两种方案的思考。虽然两者的最终目的一致，但在 Hash 模式下，它们的实现原理和效果有着本质的区别。一、问题背景在应用启动的生命周期中，通常会有这样一段逻辑：当用户访问特定的关键页面（如支付、订单页）时，如果当前 URL 中缺少时间戳参数，前端会自动解析 URL，追加当前时间戳，并强制页面刷新。这就引出了一个问题：为什么不直接在后端重定向时加时间戳？这两种方式有什么区别？二、核心区别：

上传文件，在前端用 pdf.js 提取上传的pdf文件中的图片

在线访问： https://chat.xutongbao.top/nextjs/light/pdf <!DOCTYPE html> <html lang="zh-CN"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>PDF 图片提取工具<

Windows家用电脑也能玩转Gemma3大模型？手把手教你用Ollama+Open WebUI搭建AI聊天室

家用Windows电脑变身AI工作站：零门槛部署Gemma3大模型实战指南你是否也曾觉得，那些动辄需要数万甚至数十万专业设备的AI大模型，离普通人的生活太过遥远？看着科技新闻里各种模型“跑分”的新闻，心里痒痒的，却苦于没有合适的硬件去亲手尝试？今天，我想和你分享一个可能颠覆你认知的事实：你手边那台用来追剧、办公的Windows家用电脑，完全有能力成为一个功能完整的AI工作站。没错，我说的不是那些需要专业显卡、昂贵服务器的“庞然大物”，而是谷歌最新开源的Gemma3系列模型。这个家族提供了从1B到27B不同参数规模的版本，特别是经过优化的轻量级版本，对硬件的要求已经降到了令人惊喜的程度。更重要的是，整个部署过程并不需要你具备多深的系统运维知识，更像是在安装一个功能强大的软件。这篇文章，就是为你——那些对AI技术充满好奇，但预算有限、设备普通的个人开发者、学生或技术爱好者准备的。我们将彻底抛开那些复杂的云服务配置和命令行“黑话”，用最直观、最接地气的方式，一步步将Gemma3大模型“请”到你的Windows电脑里，并给它配上一个漂亮易用的网页聊天界面。你会发现，体验前沿AI技术