Mac 专属大模型框架 Chat with MLX:两行代码部署本地对话
Mac 平台专属的大模型框架 Chat with MLX,该框架基于苹果 MLX 技术,支持两行代码快速部署。文章详细阐述了安装步骤、环境要求、核心功能如本地文档总结与 RAG 检索增强生成,以及多语言支持。通过实际测试展示了其在 M1 芯片上的性能表现,分析了优缺点及常见故障解决方法。强调了本地部署在数据安全方面的优势,并展望了消费级本地 AI 的发展趋势。

Mac 平台专属的大模型框架 Chat with MLX,该框架基于苹果 MLX 技术,支持两行代码快速部署。文章详细阐述了安装步骤、环境要求、核心功能如本地文档总结与 RAG 检索增强生成,以及多语言支持。通过实际测试展示了其在 M1 芯片上的性能表现,分析了优缺点及常见故障解决方法。强调了本地部署在数据安全方面的优势,并展望了消费级本地 AI 的发展趋势。

Mac 用户终于不用羡慕 NVIDIA 显卡玩家拥有专属大模型 Chat with RTX 了。由 OpenAI 前员工开发的新框架 Chat with MLX,让苹果电脑也能运行本地大模型,仅需两行代码即可完成部署。该框架支持中文在内的 11 种语言,并内置七种开源大模型。
Chat with MLX 仿照 Chat with RTX 设计,基于苹果机器学习框架 MLX(Machine Learning eXtension)。它具备本地文档总结、YouTube 视频分析等功能。对于开发者而言,除了预置模型,只要 Hugging Face 上有且兼容 MLX 框架的模型,也可以手工添加。

Chat with MLX 已集成到 pip 命令中。在拥有 pip 环境的 macOS 系统上,只需一行代码即可安装:
pip install chat-with-mlx
为了确保顺利运行,建议满足以下基础环境配置:
安装完成后,在终端中输入以下命令并按回车,系统将自动完成初始化并弹出网页界面:
chat-with-mlx
首次启动及下载模型时需要连接到 Hugging Face 服务器。如果中途需要更换模型,需先将当前模型 Unload,再选择新模型加载。

如果不上传自有数据,可以直接将其作为普通大模型使用。在 M1 芯片的 MacBook 上,测试了规模较小的 Quyen-SE 模型(基于阿里通义千问改造,0.5B 参数),表现较为流畅。对于更复杂的任务,用户可以选择参数量更大的模型,但需注意内存占用。
这是 Chat with MLX 的主要卖点。用户可以上传文件或填写 YouTube 视频链接,点击 Start Indexing 建立索引。根据开发者说明,只要不点击 Stop,再次上传新文件后数据是累加的。
为了验证效果,测试者使用了一篇不公开上网的本科毕业论文作为私有知识库,设计了十个问题询问论文细节。结果显示,其中七个回答正确符合文意,但速度相比纯生成略慢。

框架内置支持包括中文在内的 11 种可用语言。用户可以在设置中切换默认交互语言,这对于非英语母语的开发者和研究人员非常友好。
MLX 是苹果公司推出的机器学习框架,专为 Apple Silicon 硬件优化。它允许开发者利用 Metal 统一内存架构,高效地在 Mac 上进行深度学习推理和训练。Chat with MLX 充分利用了这一特性,使得大模型能够在消费级 Mac 设备上流畅运行,无需依赖外部 GPU 集群。
检索增强生成(Retrieval-Augmented Generation, RAG)通过将外部知识库与大型语言模型结合,解决了模型知识截止和幻觉问题。在本项目中,用户上传的文档会被向量化存储,当用户提问时,系统先检索相关片段,再连同问题一起发送给模型生成答案。这种方式保证了回答基于用户提供的特定数据,提升了准确性。
.safetensors 或 .mlx 结尾的文件为佳。若遇到格式错误,请检查模型来源是否官方认证。此外,GitHub 上存在部分用户反馈安装失败的问题,作者已进行回复跟进并更新程序。建议定期查看 GitHub Release 页面获取最新修复版本。

尽管存在算力限制,但本地化部署带来的数据安全性是云端服务无法比拟的。所有数据处理均在本地设备完成,无需将敏感文档上传至第三方服务器。这对于企业研发人员、法律从业者及关注隐私的个人用户尤为重要。
随着 Apple Silicon 芯片性能的持续提升,本地大模型的推理速度将进一步加快。同时,随着开源社区对 MLX 框架的支持增加,更多优秀的模型将被适配。本地化、专属化的大模型正逐渐向消费级产品普及,标志着 AI PC 时代的到来。
Chat with MLX 为 Mac 用户提供了一个便捷的本地大模型部署方案。虽然目前在算力和响应速度上仍不及高端工作站,但其易用性和隐私保护能力使其成为个人开发者的理想工具。通过简单的命令行操作,即可构建属于自己的私有知识库问答系统。
升级 AI PC 的时间到了。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online