背景
传统 Claude Code 虽强大,但依赖 API 密钥、需付费、代码上云,对敏感项目不够友好。如今 Ollama 官方新增 Anthropic Messages API 支持,让 Claude Code 可直接对接本地模型,打造一个完全离线的 AI 编码代理,具备读文件、改代码、执行命令等能力。即便没有高端显卡,也可流畅运行 7B~30B 的编码专用模型,满足日常开发、调试、脚本生成等需求。
5 分钟上手教程(保姆级)
准备工作(2 分钟)
- 访问 ollama.com 下载并安装 Ollama(Mac / Windows 均支持,安装后自动后台运行)。
- 打开终端,输入
ollama --version验证安装成功。
步骤 1:拉取本地模型
- 配置一般(16~32GB 内存)推荐:
qwen3-coder:7b或gemma2:9b - 高配设备(RTX 4090 / Mac M 系列高配)推荐:
qwen3-coder:30b或 GLM-4 系列
复制执行以下命令(以 7B 为例):
ollama pull qwen3-coder:7b
步骤 2:安装 Claude Code
终端执行官方安装命令:
curl -fsSL https://claude.ai/install.sh | sh
步骤 3:将 Claude Code 指向本地 Ollama
推荐方式(自动配置):
ollama launch claude --model qwen3-coder:7b
或手动设置环境变量:
export ANTHROPIC_BASE_URL="http://localhost:11434"
export ANTHROPIC_AUTH_TOKEN="ollama"
claude --model qwen3-coder:7b
步骤 4:测试运行
进入项目文件夹,输入 claude,然后直接说:
'帮我创建一个 Hello World 网站'
即可看到 Claude Code 自动分析目录、创建文件、执行操作,全程本地运行,流畅顺滑。
注意事项 & 进阶 Tips
- 模型选择:编码能力以 Qwen3-Coder 和 GLM 系列最佳,Gemma2 次之。后续 Ollama 将持续支持更多工具调用能力强的模型。
- 硬件要求:7B 模型可在普通笔记本运行,30B 模型建议配备 GPU 或 32GB 以上内存。
- 隐私优势:所有数据处理均在本地完成,无需联网。
- 局限说明:本地模型的智能水平略逊于云端 Claude Opus,但对绝大多数开发任务已足够,且完全免费。


