1. 在 Ollama 获取 Gemini-3 Pro
Gemini-3 Pro 现已加入 Ollama 的免费套餐,不再需要付费订阅 Cloud Max 或 Pro 服务,即可体验这款功能强大的多模态模型。此外,此次集成将 Gemini-3 Pro 的先进推理功能直接融入到数百万用户已在使用的 Ollama 本地模型工作流程中。
只需执行一条命令:
ollama run gemini-3-pro-preview
此命令无需额外计费即可拉取并运行模型。此外,该模型支持 100 万个令牌的上下文窗口、原生多模态输入(文本、图像、音频、视频)以及高级代理功能。
在代码中集成该模型:
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:11434/v1",
api_key="ollama" # dummy key
)
response = client.chat.completions.create(
model="gemini-3-pro-preview",
messages=[{"role": "user", "content": "Write a poem."}]
)
print(response.choices[0].message.content)
2. 在 AI 编程工具中集成 Gemini
下面介绍如何在 Cursor 或 Cline 中使用该模型:
2.1 整体思路概览
Cursor 支持通过以下方式访问模型:
- 官方支持的云提供商(OpenAI、Anthropic、Google 等);
- '自定义 OpenAI API Base URL + API Key',用来连接 OpenAI API 兼容的自定义端点(例如一个本地代理)。
核心目标是:
Ollama 本地 Gemini-3 Pro server → HTTP 代理/反向代理 → OpenAI 兼容 API endpoint → Cursor
换句话说,要让 Cursor 看到的是一个 OpenAI API 格式的服务,背后再把请求转发给本地 Ollama。
2.2 前提准备
先在本机确保 Ollama 能正常运行模型:
# 拉取并运行模型
ollama pull gemini-3-pro-preview
ollama serve
默认 Ollama Serve 会启动在:
http://localhost:11434
这个端点支持 OpenAI API 兼容模式(但 Cursor 默认不能直连 localhost)。
2.3 搭建 OpenAI 兼容的代理
由于 Cursor 不直接访问 localhost,因此需要通过一个可公网访问的代理或一个中间服务,使其对外呈现 OpenAI API 格式。
2.3.1 使用 ngrok 代理
适用情境:没有公网服务器,只是开发机;希望快速连接。

