Ollama免费获取Gemini-3-pro模型并连接AI Coding工具

1. 在Ollama获取Gemini 3 pro

Gemini 3 Pro 现已加入 Ollama 的免费套餐,不再需要付费订阅 Cloud Max 或 Pro 服务,即可体验这款功能强大的多模态模型。此外,此次集成将 Gemini 3 Pro 的先进推理功能直接融入到数百万用户已在使用的 Ollama 本地模型工作流程中。

只需执行一条命令:

ollama run gemini-3-pro-preview 

此命令无需额外计费即可拉取并运行模型。此外,该模型支持 100 万个令牌的上下文窗口、原生多模态输入(文本、图像、音频、视频)以及高级代理功能。

在代码中集成该模型:

from openai import OpenAI client = OpenAI( base_url="http://localhost:11434/v1", api_key="ollama",# dummy key) response = client.chat.completions.create( model="gemini-3-pro-preview", messages=[{"role":"user","content":"Write a poem."}])print(response.choices[0].message.content)

2. 在AI coding中集成Gemini:

下面介绍如何在Cursor或Cline中使用该模型:

2.1 整体思路概览

Cursor 支持通过以下方式访问模型:

  1. 官方支持的云提供商(OpenAI、Anthropic、Google 等);
  2. “自定义 OpenAI API Base URL + API Key”,用来连接 OpenAI API 兼容的自定义端点(例如一个本地代理)。

核心目标是:

Ollama 本地 Gemini 3 Pro server → HTTP 代理/反向代理 → OpenAI 兼容 API endpoint → Cursor 

换句话说,要让 Cursor 看到的是一个 OpenAI API 格式的服务,背后再把请求转发给本地 Ollama。

2.2 前提准备

先在本机确保 Ollama 能正常运行模型:

# 拉取并运行模型 ollama pull gemini-3-pro-preview ollama serve 

默认 Ollama Serve 会启动在:

http://localhost:11434 

这个端点支持 OpenAI API 兼容模式(但 Cursor 默认不能直连 localhost)。

2.3 搭建OpenAI 兼容的代理

由于 Cursor 不直接访问 localhost,因此需要通过一个可公网访问的代理或一个中间服务,使其对外呈现 OpenAI API 格式。

2.3.1 使用ngrok代理

适用情境:没有公网服务器,只是开发机;希望快速连接。

  1. 安装 ngrok 并登录:
ngrok authtoken YOUR_NGROK_TOKEN 
  1. 将本地 Ollama 服务映射到外网:
ngrok http 11434
  1. 记录 ngrok 给出的公网 URL,例如:
https://xxxxxxxxxx.ngrok.io 

这个 URL 就是后续要填给 Cursor 的 “Custom Base URL”。

注意:ngrok URL 会变;如果关掉 ngrok或电脑重启可能需要重新启动并更新到 Cursor 设置里。

但是国内使用该方法容易遇到问题:

ngrok http 11434显示reconnecting (failed to send authentication request: failed to fetch CRL. errors encounter 

这是一个典型的 ngrok 在国内/受限网络环境下的 TLS 证书吊销列表(CRL)获取失败问题。因此,最好使用另一种方法——cloudflare。

2.3.2 使用cloudflare代理
  1. 安装cloudflare:
winget install Cloudflare.cloudflared 
  1. 登录cloudflare:
cloudflared login 

此处会弹出网页开始登录,没有账号需要新建账号。基本按默认选项勾选,唯一要注意的是需要设置域名,因为cloudflare的工作方式是:

公网域名 → Cloudflare Edge → 你的本地服务(Ollama) 

所以cloudflare必须知道:

  • 你要用哪个 域名 对外暴露服务
  • Cloudflare 才能为这个域名配置 DNS + Tunnel 路由

因此需要设置任意一个域名,例如example-ollama.dev

  1. 暴露 Ollama 的 OpenAI API
cloudflared tunnel --url http://localhost:11434 

运行后的输出可能类似于:

>cloudflared tunnel --url http://localhost:11434 2025-12-13T04:09:37Z INF Thank you for trying Cloudflare Tunnel. Doing so, without a Cloudflare account, is a quick way to experiment and try it out. However, be aware that these account-less Tunnels have no uptime guarantee, are subject to the Cloudflare Online Services Terms of Use (https://www.cloudflare.com/website-terms/), and Cloudflare reserves the right to investigate your use of Tunnels for violations of such terms. If you intend to use Tunnels in production you should use a pre-created named tunnel by following: https://developers.cloudflare.com/cloudflare-one/connections/connect-apps 2025-12-13T04:09:37Z INF Requesting new quick Tunnel on trycloudflare.com... 2025-12-13T04:09:42Z INF +--------------------------------------------------------------------------------------------+ 2025-12-13T04:09:42Z INF | Your quick Tunnel has been created! Visit it at (it may take some time to be reachable): |2025-12-13T04:09:42Z INF | https://pvc-shots-vacuum-floors.trycloudflare.com |2025-12-13T04:09:42Z INF +--------------------------------------------------------------------------------------------+ 2025-12-13T04:09:42Z INF Cannot determine default configuration path. No file[config.yml config.yaml]in[~/.cloudflared ~/.cloudflare-warp ~/cloudflare-warp]2025-12-13T04:09:42Z INF Version 2025.8.1 (Checksum b5d598b00cc3a28cabc5812d9f762819334614bae452db4e7f23eefe7b081556)2025-12-13T04:09:42Z INF GOOS: windows, GOVersion: go1.24.2, GoArch: amd64 2025-12-13T04:09:42Z INF Settings: map[ha-connections:1 protocol:quic url:http://localhost:11434]2025-12-13T04:09:42Z INF cloudflared will not automatically update on Windows systems. 2025-12-13T04:09:42Z INF Generated Connector ID: 0706ac77-90b1-4ddb-9d71-3e8177816a8f 2025-12-13T04:09:42Z INF Initial protocol quic 2025-12-13T04:09:42Z INF ICMP proxy will use 192.168.10.7 as sourcefor IPv4 2025-12-13T04:09:42Z INF ICMP proxy will use 2409:8a30:5a0:eeb1:347c:8cf1:4dd3:666d in zone WLAN as sourcefor IPv6 2025-12-13T04:09:42Z INF cloudflared does not support loading the system root certificate pool on Windows. Please use --origin-ca-pool <PATH> to specify the path to the certificate pool 2025-12-13T04:09:42Z INF ICMP proxy will use 192.168.10.7 as sourcefor IPv4 2025-12-13T04:09:42Z INF Tunnel connection curve preferences: [X25519MLKEM768 CurveP256]connIndex=0event=0ip=198.41.192.57 2025-12-13T04:09:42Z INF ICMP proxy will use 2409:8a30:5a0:eeb1:347c:8cf1:4dd3:666d in zone WLAN as sourcefor IPv6 2025-12-13T04:09:42Z INF Starting metrics server on 127.0.0.1:20241/metrics 2025-12-13T04:09:43Z INF Registered tunnel connection connIndex=0connection=9d75de6d-a1de-4846-b6ea-85aa32ee3450 event=0ip=198.41.192.57 location=lax11 protocol=quic 

其中可以看到映射的公网地址是 https://pvc-shots-vacuum-floors.trycloudflare.com,注意每次重新运行其地址后会不一样,需要重新在AI Coding工具中设置。

  1. 在AI Coding工具中设置

现在可以在Cursor、Cline等工具中进行设置了:

Base URL: https://pvc-shots-vacuum-floors.trycloudflare.com/v1 APIKey: ollama Model: gemini-3-pro-preview 

对于Cline,此时已经可以正常使用:

在这里插入图片描述

但是实际使用时可以看到,Cursor中自带gemini-3-pro-preview,并且Cursor 内部对模型名做了 白名单 + 路由绑定,例如:gpt-4.1、claude-3.5-sonnet、gemini-3-pro-preview。

这些名称在 Cursor 看来是“官方托管模型”。即使开启了 Custom OpenAI API,只要模型名命中内置列表,Cursor 就会:

忽略 Base URL → 强制走 Cursor 云端 

因此,需要对自己设置的Ollama本地Gemini做改名:

  1. 在任意目录(例如桌面)新建一个文本文件,文件名必须叫:Modelfile,注意没有任何扩展名;
  2. 打开该文件,填写信息:FROM gemini-3-pro-preview
  3. 在文件所在地址打开命令提示符,命令为ollama create gemini-3-pro-local -f Modelfile
  4. 命令ollama list观察是否有gemini-3-pro-local模型存在,如有则改名成功。

在Cursor的模型名称中将模型名字改为gemini-3-pro-local,即可正常使用。

Read more

手把手教你用Whisper-large-v3搭建个人语音转文字服务

手把手教你用Whisper-large-v3搭建个人语音转文字服务 1. 为什么你需要一个自己的语音转文字服务 你有没有遇到过这些场景: * 开完一场两小时的线上会议,想快速整理会议纪要,却要花半天时间听录音打字; * 收到客户发来的5分钟语音咨询,一边回消息一边反复暂停播放,手忙脚乱; * 做自媒体剪辑时,反复听口播素材写字幕,耳朵累、效率低、还容易漏字。 市面上的在线语音识别工具看似方便,但存在几个现实问题:音频上传慢、隐私有风险、中文识别不准、长语音断句混乱、不支持本地部署——尤其当你处理的是内部会议、客户沟通或敏感内容时,把语音传到别人服务器上,真的安心吗? 而今天要带你搭的这个服务,就解决了所有痛点:它跑在你自己的机器上,99种语言自动识别,中文准确率高,支持实时录音和批量上传,GPU加速后30秒音频2秒出结果,全程不联网、不上传、不依赖第三方API。 这不是概念演示,而是已经稳定运行的完整Web服务——镜像名称叫“Whisper语音识别-多语言-large-v3语音识别模型 二次开发构建by113小贝”,基于OpenAI最新版Whisper Large

一文讲清:AI、AGI、AIGC、NLP、LLM、ChatGPT的区别与联系

一文讲清:AI、AGI、AIGC、NLP、LLM、ChatGPT的区别与联系

AI行业的“术语”很多,但它们到底是什么关系?有什么层级逻辑?作为开发者或想转行 AI 应用工程师的人,该从哪学起?今天我们来说一下 本文用一张层次图 + 六段解释,让你彻底搞懂它们的区别与联系。 一、AI:人工智能的最上层概念 AI(Artificial Intelligence,人工智能)是所有智能技术的总称。 它的目标是让机器模仿人的智能行为,例如学习、推理、判断、理解语言、感知世界。 AI 涵盖的分支非常多,包括: * 计算机视觉(CV) * 自然语言处理(NLP) * 语音识别(ASR) * 智能决策系统 * 强化学习(RL) 可以理解为:AI 是整个智能技术的“天花板概念”,下面的所有都属于它的子集。 二、AGI:通用人工智能 AGI(Artificial General

Intel GPU加速llama.cpp:SYCL后端完整配置与性能调优指南

Intel GPU加速llama.cpp:SYCL后端完整配置与性能调优指南 【免费下载链接】llama.cppPort of Facebook's LLaMA model in C/C++ 项目地址: https://gitcode.com/GitHub_Trending/ll/llama.cpp 随着Intel Arc显卡在消费级市场的普及,越来越多的开发者希望利用Intel GPU来加速大语言模型的推理。llama.cpp作为当前最流行的开源LLM推理框架,通过SYCL后端为Intel GPU提供了强大的计算支持。本文将从实际使用角度出发,深入解析SYCL后端的配置要点和性能优化技巧。 为什么SYCL是Intel GPU的最佳选择? 在llama.cpp的多后端架构中,SYCL相比传统的OpenCL具有显著优势。SYCL基于现代C++标准,提供了更简洁的编程模型和更好的编译器支持。对于Intel Arc显卡用户,SYCL能够充分利用Xe架构的硬件特性,在矩阵乘法等核心操作上实现更高的计算效率。 环境配置:避开常见的安装陷阱 正确安装Intel

开源浪潮下的中国力量:文心一言大模型本地部署与应用全攻略

开源浪潮下的中国力量:文心一言大模型本地部署与应用全攻略

文章目录 * 一、前言 * 1.1 模型开源意义与背景 * 1.2 文心一言大模型简介 * 1.3 测评目标与思路 * 二、文心一言大模型 * 2.1 文心一言开源概况 * 2.2 文心一言大模型技术综述 * 三、文心一言大模型深度解析 * 3.1 开源策略与生态影响 * 3.1.1 开源时间与版本介绍 * 3.2 模型特性与优势 * 四、部署实战:从 GitCode下载ERNIE-4.5-0.3B 模型到本地可交互服务 * 4.1 环境准备与部署方式 * 4.2 下载与安装步骤 * 4.3 调用示例与接口说明 * 编写部署测试脚本 * 五、