Cloudflare AI Gateway 接入 Google Gemini 全攻略

Cloudflare AI Gateway + Gemini 接入 AI 聊天客户端教程(大部分内容由AI生成)

哈喽,各位AI爱好者们!是不是觉得直接用 Google Gemini API 有点麻烦,或者想用 LobeChat、ChatGPT-Next-Web 这样的漂亮界面来和 Gemini 聊天?别担心,今天我来手把手教你,如何利用 Cloudflare 的免费 AI Gateway 服务,让你的 Gemini 模型也能在这些客户端里自由驰骋!

核心思路: Cloudflare AI Gateway 提供了一个“翻译官”功能(OpenAI 兼容模式),能把你的聊天客户端发出的请求“翻译”成 Google Gemini 能听懂的语言,再把 Gemini 的回复“翻译”回来。这样,客户端就以为自己在和 OpenAI 聊天,实际上是在和 Gemini 对话!

准备工作:你需要这些东西

  1. Google AI Studio API Key:
    • 这是你和 Gemini 对话的“通行证”。
    • 获取地址:https://aistudio.google.com/app/apikey
    • 登录后点击“创建 API 密钥”,复制下来,它通常以 AIzaSy... 开头。请务必妥善保管,不要泄露!
  2. 一个 Cloudflare 账号:
  3. 一个支持 OpenAI API 的 AI 聊天客户端:
    • 比如:LobeChat、ChatGPT-Next-Web、Ama 等。这些客户端通常都会有“自定义 API URL”或“Base URL”的设置选项。

第一步:创建你的 Cloudflare AI Gateway

这一步是搭建“翻译官”的关键。

  1. 登录 Cloudflare Dashboard。
  2. 在左侧导航栏,找到并点击 "AI",然后选择 "AI Gateway"
  3. 点击右侧的 "Create Gateway" (创建网关)。
  4. 在弹出的窗口中:Gateway Name (网关名称): 给你的网关起一个好记的名字,比如 my-gemini-gateway。点击 "Create"
  5. 点击进入刚刚创建的网关,然后点击右上角的API那个按钮。里边会有后面需要的账户ID和网关名称。
     
  6. 复制你的 AI Gateway 终点 URL:
    • 创建成功后,页面会显示你的 AI Gateway 的详细信息。
    • 在页面顶部,你会看到一个名为 "API 终点" (API Endpoint) 的 URL。它看起来像这样: https://gateway.ai.cloudflare.com/v1/你的账户ID/你的网关名称/google-ai-studio (例如:https://gateway.ai.cloudflare.com/v1/dadsfasdfzcvadsf/my-gemini-gateway/google-ai-studio)注:这是点击universal列框处选Google ai studio后会出现的API端点样式。在最终的url一般就没google-ai-studio这样得后缀了。
    • 请务必复制这个完整的 URL! 这是我们构建最终 API URL 的基础。


cloud flare支持openai兼容端点。将之前在得到的对应放入。

第二步:构建你最终的 API URL(给客户端用)

这是最关键的一步,也是很多人容易出错的地方!

Cloudflare AI Gateway 有一个神奇的 /compat 模式,能让它兼容 OpenAI 的 API 格式。

你最终要提供给客户端的 API URL 是: 你的 AI Gateway 终点 URL 的前面部分 + /compat

举例来说: 如果你的 AI Gateway 终点是: https://gateway.ai.cloudflare.com/v1/dadsfasdfzcvadsf/my-gemini-gateway/google-ai-studio

那么你最终要给客户端填写的 API URL (Base URL) 就是: https://gateway.ai.cloudflare.com/v1/dadsfasdfzcvadsf/my-gemini-gateway/compat

划重点:

  • 不要包含 后面的 /google-ai-studio
  • 不要添加 /chat/completions!大部分客户端会自动添加这部分。

举个cherry studio上边的例子


最后边加上斜杠是因为这样客户端才不会自动加上/v1/chat/completions。最终的url是图中最下方的灰色字体。不同客户端可能会不一样。图中那个v1beta是可以填成v1的,推荐就用v1了。之前我测试的忘记改回来了。

第三步:配置你的 AI 聊天客户端

现在,打开你喜欢的 AI 聊天客户端,找到 API 设置部分。

  1. API URL / Base URL / 接口地址:
    • 填入你在 第二步 中构建的最终 API URL。
    • 例如:https://gateway.ai.cloudflare.com/v1/dadsfasdfzcvadsf/my-gemini-gateway/compat
  2. API Key / Token:
    • 填入你在 准备工作 中获取的 Google AI Studio API Key (以 AIzaSy... 开头的那个)。
  3. 模型选择 (Model Name):
    • 这是另一个容易出错的地方!为了告诉 Cloudflare AI Gateway 你要用哪个提供商的哪个模型,模型名称必须是 {提供商名称}/{模型名称} 的格式。
    • 对于 Gemini 模型,提供商名称是 google-ai-studio
    • 所以,你需要填入的模型名称是:
      • google-ai-studio/gemini-2.5-flash 
      • google-ai-studio/gemini-2.5-pro 
    • 不要只写 gemini-2.5-flash 那样会报错。

        非Google ai studio的可以通过这种方式查看。

Google AI Studio · Cloudflare AI Gateway docs这是对应的官方文档,模型调用方式一般在对应的文章的最后面如Google ai studio的


找model这个关键字。看不懂的话可以问问ai。基本上重点就是这个模型的命名。弄好后在客户端手动加上即可,还是以cherry studio为例。

第四步:发送消息并解决流式乱码问题(主要解决方式是要关闭流式,具体原因我也不知道)

现在,你可以尝试在客户端中发送一条消息给你的 Gemini 模型了!

关于流式输出乱码的问题:

一些用户在使用 Cloudflare AI Gateway 的 compat 端点,并通过某些客户端开启流式输出时,可能会遇到中文乱码内容不完整的情况。

  • 原因分析: 这通常是由于客户端对流式响应的数据包解析不完全,或者编码处理不当导致的。虽然 compat 端点支持流式,但客户端的实现可能与 Cloudflare/Gemini 的流式响应格式存在细微兼容性问题。
  • 解决方案 (推荐):
    • 优先关闭客户端的流式输出功能。 大多数聊天客户端在设置里都有一个“流式输出”、“实时显示”或类似的选项,将其关闭。这样模型会一次性返回完整回复,虽然可能需要稍等片刻,但通常能避免乱码。
    • 如果客户端没有关闭流式输出的选项,或者你确实需要流式体验,那你得自己解决了。有办法的话记得在评论中说说,我也想知道。

恭喜你!

现在,你应该已经成功地通过 Cloudflare AI Gateway,在你的 AI 聊天客户端中愉快地使用 Google Gemini 模型了!

记得检查 Cloudflare AI Gateway 的日志(在你的网关页面点击 "Logs" 标签),看看你的请求是否成功通过。

希望这个教程能帮到你和更多的小白用户!如果你在设置过程中遇到任何问题,欢迎留言讨论。

Read more

AI大模型-attention(注意力机制)与self attention(自注意力机制)

一、Attention(注意力机制) 核心定义:Attention(注意力机制)是 AI 大模型处理信息时模仿人类 “选择性关注” 的核心技术 —— 简单说,模型在面对海量信息(比如一句话、一张图、一段音频)时,不会平均分配算力去处理每一个细节,而是像人一样,只把核心算力聚焦在关键信息上,对无关信息则 “视而不见”,以此提升理解和生成的精准度,同时降低计算成本。 结合实际运作逻辑解释:         人类的注意力是 “有偏向的”:比如你看一张照片时,会自动聚焦在人物的面部,而非背景的花草;读一句话时,会重点关注主语、宾语,而非无关的助词。Attention 机制就是把这种 “偏向性” 量化成可计算的规则: 1. 模型会先给所有待处理的信息(比如一句话里的每个词、一张图里的每个像素)分配一个注意力权重(0~1 之间的数值); 2. 关键信息的权重接近 1(比如照片里的人脸、

By Ne0inhk
IDEA 的 AI 编程插件推荐清单,大大提升你的开发效率!

IDEA 的 AI 编程插件推荐清单,大大提升你的开发效率!

IDEA 的 AI 编程插件推荐清单,大大提升你的开发效率! *一、主流高效工具* *1. GitHub Copilot* 图片 特点: OpenAI 驱动,代码生成精准度高,支持多语言。 适用场景: 快速原型开发、复杂算法实现。 安装: * Settings → Plugins 搜索安装,重启 IDEA。 * 绑定 GitHub 账号(需付费订阅,学生可免费申请)。 优势: 生态兼容性强,社区支持丰富。 注意: 需国际网络访问,企业使用需注意代码合规性。 实践效果: 图片 *2. Amazon CodeWhisperer* 图片 特点: AWS 深度集成,擅长生成云服务(如 Lambda、S3)代码。

By Ne0inhk
优质Skills推荐baoyu-skills:让 AI 帮你搞定技术文章配图与排版(二)

优质Skills推荐baoyu-skills:让 AI 帮你搞定技术文章配图与排版(二)

文章目录 * 1 让 AI 帮你搞定技术文章配图与排版 * 1.1. 一句话结论 * 1.2. 背景与痛点 * 1.3. 核心观点 * 2. 怎么落地:核心能力拆解 * 2.1. 技能全景图:你手里的武器库 * 2.2. 安装与配置 * 3. 奇葩但很真实的观点 * 3.1. 提示词工程的终局是“消失” * 4. 案例分享:从枯燥文档到小红书爆款 * 4.1. 案例实操 * 5. 可复用的 Skill 片段示例 * 6. 参考文献 1 让 AI 帮你搞定技术文章配图与排版 1.1. 一句话结论 如果你在用

By Ne0inhk
旧电脑秒变 AI 员工:OpenClaw 本地部署教程(含环境配置 + 插件开发 + 常见坑)

旧电脑秒变 AI 员工:OpenClaw 本地部署教程(含环境配置 + 插件开发 + 常见坑)

前言 本文基于最新OpenClaw版本编写,适配电脑低配置场景(最低2vCPU+2GiB内存+40GiB SSD),兼容Windows 10/11(优先WSL2)、Ubuntu 20.04+系统,全程纯操作指令,覆盖环境配置、本地部署、插件开发、高频坑排查。核心解决部署卡顿、国内网络适配、插件开发无思路、报错无法排查四大痛点,全程适配国内网络(国内镜像源)、国内大模型(通义千问、阿里云百炼等),无需海外代理,可稳定运行实现自动化办公(文件处理、IM对接、任务调度等)。 一、前置准备(适配优化) 1.1 硬件要求(最低适配) * CPU:Intel i3 4代+/AMD Ryzen 3 2000+(支持虚拟化,

By Ne0inhk