Gemini 系列模型详细对比及 Google AI Studio 免费使用说明

优质文章学习记录

08 Apr 2026 — 7 min read

Gemini 系列模型详细对比 (2.5 Pro Preview, 2.0 Flash, Flash Image Gen Exp, Flash-Lite, Flash Thinking Exp) 及 Google AI Studio 免费使用说明

以下是根据您提供的五张图片对各个模型的详细解释和归纳：

1. Gemini 2.5 Pro Preview 03-25 (gemini-2.5-pro-preview-03-25)

定位: 功能最强大、上下文窗口最大的预览版模型。
API 定价 (每百万 Tokens):
- 输入 <= 200K tokens: $1.25
- 输出 <= 200K tokens: $10.00
- 输入 > 200K tokens: $2.50
- 输出 > 200K tokens: $15.00
- (注：API 定价，通过 UI 使用免费)
擅长领域: 编码 (Coding), 推理 (Reasoning), 多模态理解 (Multimodal understanding)。
使用场景: 解决复杂问题，处理困难的代码、数学和 STEM 问题，利用长上下文分析大型数据集、代码库或文档。
知识截止: 2025 年 1 月。
速率限制 (Rate limits):
- 付费/高配额: 150 RPM (每分钟请求数)
- 免费 (Google AI Studio): 5 RPM, 25 req/day (每日请求数)
延迟 (Latency): 中等。

2. Gemini 2.0 Flash (gemini-2.0-flash)

定位: 速度快、成本效益高的多模态模型。
API 定价 (每百万 Tokens):
- 输入: $0.10
- 输出: $0.40
- (适用于所有上下文长度，API 定价，通过 UI 使用免费)
擅长领域: 多模态理解 (Multimodal understanding), 实时流式处理 (Realtime streaming), 原生工具使用 (Native tool use)。
使用场景: 处理万行级别的代码，原生调用工具 (如搜索)，实时流式传输图像和视频。
知识截止: 2024 年 8 月。
速率限制 (Rate limits):
- 付费/高配额: 2000 RPM
- 免费 (Google AI Studio): 15 RPM, 1500 req/day
延迟 (Latency): 中低（比 2.5 Pro 快）。

3. Gemini 2.0 Flash (Image Generation) Experimental (gemini-2.0-flash-exp-image-generation)

定位: 实验性的、专注于图像生成的多模态模型。
API 定价 (每百万 Tokens):
- 输入: $0.00
- 输出: $0.00
- (当前 API 免费，可能是实验性或促销性质。通过 UI 使用也免费)
擅长领域: 多模态理解 (Multimodal understanding), 多模态生成 (Multimodal generation), 原生工具使用 (Native tool use)。
使用场景: 处理万行级别的代码，原生调用工具 (如搜索)，生成穿插文本和图像的内容。
知识截止: 2024 年 8 月。
速率限制 (Rate limits):
- 付费/高配额: 10 RPM
- 免费 (Google AI Studio): 10 RPM, 1500 req/day
- (注意：免费和付费 RPM 相同，反映其实验性质)
延迟 (Latency): 中等。

4. Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)

定位: 最轻量级、速度最快、成本最低的 Flash 版本。
API 定价 (每百万 Tokens):
- 输入: $0.075
- 输出: $0.30
- (适用于所有上下文长度，API 定价，通过 UI 使用免费)
擅长领域: 长上下文 (Long Context), 实时流式处理 (Realtime streaming), 原生工具使用 (Native tool use)。
使用场景: 处理万行级别的代码，原生调用工具 (如搜索)，实时流式传输图像和视频。
知识截止: 2024 年 8 月。
速率限制 (Rate limits):
- 付费/高配额: 4000 RPM
- 免费 (Google AI Studio): 30 RPM, 1500 req/day
延迟 (Latency): 低 (是这五个模型中最低的)。

5. Gemini 2.0 Flash Thinking Experimental 01-21 (gemini-2.0-flash-thinking-exp-01-21)

定位: 实验性的、能展示思考过程的模型。
API 定价 (每百万 Tokens):
- 输入: $0.00
- 输出: $0.00
- (当前 API 免费，可能是实验性或促销性质。通过 UI 使用也免费)
擅长领域: 多模态理解 (Multimodal understanding), 推理 (Reasoning), 编码 (Coding)。
使用场景: 对最复杂的问题进行推理，展示模型的思考过程 (Show the thinking process of the model)，处理困难的代码和数学问题。
知识截止: 2024 年 8 月。
速率限制 (Rate limits):
- 付费/高配额: 10 RPM
- 免费 (Google AI Studio): 10 RPM, 1500 req/day
- (注意：免费和付费 RPM 相同，反映其实验性质)
延迟 (Latency): 中等。

模型归纳总结:

能力层级: Gemini 2.5 Pro Preview > Gemini 2.0 Flash ≈ Gemini 2.0 Flash Thinking Exp ≈ Gemini 2.0 Flash Image Gen Exp > Gemini 2.0 Flash-Lite。Pro 版本在推理、编码和长上下文处理上更强，但成本更高，免费额度最低。
Flash 系列: Flash 系列（包括 Flash, Flash-Lite, 和两个 Experimental 版本）旨在提供速度和成本效益。Flash-Lite 是其中最快、最便宜的版本。
Experimental 版本: 这两个实验性模型 (Image Generation 和 Thinking) 目前 API 免费，提供了独特的功能（图像生成、展示思考过程），但速率限制较低且可能不稳定或未来会收费。
知识库: 2.5 Pro Preview 的知识更新到 2025 年 1 月，而其他 Flash 系列模型截止到 2024 年 8 月。
延迟与吞吐量: Flash-Lite 延迟最低，免费 RPM 最高。2.5 Pro Preview 免费 RPM 和每日请求数最低。Flash (标准版) 在免费额度和延迟之间取得较好平衡。实验性模型免费 RPM 较低。

关于 Google AI Studio 免费使用的解释:

是的，您的问题理解是正确的。直接在 Google AI Studio 这个用户界面 (UI) 中使用这些 Gemini 模型是免费的。

这里的“免费”具体含义是：

Google AI Studio 平台本身免费： 访问和使用 Google AI Studio 的网站界面不需要付费。
模型调用在免费配额内免费： 当您在 Google AI Studio 中与这些模型互动（例如，通过聊天界面提问、运行代码生成等）时，这些操作实际上是在调用相应的 Gemini API。只要您的调用频率和总量没有超过 Google 为每个模型设定的免费层级配额 (Free Tier Quota)，这些调用就是免费的。
超出配额会报错，而非收费： 如果您在 Google AI Studio 中的使用量超过了免费配额（例如，在一分钟内发送了过多请求 RPM，或一天内总请求数超过 RPD），您会收到错误提示，API 调用将暂时失败，直到您的使用频率回落到限制内。您不会因为在 Google AI Studio 中超出免费配额而被自动收取费用。 只有当您明确设置了结算账号，并将项目升级到付费计划，并通过 API（而不是 AI Studio UI）进行调用超出了免费额度时，才会产生费用。

各模型在 Google AI Studio 中的每日免费额度总结:

Gemini 2.5 Pro Preview 03-25:
- 每分钟请求数 (RPM): 5
- 每日请求数 (RPD): 25
Gemini 2.0 Flash:
- 每分钟请求数 (RPM): 15
- 每日请求数 (RPD): 1500
Gemini 2.0 Flash (Image Generation) Experimental:
- 每分钟请求数 (RPM): 10
- 每日请求数 (RPD): 1500
Gemini 2.0 Flash-Lite:
- 每分钟请求数 (RPM): 30
- 每日请求数 (RPD): 1500
Gemini 2.0 Flash Thinking Experimental 01-21:
- 每分钟请求数 (RPM): 10
- 每日请求数 (RPD): 1500

重要提示:

这些免费配额是针对每个 Google Cloud 项目单独计算的。
速率限制 (RPM 和 RPD) 是使用这些模型时需要注意的主要免费限制。
虽然图片中显示两个实验性模型的 API 定价为 $0.00，但这通常是暂时的，未来可能会调整。但在 Google AI Studio 中使用它们始终遵循上述免费配额规则。

Flutter 组件 ews 的适配鸿蒙Harmony 实战 - 驾驭企业级 Exchange Web Services 协议、实现鸿蒙端政企办公同步与高安通讯隔离方案

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 ews 的适配鸿蒙Harmony 实战 - 驾驭企业级 Exchange Web Services 协议、实现鸿蒙端政企办公同步与高安通讯隔离方案前言在鸿蒙（OpenHarmony）生态进军政企办公领域的过程中，与现有企业信息化基础设施的深度集成是一道必答题。即便是在全连接、分布式的今天，微软的 Exchange 服务器依然是全球无数大厂与政务系统处理邮件、日历同步的核心底座。对于习惯了简单 http.get 的移动开发者来说，Exchange Web Services（EWS）协议由于其复杂的 SOAP 封装、繁琐的 XML 数据结构以及极其严苛的身份认证机制，往往是一块难啃的“骨头”。 ews 库为 Dart 提供了成熟的、类型安全的

前端微前端架构：大项目的救命稻草还是自找麻烦？

前端微前端架构：大项目的救命稻草还是自找麻烦？毒舌时刻微前端？听起来就像是一群前端工程师为了显得自己很高级，特意发明的复杂术语。不就是把一个大应用拆成几个小应用嘛，至于搞得这么玄乎吗？你以为拆成微前端就能解决所有问题？别做梦了！到时候你会发现，调试变得更麻烦了，部署变得更复杂了，甚至连样式都可能互相冲突。为什么你需要这个 1. 大型应用的可维护性：当你的应用变得越来越大，单靠一个团队已经无法高效维护时，微前端可以让不同团队独立开发和部署各自的模块。 2. 技术栈的灵活性：不同的微前端可以使用不同的技术栈，比如一个模块用React，另一个模块用Vue，这样可以根据团队的专长选择最合适的技术。 3. 独立部署：微前端可以独立部署，不需要整个应用一起发布，这样可以减少发布风险，加快发布速度。 4. 团队协作：不同团队可以独立开发各自的微前端，减少代码冲突和沟通成本。反面教材 // 这是一个典型的单体应用结构 import React from 'react'; import ReactDOM from 'react-dom'

MaxKB 新手保姆级教程：从零到一，亲手搭建你的专属 AI 知识库助手

你是否曾想过，能拥有一个只回答你自己领域知识的 AI 聊天机器人？一个能 7x24 小时为客户解答产品问题、为公司员工提供内部资料查询的智能客服？MaxKB 就是这样一款强大且开源的工具，它能帮助你轻松实现这个想法。本文是一篇面向新手的、极其详尽的指南。将手把手带你完成 MaxKB 的安装、配置，并深入讲解如何创建和优化你的知识库，最后还将详细拆解其最强大的“高级应用”功能，让你真正掌握这个利器。一、安装 MaxKB：三步搞定，小白也能行对于新手而言，服务器环境配置往往是第一道坎。别担心，我们选用宝塔面板来简化一切操作。 1. 2. 执行安装命令 Docker 环境就绪后，点击面板左侧的终端，这会打开一个命令输入窗口。复制以下这行命令，粘贴进去，然后按下回车键。准备 Docker 环境登录你的宝塔面板，在左侧菜单栏中找到并点击 docker。如果你是第一次使用，系统会提示你安装

Flutter Web 混合开发：构建跨平台 Web 应用

Flutter Web 混合开发：构建跨平台 Web 应用代码如诗，Web 如画。让我们用 Flutter Web 的强大能力，构建出既美观又高性能的跨平台 Web 应用。什么是 Flutter Web？ Flutter Web 是 Flutter 框架的 Web 支持，它允许开发者使用 Flutter 的 UI 框架和 Dart 语言来构建 Web 应用。Flutter Web 将 Dart 代码编译为 JavaScript，使其能够在浏览器中运行。 Flutter Web 的优势 1. 单一代码库：一套代码可以同时构建 Web、移动端和桌面端应用。

Gemini 系列模型详细对比 (2.5 Pro Preview, 2.0 Flash, Flash Image Gen Exp, Flash-Lite, Flash Thinking Exp) 及 Google AI Studio 免费使用说明

Read more

Flutter 组件 ews 的适配 鸿蒙Harmony 实战 - 驾驭企业级 Exchange Web Services 协议、实现鸿蒙端政企办公同步与高安通讯隔离方案

前端微前端架构：大项目的救命稻草还是自找麻烦？

MaxKB 新手保姆级教程：从零到一，亲手搭建你的专属 AI 知识库助手

Flutter Web 混合开发：构建跨平台 Web 应用

Flutter 组件 ews 的适配鸿蒙Harmony 实战 - 驾驭企业级 Exchange Web Services 协议、实现鸿蒙端政企办公同步与高安通讯隔离方案