Gemini 系列模型详细对比 及 Google AI Studio 免费使用说明

Gemini 系列模型详细对比 及 Google AI Studio 免费使用说明

Gemini 系列模型详细对比 (2.5 Pro Preview, 2.0 Flash, Flash Image Gen Exp, Flash-Lite, Flash Thinking Exp) 及 Google AI Studio 免费使用说明

以下是根据您提供的五张图片对各个模型的详细解释和归纳:

1. Gemini 2.5 Pro Preview 03-25 (gemini-2.5-pro-preview-03-25)

  • 定位: 功能最强大、上下文窗口最大的预览版模型。
  • API 定价 (每百万 Tokens):
    • 输入 <= 200K tokens: $1.25
    • 输出 <= 200K tokens: $10.00
    • 输入 > 200K tokens: $2.50
    • 输出 > 200K tokens: $15.00
    • (注:API 定价,通过 UI 使用免费)
  • 擅长领域: 编码 (Coding), 推理 (Reasoning), 多模态理解 (Multimodal understanding)。
  • 使用场景: 解决复杂问题,处理困难的代码、数学和 STEM 问题,利用长上下文分析大型数据集、代码库或文档。
  • 知识截止: 2025 年 1 月。
  • 速率限制 (Rate limits):
    • 付费/高配额: 150 RPM (每分钟请求数)
    • 免费 (Google AI Studio): 5 RPM, 25 req/day (每日请求数)
  • 延迟 (Latency): 中等。

2. Gemini 2.0 Flash (gemini-2.0-flash)

  • 定位: 速度快、成本效益高的多模态模型。
  • API 定价 (每百万 Tokens):
    • 输入: $0.10
    • 输出: $0.40
    • (适用于所有上下文长度,API 定价,通过 UI 使用免费)
  • 擅长领域: 多模态理解 (Multimodal understanding), 实时流式处理 (Realtime streaming), 原生工具使用 (Native tool use)。
  • 使用场景: 处理万行级别的代码,原生调用工具 (如搜索),实时流式传输图像和视频。
  • 知识截止: 2024 年 8 月。
  • 速率限制 (Rate limits):
    • 付费/高配额: 2000 RPM
    • 免费 (Google AI Studio): 15 RPM, 1500 req/day
  • 延迟 (Latency): 中低(比 2.5 Pro 快)。

3. Gemini 2.0 Flash (Image Generation) Experimental (gemini-2.0-flash-exp-image-generation)

  • 定位: 实验性的、专注于图像生成的多模态模型。
  • API 定价 (每百万 Tokens):
    • 输入: $0.00
    • 输出: $0.00
    • (当前 API 免费,可能是实验性或促销性质。通过 UI 使用也免费)
  • 擅长领域: 多模态理解 (Multimodal understanding), 多模态生成 (Multimodal generation), 原生工具使用 (Native tool use)。
  • 使用场景: 处理万行级别的代码,原生调用工具 (如搜索),生成穿插文本和图像的内容。
  • 知识截止: 2024 年 8 月。
  • 速率限制 (Rate limits):
    • 付费/高配额: 10 RPM
    • 免费 (Google AI Studio): 10 RPM, 1500 req/day
    • (注意:免费和付费 RPM 相同,反映其实验性质)
  • 延迟 (Latency): 中等。

4. Gemini 2.0 Flash-Lite (gemini-2.0-flash-lite)

  • 定位: 最轻量级、速度最快、成本最低的 Flash 版本。
  • API 定价 (每百万 Tokens):
    • 输入: $0.075
    • 输出: $0.30
    • (适用于所有上下文长度,API 定价,通过 UI 使用免费)
  • 擅长领域: 长上下文 (Long Context), 实时流式处理 (Realtime streaming), 原生工具使用 (Native tool use)。
  • 使用场景: 处理万行级别的代码,原生调用工具 (如搜索),实时流式传输图像和视频。
  • 知识截止: 2024 年 8 月。
  • 速率限制 (Rate limits):
    • 付费/高配额: 4000 RPM
    • 免费 (Google AI Studio): 30 RPM, 1500 req/day
  • 延迟 (Latency): 低 (是这五个模型中最低的)。

5. Gemini 2.0 Flash Thinking Experimental 01-21 (gemini-2.0-flash-thinking-exp-01-21)

  • 定位: 实验性的、能展示思考过程的模型。
  • API 定价 (每百万 Tokens):
    • 输入: $0.00
    • 输出: $0.00
    • (当前 API 免费,可能是实验性或促销性质。通过 UI 使用也免费)
  • 擅长领域: 多模态理解 (Multimodal understanding), 推理 (Reasoning), 编码 (Coding)。
  • 使用场景: 对最复杂的问题进行推理,展示模型的思考过程 (Show the thinking process of the model),处理困难的代码和数学问题。
  • 知识截止: 2024 年 8 月。
  • 速率限制 (Rate limits):
    • 付费/高配额: 10 RPM
    • 免费 (Google AI Studio): 10 RPM, 1500 req/day
    • (注意:免费和付费 RPM 相同,反映其实验性质)
  • 延迟 (Latency): 中等。

模型归纳总结:

  • 能力层级: Gemini 2.5 Pro Preview > Gemini 2.0 Flash ≈ Gemini 2.0 Flash Thinking Exp ≈ Gemini 2.0 Flash Image Gen Exp > Gemini 2.0 Flash-Lite。Pro 版本在推理、编码和长上下文处理上更强,但成本更高,免费额度最低。
  • Flash 系列: Flash 系列(包括 Flash, Flash-Lite, 和两个 Experimental 版本)旨在提供速度和成本效益。Flash-Lite 是其中最快、最便宜的版本。
  • Experimental 版本: 这两个实验性模型 (Image Generation 和 Thinking) 目前 API 免费,提供了独特的功能(图像生成、展示思考过程),但速率限制较低且可能不稳定或未来会收费。
  • 知识库: 2.5 Pro Preview 的知识更新到 2025 年 1 月,而其他 Flash 系列模型截止到 2024 年 8 月。
  • 延迟与吞吐量: Flash-Lite 延迟最低,免费 RPM 最高。2.5 Pro Preview 免费 RPM 和每日请求数最低。Flash (标准版) 在免费额度和延迟之间取得较好平衡。实验性模型免费 RPM 较低。

关于 Google AI Studio 免费使用的解释:

是的,您的问题理解是正确的。直接在 Google AI Studio 这个用户界面 (UI) 中使用这些 Gemini 模型是免费的。

这里的“免费”具体含义是:

  1. Google AI Studio 平台本身免费: 访问和使用 Google AI Studio 的网站界面不需要付费。
  2. 模型调用在免费配额内免费: 当您在 Google AI Studio 中与这些模型互动(例如,通过聊天界面提问、运行代码生成等)时,这些操作实际上是在调用相应的 Gemini API。只要您的调用频率和总量没有超过 Google 为每个模型设定的免费层级配额 (Free Tier Quota),这些调用就是免费的。
  3. 超出配额会报错,而非收费: 如果您在 Google AI Studio 中的使用量超过了免费配额(例如,在一分钟内发送了过多请求 RPM,或一天内总请求数超过 RPD),您会收到错误提示,API 调用将暂时失败,直到您的使用频率回落到限制内。您不会因为在 Google AI Studio 中超出免费配额而被自动收取费用。 只有当您明确设置了结算账号,并将项目升级到付费计划,并通过 API(而不是 AI Studio UI)进行调用超出了免费额度时,才会产生费用。

各模型在 Google AI Studio 中的每日免费额度总结:

  • Gemini 2.5 Pro Preview 03-25:
    • 每分钟请求数 (RPM): 5
    • 每日请求数 (RPD): 25
  • Gemini 2.0 Flash:
    • 每分钟请求数 (RPM): 15
    • 每日请求数 (RPD): 1500
  • Gemini 2.0 Flash (Image Generation) Experimental:
    • 每分钟请求数 (RPM): 10
    • 每日请求数 (RPD): 1500
  • Gemini 2.0 Flash-Lite:
    • 每分钟请求数 (RPM): 30
    • 每日请求数 (RPD): 1500
  • Gemini 2.0 Flash Thinking Experimental 01-21:
    • 每分钟请求数 (RPM): 10
    • 每日请求数 (RPD): 1500

重要提示:

  • 这些免费配额是针对每个 Google Cloud 项目单独计算的。
  • 速率限制 (RPM 和 RPD) 是使用这些模型时需要注意的主要免费限制。
  • 虽然图片中显示两个实验性模型的 API 定价为 $0.00,但这通常是暂时的,未来可能会调整。但在 Google AI Studio 中使用它们始终遵循上述免费配额规则。

Read more

Flutter 组件 ews 的适配 鸿蒙Harmony 实战 - 驾驭企业级 Exchange Web Services 协议、实现鸿蒙端政企办公同步与高安通讯隔离方案

Flutter 组件 ews 的适配 鸿蒙Harmony 实战 - 驾驭企业级 Exchange Web Services 协议、实现鸿蒙端政企办公同步与高安通讯隔离方案

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 ews 的适配 鸿蒙Harmony 实战 - 驾驭企业级 Exchange Web Services 协议、实现鸿蒙端政企办公同步与高安通讯隔离方案 前言 在鸿蒙(OpenHarmony)生态进军政企办公领域的过程中,与现有企业信息化基础设施的深度集成是一道必答题。即便是在全连接、分布式的今天,微软的 Exchange 服务器依然是全球无数大厂与政务系统处理邮件、日历同步的核心底座。 对于习惯了简单 http.get 的移动开发者来说,Exchange Web Services(EWS)协议由于其复杂的 SOAP 封装、繁琐的 XML 数据结构以及极其严苛的身份认证机制,往往是一块难啃的“骨头”。 ews 库为 Dart 提供了成熟的、类型安全的

前端微前端架构:大项目的救命稻草还是自找麻烦?

前端微前端架构:大项目的救命稻草还是自找麻烦? 毒舌时刻 微前端?听起来就像是一群前端工程师为了显得自己很高级,特意发明的复杂术语。不就是把一个大应用拆成几个小应用嘛,至于搞得这么玄乎吗? 你以为拆成微前端就能解决所有问题?别做梦了!到时候你会发现,调试变得更麻烦了,部署变得更复杂了,甚至连样式都可能互相冲突。 为什么你需要这个 1. 大型应用的可维护性:当你的应用变得越来越大,单靠一个团队已经无法高效维护时,微前端可以让不同团队独立开发和部署各自的模块。 2. 技术栈的灵活性:不同的微前端可以使用不同的技术栈,比如一个模块用React,另一个模块用Vue,这样可以根据团队的专长选择最合适的技术。 3. 独立部署:微前端可以独立部署,不需要整个应用一起发布,这样可以减少发布风险,加快发布速度。 4. 团队协作:不同团队可以独立开发各自的微前端,减少代码冲突和沟通成本。 反面教材 // 这是一个典型的单体应用结构 import React from 'react'; import ReactDOM from 'react-dom'

MaxKB 新手保姆级教程:从零到一,亲手搭建你的专属 AI 知识库助手

MaxKB 新手保姆级教程:从零到一,亲手搭建你的专属 AI 知识库助手

你是否曾想过,能拥有一个只回答你自己领域知识的 AI 聊天机器人?一个能 7x24 小时为客户解答产品问题、为公司员工提供内部资料查询的智能客服?MaxKB 就是这样一款强大且开源的工具,它能帮助你轻松实现这个想法。 本文是一篇面向新手的、极其详尽的指南。将手把手带你完成 MaxKB 的安装、配置,并深入讲解如何创建和优化你的知识库,最后还将详细拆解其最强大的“高级应用”功能,让你真正掌握这个利器。 一、安装 MaxKB:三步搞定,小白也能行 对于新手而言,服务器环境配置往往是第一道坎。别担心,我们选用宝塔面板来简化一切操作。 1. 2. 执行安装命令 Docker 环境就绪后,点击面板左侧的 终端,这会打开一个命令输入窗口。复制以下这行命令,粘贴进去,然后按下回车键。 准备 Docker 环境 登录你的宝塔面板,在左侧菜单栏中找到并点击 docker。如果你是第一次使用,系统会提示你安装

Flutter Web 混合开发:构建跨平台 Web 应用

Flutter Web 混合开发:构建跨平台 Web 应用 代码如诗,Web 如画。让我们用 Flutter Web 的强大能力,构建出既美观又高性能的跨平台 Web 应用。 什么是 Flutter Web? Flutter Web 是 Flutter 框架的 Web 支持,它允许开发者使用 Flutter 的 UI 框架和 Dart 语言来构建 Web 应用。Flutter Web 将 Dart 代码编译为 JavaScript,使其能够在浏览器中运行。 Flutter Web 的优势 1. 单一代码库:一套代码可以同时构建 Web、移动端和桌面端应用。