Nano BananaPro生图使用指南:让AI绘画触手可及

Nano BananaPro生图使用指南:让AI绘画触手可及

最近在折腾AI生图的时候,偶然发现了一个让我眼前一亮的工具——Nano BananaPro。说实话,刚开始我也没抱太大期望,毕竟市面上的AI生图工具已经够多了。但用了几天之后,我发现这玩意儿确实有点东西,特别是配合Gemini使用的时候,那种"所想即所得"的感觉真的很爽。

今天就来聊聊这个工具到底怎么用,以及它能帮我们解决哪些实际问题。

一、Nano BananaPro是什么?

简单来说,Nano BananaPro是Google Gemini推出的一个高级图像生成模式。它不是一个独立的应用,而是集成在Gemini生态中的一个功能增强。你可以把它理解为Gemini的"专业绘图模式"——当你需要生成更复杂、更精细的图像时,就该它上场了。

不过,直接在Gemini里手敲提示词其实挺麻烦的,特别是那些需要精确描述的场景。这时候就需要一些辅助工具了,比如Banana Prompt Quicker这个浏览器扩展。它本质上是一个提示词快速插入工具,内置了大量针对Nano BananaPro优化过的提示词模板,覆盖工作、学习、生活等各种场景。

二、如何使用Nano BananaPro生图?

2.1 基础准备

首先你需要:

  1. 一个可以访问Gemini的账号(支持Gemini官网、Google AI Studio、Gemini Enterprise等)
  2. 安装Banana Prompt Quicker浏览器扩展(Chrome Web Store可直接安装)

国内用户福音:

如果你访问Gemini有困难,强烈推荐使用 BigBanana 这个国内镜像站:https://bigbanana.tree456.com/。现在国内直连即可使用,常规套餐价格能比官方低很多,最低甚至能打到约 2 折,省钱又省心[^bigbanana]。

我自己也在用,体验下来有几个明显优势:

  • 无需科学上网:直接访问,速度稳定
  • 界面完全中文化:对国内用户更友好
  • 集成了提示词库:内置大量优质中文提示词,开箱即用
  • 生成速度快:服务器在国内,响应速度比直连Gemini快不少

注册也很简单,邮箱验证就能用。新用户还有免费额度,足够体验各种功能了。我现在基本都在BigBanana上生图,比折腾代理省心多了。

Google官方福利:Gemini Enterprise 免费试用

如果你能科学上网,还有一个更香的选择——Google Gemini Enterprise 商务版现在可以免费试用一个月!

重点来了:

  • 无需绑定信用卡:不用担心自动扣费
  • 登录即可领取:用Google账号登录就能开通
  • 功能全开:免费使用Gemini 2.0、Nano BananaPro、Veo 3视频生成、深度研究等所有高级功能
  • 审查更宽松:Enterprise版本的内容审查比免费版合理很多

领取地址:https://cloud.google.com/gemini-enterprise?hl=zh_cn

操作步骤:

  1. 打开上面的链接
  2. 选择"商务版"(Business Edition)
  3. 用Google账号登录
  4. 按提示完成注册(不需要填信用卡)
  5. 开始免费使用一个月

我自己试过,确实有效。一个月的时间足够你深度体验Nano BananaPro的所有功能了。而且Enterprise版本生成速度更快,配额也更高,体验比免费版好太多。

传统安装方式:

如果你能正常访问Gemini,也可以从Chrome应用商店搜索"Banana Prompt Quicker",点击安装即可。如果你想手动安装,也可以从GitHub下载源码,然后在Chrome的扩展管理页面加载解压后的extension文件夹。

2.2 三种使用方式

方式一:在Gemini页面直接使用

这是最常规的用法。打开Gemini或AI Studio后,你会在输入框旁边看到一个🍌图标。点击它,就会弹出提示词画廊。

// 扩展会自动检测页面并注入按钮 // 支持的选择器配置示例 {   "gemini": {     "promptInput": "div.ql-editor[contenteditable=\"true\"]",     "insertButton": "button.toolbox-drawer-item-deselect-button"   } } 

选择你需要的提示词类型,比如"商务照"、"思维导图"、"电商商品图"等,点击后提示词会自动插入到输入框。如果需要上传参考图片,可以在插入提示词后再添加图片。

方式二:灵光模式(Flash Mode)

这是我个人最喜欢的功能。当你不太确定自己想要什么效果时,可以使用灵光模式。它会通过一系列引导式问题,帮你逐步明确需求。

比如你想生成一张旅行手账:

  • 系统会先问你:去哪个城市?
  • 然后问:计划玩几天?
  • 最后根据你的回答,自动生成包含当地景点、美食、路线的手绘风格插画

这种"选择比填空容易"的设计理念,对新手特别友好。

方式三:右键菜单随处插入

这个功能有点黑科技的意思。在任何网站的任何输入框,右键选择"🍌 Insert Banana Prompts",就能调出提示词画廊。

我经常在写文档、发邮件、甚至在社交媒体发帖时用这个功能。比如在小红书写文案时,可以快速插入"爆款封面"的提示词,然后让AI生成配图。

2.3 实际操作流程

以生成一张"商务照"为例:

  1. 打开Gemini,点击🍌图标
  2. 在分类中选择"工作" → "商务照"
  3. 提示词自动插入:
保持上传图片中人物的面部特征完全一致。 为他们穿上一套专业的海军蓝商务西装和白衬衫。 背景:将主体置于一个干净、纯色的深灰色影棚摄影背景前。 摄影风格:使用索尼A7III相机和85mm f/1.4镜头拍摄,营造出优美的人像压缩效果。 灯光:使用经典的三点式布光。 关键细节:渲染出带有可见毛孔的自然皮肤纹理。 最终图像应为一张超逼真的8k专业头像照。 
  1. 上传你的照片
  2. 点击生成,等待几秒钟
  3. 得到一张专业级的商务照

整个过程不超过1分钟,但效果却能媲美专业摄影棚。关键是提示词已经帮你考虑好了灯光、构图、镜头参数这些专业细节。

三、核心应用场景解析

用了一段时间后,我发现Nano BananaPro在以下几个场景特别好用:

3.1 工作场景:效率翻倍的秘密武器

场景1:PPT制作

以前做PPT最头疼的就是找配图和排版。现在有了"渐变玻璃风格PPT"这个提示词,可以直接生成高保真的演示文稿幻灯片。

它会自动帮你:

  • 选择最佳构图(封面、网格布局或数据可视化)
  • 应用玻璃拟态风格和极光渐变配色
  • 生成3D物体作为视觉锚点
  • 使用Bento网格系统组织内容

生成的效果就像Apple Keynote那种级别,拿去给客户展示完全没问题。

场景2:电商产品图

做电商的朋友应该深有体会,拍产品图有多费钱费时间。用"专业电商商品图"提示词,可以把随手拍的照片转换成专业级产品图:

  • 自动移除手指、杂物
  • 纯白背景+自然阴影
  • 柔和商业灯光
  • 自动修复畸变和色彩校正

我试过拍一个水杯,原图背景乱七八糟,手指还入镜了。用这个提示词处理后,效果跟淘宝大卖家的主图没区别。

场景3:UI设计原型

"UI手绘稿转高保真原型"这个功能简直是产品经理的福音。你只需要在纸上画个草图,拍照上传,AI就能帮你生成:

  • 符合iOS或Material Design规范的界面
  • 高质量的占位图和图标
  • 完美的间距和布局
  • 逼真的iPhone框架

从草图到可演示的原型,10分钟搞定。

3.2 学习场景:知识可视化神器

场景1:思维导图生成

把一大段文字丢给AI,选择"思维导图"提示词,它会自动:

  • 提取核心概念放在中心
  • 将相关元素组织成分支
  • 用颜色区分不同类别
  • 添加简单图标辅助理解

我现在看论文、读技术文档都会用这个功能做笔记。比纯文字记录效率高太多了。

场景2:文章转信息图

"文章转卡通信息图"这个提示词特别适合做学习笔记。它会把长文章转换成手绘风格的信息图:

  • 提取关键要点(每条1-6个字)
  • 用卡通元素增强记忆点
  • 保持大量留白,清晰易读
  • 手绘风格的文字和图标

我试过把一篇5000字的技术文章转成信息图,复习的时候看一眼就能回忆起全部内容。

场景3:概念可视化

"概念可视化/知识地图"可以把抽象概念变成直观的图解。比如解释"光合作用":

  • 展示太阳、植物、水、二氧化碳的关系
  • 用箭头表示能量和物质流动
  • 扁平化矢量插图风格
  • 中文标注清晰

这种图解式学习方式,比看文字描述理解得快多了。

3.3 生活场景:让日常更有趣

场景1:旅行规划

"旅行手账插画生成"是我最近的心头好。输入城市名和天数,AI会自动生成:

  • 推荐景点和路线
  • 当地美食和特色
  • 手绘风格的地标建筑
  • 温馨的旅行提示

生成的图可以直接发朋友圈,比那些千篇一律的旅游照有意思多了。

场景2:照片后期处理

"胶片感写真"、"90年代宝丽来氛围感"这些滤镜提示词,可以让普通照片秒变大片:

  • 保持人物面部特征不变
  • 添加胶片颗粒和柔焦
  • 调整光线和色调
  • 营造特定年代的氛围

我给女朋友的照片加了个"胶片感写真"效果,她以为我花钱找摄影师修的图。

场景3:创意玩法

还有一些脑洞大开的玩法:

  • "重生之我是1美元钞票的头头":把你的头像放到美元上
  • "与动漫人物的鱼眼自拍":和哆啦A梦、鸣人合影
  • "一生全貌":生成从5岁到85岁的人生照片墙

这些功能虽然不太实用,但真的很有趣。

四、使用技巧与注意事项

4.1 提示词的二次编辑

虽然内置的提示词已经很完善了,但有时候还是需要微调。插入提示词后,光标会自动定位到末尾,你可以:

  • 补充具体需求(比如"背景改成海边")
  • 调整风格描述(比如"更卡通一点")
  • 添加细节要求(比如"人物穿红色衣服")

这种"模板+定制"的方式,既保证了质量,又保留了灵活性。

4.2 图片上传的顺序

如果提示词需要参考图片(比如"换装"、"电商模特试穿"),建议:

  1. 先插入提示词
  2. 再上传图片
  3. 如果需要多张图片,按提示词中的"图1"、"图2"顺序上传

这样AI才能正确理解哪张图是参考,哪张图是要处理的对象。

4.3 审查机制的应对

Gemini的内容审查比较严格,特别是涉及人物肖像的时候。如果遇到生成失败:

  • 尝试调整提示词,避免敏感词汇
  • 使用Gemini Enterprise,审查相对宽松
  • 或者试试kokorolab这类第三方渠道(特别是动漫风格的图)

国内用户的更优选择:

针对审查问题,我推荐两个解决方案:

方案一:Gemini Enterprise(推荐)

如果你能科学上网,强烈建议使用 Gemini Enterprise 商务版(https://cloud.google.com/gemini-enterprise?hl=zh_cn)。它的审查机制比免费版合理很多:

  • 对专业内容(如商业摄影、产品图)几乎不误判
  • 支持更多创意表达,不会动不动就"内容违规"
  • 生成失败时会给出具体原因,而不是模糊的错误提示

现在可以免费试用一个月,无需绑定信用卡,用Google账号登录就能开通。我自己用了之后,之前经常被拒的提示词现在都能正常生成了。

方案二:BigBanana(国内首选)

如果不方便科学上网,推荐 BigBanana(https://bigbanana.tree456.com/),它在审查机制上做了本地化优化:

  • 对中文内容的理解更准确,误判率更低
  • 审查尺度相对合理,不会过度敏感
  • 如果生成失败,会给出明确的原因提示,而不是模糊的错误信息

我之前在Gemini免费版上生成一些包含中文文字的海报,经常因为"内容违规"被拒绝,但同样的提示词在BigBanana上就能正常生成。这可能是因为它针对中文语境做了专门的调整。

项目配置文件里有个announcements字段,会提示哪些渠道更适合特定类型的内容:

{   "announcements": [     {       "content": "动漫 NSFW 首选 kokorolab!!",       "link": "https://kokorolab.net/zh/home",       "priority": 5     }   ] } 

4.4 自定义提示词

如果内置的提示词不够用,可以自己添加。扩展支持编辑自定义提示词,还能上传参考图片。

格式很简单:

{   "title": "提示词标题",   "preview": "效果预览图片URL",   "prompt": "详细的提示词内容",   "author": "作者",   "mode": "generate或edit",   "category": "分类",   "sub_category": "子分类" } 

我自己加了几个常用的提示词,比如"技术架构图"、"代码流程图"之类的,用起来很顺手。

五、优势与局限

5.1 明显的优势

1. 降低使用门槛

不需要学习复杂的提示词工程,选择模板就能生成高质量图片。这对非专业用户特别友好。

2. 提示词质量高

内置的提示词都是经过优化的,考虑了灯光、构图、材质等专业细节。生成效果比自己瞎写提示词强太多。

3. 场景覆盖全面

从工作到学习到生活,基本涵盖了日常需要生图的各种场景。而且还在不断更新,社区也可以贡献新的提示词。

4. 集成度高

直接在Gemini里使用,不需要切换平台。而且支持右键菜单,可以在任何网站使用。

5.2 存在的局限

1. 依赖Gemini生态

虽然扩展支持多个网站,但核心还是依赖Gemini的图像生成能力。如果Gemini本身有限制(比如审查机制),扩展也无能为力。

2. 提示词的通用性

有些提示词写得很具体,适用范围比较窄。比如"渐变玻璃风格PPT",如果你想要其他风格,就得自己改提示词。

3. 生成速度

Nano BananaPro的生成速度比普通模式慢一些,复杂图片可能需要等待10-20秒。如果网络不好,体验会打折扣。

4. 中文支持

虽然扩展界面是中文的,但很多提示词内部还是英文。对于需要生成中文文字的场景(比如海报、信息图),有时候会出现乱码或字体不对的问题。

六、未来展望

从项目的Release Note可以看到,开发团队还有很多计划:

  • 添加更多实用性提示词(穿搭推荐、虚拟旅游、偶像合照等)
  • 一键录入社交媒体分享的Prompt
  • 提示词Trending功能
  • 兼容更多生图渠道
  • 可能用Svelte重构(性能会更好)

我个人比较期待的是:

  1. 提示词市场:让用户可以分享和购买优质提示词
  2. 批量生成:一次生成多个变体,方便挑选
  3. 历史记录:保存生成过的图片和提示词,方便复用
  4. AI辅助优化:根据生成结果,自动建议提示词改进方向

七、写在最后

用了一段时间Nano BananaPro之后,我最大的感受是:AI生图的门槛真的降低了。

以前要生成一张满意的图片,需要:

  • 学习提示词语法
  • 了解摄影、设计知识
  • 反复调试参数
  • 尝试几十次才能出一张好图

现在有了这个工具,选个模板、上传图片、点击生成,大部分时候一次就能搞定。

当然,它不是万能的。如果你需要非常精确的控制,或者追求极致的艺术效果,可能还是需要手动调整提示词。但对于日常工作、学习、生活中的大部分场景,它已经足够好用了。

最后说一句:工具只是工具,关键还是要知道自己想要什么。Nano BananaPro提供了很多可能性,但怎么用好它,还是要靠你自己的创意和想象力。


相关资源:

  • Gemini Enterprise 免费试用:https://cloud.google.com/gemini-enterprise?hl=zh_cn (官方渠道,功能最全,免费一个月)
  • BigBanana国内镜像:https://bigbanana.tree456.com/ (国内用户首选,无需科学上网)
  • Chrome扩展下载:Chrome Web Store
  • GitHub项目地址:banana-prompt-quicker
  • 在线体验:https://glidea.github.io/banana-prompt-quicker

给不同用户的建议:

如果你能科学上网:

优先选择 Gemini Enterprise 商务版。现在免费试用一个月,无需绑定信用卡,功能全开:

  • Gemini 2.0 最新模型
  • Nano BananaPro 高级生图
  • Veo 3 视频生成
  • 深度研究功能
  • 更高的配额和更快的速度

一个月的免费期足够你深度体验所有功能。如果觉得好用,后续付费也比其他平台划算。

如果不方便科学上网:

直接用 BigBanana。它不仅解决了访问问题,而且针对国内用户的使用习惯做了很多优化:

  • 支付方式支持支付宝、微信
  • 客服响应快,有问题能及时解决
  • 社区活跃,经常有用户分享优质提示词
  • 定期更新功能,跟进Gemini的最新特性

我自己两个都在用:日常工作用BigBanana(稳定快速),需要高级功能或大批量生图时切换到Enterprise(配额更高)。

如果你有好的提示词创意,也欢迎在GitHub上提Issue贡献,或者在BigBanana社区分享。毕竟,好工具是大家一起打磨出来的。

BigBanana 官网:https://bigbanana.tree456.com/,国内可直连,站内提示低价套餐,常见场景相较官方价格最低可到约2折。

更多AIGC文章

RAG技术全解:从原理到实战的简明指南

更多VibeCoding文章

Read more

LM358在智能家居中的5个实用电路案例

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 点击'项目生成'按钮,等待项目生成完整后预览效果 输入框内输入如下内容: 设计一个基于LM358的智能家居光照控制系统,要求:1.使用光敏电阻作为传感器 2.包含信号调理电路将光照强度转换为0-5V电压 3.设置可调阈值触发LED指示灯 4.提供电源滤波电路 5.输出接口兼容Arduino。给出完整电路图、元件清单和调试要点,特别说明LM358在此应用中的优势。 在智能家居项目中,LM358这款经典的双运放芯片凭借其低成本、高可靠性和易用性,成为了信号调理和小功率控制的理想选择。今天通过5个真实案例,分享它在光照控制、温度报警等场景中的实战应用。 1. 光照传感器信号调理电路 2. 核心设计:光敏电阻与固定电阻分压后接入LM358同相输入端,构成电压跟随器消除阻抗影响 3. 关键参数:通过调节电位器可设置1.5-3V的触发阈值,

全面的System Verilog教程:从基础到高级验证

本文还有配套的精品资源,点击获取 简介:System Verilog是用于系统级验证、芯片设计与验证以及FPGA实现的强大硬件描述语言。它扩展了Verilog的基础特性,支持高级语言结构,如类、接口、任务和函数,优化了验证流程。教程内容涵盖System Verilog的基础概念、结构化编程元素、并发与同步机制、现代验证方法学、UVM验证方法论以及标准库的应用。旨在教授学生掌握System Verilog语法和高级特性,实现高效、可维护的验证代码。 1. System Verilog概述及应用领域 1.1 System Verilog的起源与发展 System Verilog是作为硬件设计和验证领域的重要语言,由Verilog发展而来,随后被进一步扩展以满足现代电子设计自动化的需要。其发展始于20世纪90年代,目的是在原有Verilog HDL的基础上,提供更为强大的设计验证功能。 1.1.1 Verilog与VHDL的区别 虽然Verilog和VHDL都是硬件描述语言(HDL),但它们在语法和使用方法上存在差异。Verilog更接近于C语言,而VHDL的语法结构则更接近

低代码+决策流:打通企业数字化提效任督二脉

低代码+决策流:打通企业数字化提效任督二脉

在企业数字化转型深水区,流程线上化已成为基础标配,但真正制约效率突破的核心瓶颈,在于决策环节的人工化、非标准化、不可追溯。大量企业仍依赖人工判断、经验拍板、线下核对完成风险评估、资源配置、额度审批、分支流转等关键决策,导致流程卡顿、效率低下、风险不可控。JNPF 平台基于自研 JnpfFlow 工作流引擎推出的决策流能力,以低代码可视化建模为底座,融合规则引擎、逻辑计算、评分卡、决策表等技术能力,实现决策过程的结构化、自动化、可追溯,让低代码从 “表单流程工具” 升级为 “企业智能决策中枢”,真正打通企业效率提升的 “任督二脉”。 一、企业数字化的真瓶颈:不是流程不通,而是决策不灵 1.1 流程已上线,决策仍 “线下”        过去十年,企业数字化建设取得显著成果,绝大多数审批流程、业务流程已完成线上化改造。从请假、报销、采购到合同、项目、

从零开始:OpenClaw安装+飞书机器人全流程配置指南(附踩坑实录)

从零开始:OpenClaw 安装 + 飞书机器人全流程配置指南(附踩坑实录) 本文面向完全零基础的小白,手把手带你从一台干净的 Linux 机器开始,安装 OpenClaw、配置 AI 模型、对接飞书机器人,最终实现在飞书里和 AI 直接对话。全程附带我自己踩过的坑和解决方案。 目录 * 一、OpenClaw 是什么? * 二、环境准备 * 三、安装 OpenClaw * 四、初始配置(onboard 向导) * 五、飞书机器人配置全流程 * 六、踩坑实录 & 避坑指南 * 七、验证一切正常 * 八、进阶:常用命令速查 一、OpenClaw 是什么? OpenClaw 是一个开源的 AI Agent