免费使用AI绘画模型Nano Banana Pro,太有意思了!

大家好,我是程序员小灰。

关注AI的朋友们应该都知道,最近谷歌的AI模型Gemini3.0 Pro爆火了。Gemini3是一个AI大家族,这个家族的成员不只有善于文字对话的大语言模型,还包括着善于绘画的图像生成模型,Nano Banana Pro。

这两天小灰亲自测试了Nano Banana Pro模型,虽然说不上完美,但真的十分有趣!(后文简称Nano Banana)

如何免费使用Nano Banana? 

想要免费使用Nano Banana,小灰给大家推荐三个地方:

1.Gemini官网

入口如下:

https://gemini.google.com/

在Gemini官网的对话框下方,点击“制作图片”选项,就可以和Nano Banana模型进行对话:

2.Google AI Studio

入口如下:

https://aistudio.google.com/

在Google AI Studio的首页右下角,点击“Try Nano Banana Pro”选项,即可体验Nano Banana。

3.LMArena

入口如下:

https://lmarena.ai/

LMArena中文名为大众竞技场,是一个让不同模型进行PK的平台。在首页左上方选择“Direct Chat”模式,模型选择“gemini-3-pro-image-preview-2K”,即可参与Nano Banana的免费测试。

以上就是三种免费使用Nano Banana的方法。其中官网和Google AI Studio有一定的使用频次限制;LMArena虽然不限制次数,但有可能排队。

几个有趣的测试案例

Nano Banana具体能用来干什么呢?

用AI画小猫小狗、画美女帅哥什么的,早已经被众多AI模型玩遍了,我们今天就来尝试几个不一样的玩法,顺便来测试一下Nano Banana的极限。

1.和名人同框

身为普通人,如何免费吃上巴菲特的午餐?小灰上传了一张自己的照片,让AI把自己和巴菲特同框。

提示词:根据我的照片,生成我和巴菲特一起共进午餐的画面。

Nano Banana为我生成了上面这张照片,看起来还蛮自然的。

2.给漫画上色

作为一个动漫爱好者,小灰经常在网上看黑白漫画。如果AI能为所有的漫画上色,阅读的体验将会上升一个台阶。我们找一页漫画试试:

提示词:给漫画上色。

不得不说,Nano Banana的上色水平还真不错,没有一丁点违和感。

3.生成漫画

既然Nano Banana具备漫画上色的能力,那它能不能为我们直接生成漫画呢?让我们试一试。

小灰上传了自己的漫画素材,让AI根据这一对素材形象生成漫画。

提示词:用图中的两个角色生成一组漫画,在漫画中讲述一个编程知识点。

虽然AI生成的这组漫画只是描述了一个编程段子,而非讲解编程知识点,但生成这样的结果已经很厉害了。这样下去,小灰是不是该失业了?

4.生成地图

接下来我们上一点难度,让AI为我们生成一幅地图。

提示词:生成北京市朝阳区的地图。

Nano Banana生成的结果基本符合北京朝阳区的格局,但有些细节还不太完美,地图上有不少错别字和乱码。

我们把这幅平面地图改成立体地图试一试。

提示词:把地图改为3D风格。

这幅立体地图乍一看很酷,不过经不起推敲,似乎仅仅是把所有的地标性建筑排列在一起,各个建筑所在的位置和真实情况完全不一样。

5.生成棋谱

最后,我们来尝试一个最难的案例,让AI为我们生成一套象棋棋谱。

不知在公众号的读者当中有多少象棋爱好者?在中国象棋当中有一个著名的残局,名为“七星聚会”。我们把这个残局的图片上传给Nano Banana,看看它能否破解此残局:

提示词:根据棋局,用图片展示出正确的走法,红棋先走。

这一次AI生成的图片一言难尽,棋盘上莫名其妙多出了几个棋子,根本不是残局的破解之法。

不过这也很正常,Nano Banana又不是通用人工智能,我们这个破解棋局的要求,确实强“机”所难了。

写在最后

各位读者朋友们,不知大家第一个接触到的AI绘画模型是什么?小灰
第一次使用AI绘画模型是在2023年,用的Midjourney。

在那个时候,AI能完全按照要求画出一幅画就已经很不容易了,要么人物手指数量不对,要么显得非常假、AI味儿十足。

如今只过去了两年多的时间,AI绘画模型的能力已经今非昔比,不但可以画出各种鲜活的形象,还能作为辅助工具应用在各个领域。

如果大家有什么新鲜有趣的想法,也欢迎在Nano Banana上面进行尝试,并把你的绘画结果分享在留言区。

关于AI绘画模型Nano Banana Pro,我们就介绍到这里,感谢大家!

< END >

最近,小灰创建了一个AI副业交流群,对AI和副业变现感兴趣的朋友,都欢迎进群交流。扫码添加小灰微信,备注“ai“即可进群:

图片

Read more

具身智能与视觉:机器人如何“看懂”世界?

具身智能与视觉:机器人如何“看懂”世界?

具身智能与视觉:机器人如何“看懂”世界? * 前言 * 一、具身智能的奥秘探索 * 1.1 具身智能的深度剖析 * 1.2 具身智能的发展脉络梳理 * 二、视觉:机器人感知世界的 “慧眼” * 2.1 机器人视觉系统的架构解析 * 2.2 计算机视觉技术的关键支撑 * 三、机器人如何借助视觉 “看懂” 世界 * 3.1 视觉感知与环境理解 * 3.2 视觉引导下的决策与行动 * 3.3 视觉与其他传感器的融合 * 四、具身智能中视觉技术的挑战 * 4.1 复杂环境下的视觉鲁棒性 * 4.2 实时性与计算资源的平衡 * 4.3 语义理解与常识推理的欠缺 * 五、具身智能视觉技术的未来发展趋势 * 5.

CCF-CSP第38次认证第二题——机器人复健指南(满分题解)

题目背景 西西艾弗岛某山脉深处出土了一台远古机器人,具体年代已不可考。初步修缮后,研究人员尝试操控机器人进行些简单的移动。 题目描述 整个实验场地被划分为 n×n个方格,从 (1,1) 到 (n,n) 进行编号。机器人只能在这些方格间移动,不能走出场地范围。 如下图所示,假设机器人当前位于 (x,y),那么接下来可以向周围八个方向跳跃移动(如果目标方格在场地范围内): 若机器人只能跳动不超过 k 步,场地内有多少方格(包括起始位置)可以抵达? 输入格式 从标准输入读入数据。 输入的第一行包含空格分隔的两个正整数 n 和 k,分别表示场地大小和跳动步数。 输入的第二行包含空格分隔的两个正整数 x 和 y,表示机器人的起始位置(保证位于场地内)。 输出格式 输出到标准输出。 输出一个整数,表示 k 步内可以抵达的方格总数。 样例1输入

Clawdbot(Moltbot) 飞书机器人配置,体验老板和助手沟通的感觉

Clawdbot(Moltbot) 飞书机器人配置,体验老板和助手沟通的感觉

一、背景说明 Clawdbot可以24小时待命(参考配置方式:Clawdbot(Moltbot) windows安装配置教程(含各种问题处理)),但是网页端使用起来比毕竟没那么方便,然而clawdbot支持多种渠道交互,这也正是这个AI助理的魅力所在,想想飞书发送一个消息,一个任务就完成了,这不就是老板指挥我做事的方式吗,来赶紧体验一波老板的感觉~ 二、飞书机器人创建 飞书开放平台构建机器人:https://open.feishu.cn/ 记录App ID 和 App Secret,一会要用: 三、自动安装插件 项目地址:https://github.com/m1heng/Clawdbot-feishu 这时候,就可以发挥clawdbot的能力了,直接让clawdbot给我安装: 我要安装飞书机器人,帮我按照这个命令安装:Clawdbot plugins install @m1heng-clawd/feishu 到这个过程有点慢,安装了好一会没反应,我开始问了: 又过了好一会没反应,

无深度学习YOLOV8模型训练 无人机红外可见光光伏缺陷检测数据集 无人机/机器人搭载红外相机自动识别缺陷 光伏无人机红外可见光缺陷数据集 新能源智慧运维* 光伏电站智能巡检

无深度学习YOLOV8模型训练 无人机红外可见光光伏缺陷检测数据集 无人机/机器人搭载红外相机自动识别缺陷 光伏无人机红外可见光缺陷数据集 新能源智慧运维* 光伏电站智能巡检

无人机红外可见光光伏缺陷检测数据集一一对应数据,共650张 xml格式 1 红外可见光光伏缺陷检测数据集 的详细表格描述,基于你提供的信息(650张图像、一一对应红外与可见光图像、XML格式标注、共9类缺陷)。 📊 一、数据集总体信息 项目内容总图像数量650 张(每张包含 红外 + 可见光 一对图像)图像类型红外热成像图 & 可见光照片(一一对应)标注格式PASCAL VOC XML 格式(.xml 文件)数据划分未明确划分,建议按 7:2:1 分为训练/验证/测试集图像分辨率通常为 1024×1024 或 2048×2048(工业相机拍摄)应用场景光伏电站巡检、太阳能板缺陷诊断、AI辅助运维 🗂️ 二、数据结构示例 photovoltaic_defect_