平时用 Nano Banana 生成架构图、海报或流程图时,常会遇到一种尴尬情况:整体构图和风格都很棒,但一到中文字符就翻车。要么笔画粘连断裂,要么字形错位,甚至出现无法辨认的伪汉字。这种图用来内部讨论尚可,一旦要用于正式汇报或方案文档,清晰度往往不够。
核心原因通常不在于提示词写得不够细,而是模型训练数据的偏差。Nano Banana 的训练数据中英文占比更大,而中文字体笔画密度高、结构复杂,在小字号或图形叠加背景下,对像素级渲染的要求更高。与其反复调整提示词试图让模型'猜'出清晰的字,不如承认模型的强项分工:Nano Banana 负责'图',Seedream 负责'字'。
解决思路:两段式工作流
这个方案的关键在于分工协作。
第一步由 Nano Banana 完成。输入你的架构描述或内容需求,让它生成基础的布局、模块关系和视觉风格。优先追求构图合理、图形美观、逻辑清晰。
第二步交给 Seedream 4.5。保持第一步生成的图形不变,仅对文字区域进行重绘或重新渲染。优先追求中文字体清晰、笔画正确、对齐不乱且风格与原图一致。
最终效果通常是画面保留了 Nano Banana 的高级感,同时中文达到了可交付的水平。
实战步骤
1. 生成基础架构图
先用 Nano Banana Pro 生成底图。输入如下提示词:
算法体系建设的总体架构描述如下:
一、核心目标与总体思路
核心目标:构建一个覆盖数据、特征、模型、部署、运维全生命周期的标准化算法生产体系。
总体思路:以 MLOps 理念为框架,以车辆网联数据为基石,打通从数据到价值的端到端链路。
请根据以上描述使用 nano banana pro 画一副简洁架构图。
要求:不需要 Mermaid 图,需要生成一张简洁的架构图片;图片当中的语言文字使用中文;不要出现 logo。
这一步通常能得到分层合理、关系明确的架构图,但你会发现图上的中文文字扭曲或不清晰。别急,这正是进入下一步的时机。
2. 配置重渲染环境
我们需要接入支持 Seedream 4.5 的接口服务。通过 Personal LLM API 项目可以方便地接入该模型,它会自动读取输入图片的宽高比和分辨率,减少手动配置成本。
在本地部署好 Personal LLM API 后,在模型配置中添加并启用 Seedream 4.5 视觉模型。随后使用 Cherry Studio 作为本地客户端,新增自定义模型服务,填写 base_url 和 api_key,并在模型列表中添加 Seedream 4.5。
这样你就拥有了一个顺手的'图片文字重渲染工作台':把图拖进去 + 一句话提示词,等待几十秒即可得到清晰版本。
3. 执行文字重渲染
将 Nano Banana 生成的那张中文模糊的架构图上传给 Seedream 4.5,选择对应模型,并使用以下提示词:
请把图片上的文字重新渲染,样式颜色要一致,文字也要一致,其他的不需要改动。生成的图片要 4k 分辨率,宽高比是智能适应原图的宽高比。
这句提示词有几个关键点:
- 只改文字:避免模型重绘导致版式跑掉。
- 样式颜色一致:保持原图观感统一。
- 文字也要一致:强调不要改字、不总结、不替换。
- 4K + 自适应比例:直接拿去汇报或插入文档,清晰度足够。
由于 Personal LLM API 做了适配,这一步通常不需要再手动指定原图尺寸,它会自动处理宽高比和分辨率策略。等待几十秒后,你会得到一张几乎一模一样但中文清晰的新图。如果稍微有点瑕疵,重复生成 1 到 2 次即可。
效果对比
对比 Nano Banana 的原图和 Seedream 重渲染后的图,提升非常明显:中文笔画完整不再粘连,字体边缘锐利,对齐更稳定,背景、连线、色块和布局基本保持不变。
简单来说,就是 Nano Banana 给了你'高级的架构图',Seedream 4.5 给了你'能交付的中文'。
适用场景
这个技巧不仅限于架构图,还适用于:
- 流程图、时序图(非 Mermaid)
- PPT 封面、海报型页面(中文标题清晰)
- 产品功能结构图、业务闭环图
- 活动宣传图、课程海报、Banner
只要遇到'图很漂亮,但字不行'的 AI 生成图,都可以尝试'先生成,再重渲染文字'的路径。很多人卡在'生成一张能用的图'这一步,其实并不是模型不行,而是没有采用组合式工作流。当你掌握了分工协作,就能把 AI 出图从'玩具'变成真正的生产工具。


