最近我花时间把 DALL·E 3 的图像生成和 API 都跑了一遍。这代模型在理解中文提示和生成质量上确实比上一代强了不少,不过用起来还是有不少值得注意的细节。
上手生成:分辨率与格式
默认输出 1024×1024 像素,这个尺寸在精细度和传输效率之间平衡得不错。格式方面全部是 WebP,虽然以前不习惯,但实际用下来文件体积比 PNG 小一半多,网页加载明显更快。
试了下这个提示,生成的赛博朋克城市细节丰富,光影过渡自然:
A highly detailed digital artwork, 1024x1024 pixels, showcasing a vibrant and dynamic futuristic cityscape with intricate architecture, neon lights, and bustling activity.
WebP 格式的优势也验证了一下,用热带雨林主题的提示,文件确实小,适合网络传输。
A digital poster in WebP format of a breathtaking tropical rainforest, featuring vivid green foliage and crystal-clear streams.
如果需要更高的分辨率,API 里也有选项。比如打印海报时,可以拉高到 4K 级别,代价是生成时间变长,费用也涨。一张 4K 图的打印效果确实细腻,但屏幕上看和 1024 差别不算太大,这个得自己权衡。
An ultra-high-definition 4K cinematic landscape of a serene mountain range at sunrise, designed for large-scale printing.


