Midjourney 使用指南
一、认识 Midjourney
Midjourney是由 David Holz 2022 年 3 月推出的一款 AI 制图工具。处于聊天软件 Discord 中,主要功能涵盖图像生成、风格化、变体生成、图生图等,且提供高级工具精细控制生成过程。使用上需创建账户、获邀请后通过 Discord 频道输入文字提示来操作。相比于 SD(Stable Diffusion),MJ 随机性更大,细节处理精度不够。
二、Midjourney 算法原理
MJ 基于深度学习中的生成对抗网络(GAN)和扩散模型等技术。
- 生成对抗网络(GAN):由生成器和判别器组成。生成器的任务是根据输入的随机噪声和文本描述等信息,生成尽可能逼真的图像;判别器则负责判断输入的图像是真实的还是由生成器生成的。在训练过程中,生成器和判别器相互博弈,不断优化自身的参数,以提高生成图像的质量和判别器的准确性,最终使生成器能够生成足以'欺骗'判别器的高质量图像。
- 扩散模型:扩散模型通过逐步向数据中添加噪声,然后学习如何去噪来生成新的数据。在图像生成中,它从一个完全随机的噪声图像开始,经过多个扩散步骤,逐渐调整图像的像素值,使其接近真实图像。每一步都根据当前的图像和一些条件信息(如文本提示)来预测下一步的图像,最终生成符合条件的高质量图像。
三、Midjourney 基本操作指南
1、安装
由于 MJ 属国外模型,全部操作应在配置好网络环境下进行。
登录成功后建立服务器,点击左下角绿色的 + 号,点击亲自创建,点击仅供我和我的朋友使用,上传头像和名字,完成服务器建立。点击左下角小眼睛,去发现搜索 MJ 机器人,并将其添加到自己的服务器。
下载 Discord 客户端。
2、使用演示及基本分区讲解
1. 使用演示
首先找到我们自己的服务器,在对话框中先输入'/',就会弹出常用栏,白色帆船生成较为写实的作品,绿色帆船生成偏向于动漫风格的作品。
2. 基本分区讲解
-
重绘:可以在新的界面对原来的提示词进行加工再次生成新的图像。点击重绘标识,弹出黑框进行对原来的关键词进行修改。
-
U1 U2 U3 U4:一次操作可以生成四张图,如何查看单张图呢?如何单张图放大呢?这时我们需要用到第一行的按钮。当我们要查看第一张图片,点击 U1,则会出现以下界面。
功能区解析:
- Upscale(Subtle) 和 Upscale (Creative):1:1 放大。Subtle 细节变精细;Creative 细节少量修改。
- Vary(Subtle) 和 Vary(Creative):图片变化,点击按钮,修改提示词,进行变化。Subtle 调整较为细微,如微调颜色、光影,或对图像细节进行优化,使图像更精致,整体风格和构图基本不变。Creative 会较大幅度地改变图像元素、构图、颜色等,能为图像添加或移除元素,创造出与原图不同风格或效果的新图像。
- Vary (region):局部重绘,选中需要修改的位置,改变关键词,从而在不改变其他部分的前提下对所选中区域局部重绘。
辨析:Vary(Subtle)&Vary(Creative)和 Vary (region) 的不同
- 作用范围:Vary Subtle 和 Vary Creative 是对整个图像进行变化,在原图基础上生成一张新图,不过变化程度不同;Vary Region 针对图像的特定区域进行修改,仅重绘选定区域,其余部分保持不变。
- 变化程度:Vary Subtle 调整较为细微;Vary Creative 变化强烈;Vary Region 变化程度取决于输入的修改指令和选定区域大小。
- 适用场景:Vary Subtle 适用于对原图像整体满意,只需小幅度优化细节;Vary Creative 适用于希望对原图像进行大幅度修改或重新构思;Vary Region 适用于对图像整体满意但局部需修改。
-
扩图:Zoom out 1.5x、2.0x 与 Custom zoom。Zoom out 1.5x、2.0x 为固定倍数扩图,不改变原图;Custom zoom 为自定义扩图,通过改变关键词--ar 后的图片比例,修改扩图倍数。


