AI写真教程:Stable Diffusion 之 InstantID

AI写真教程:Stable Diffusion 之 InstantID

IPAdapter-FaceId 目前只在 SD 1.5 模型上表现较好,SDXL 模型上的表现较差,不能用于实际生产。可是很多同学已经在使用SDXL了,而且SDXL确实整体上出图效果更好,怎么办?

这篇文章就来给大家介绍一个在SDXL中创作AI写真的稳定方法:使用 InstanID。

InstantID,翻译为身份标识,这是一个ControlNet模型,其核心能力是由国内的小红书团队开发的。InstantID可以提取人物的面部信息,然后在生成的人物图片中使用此面部。只需要人物的一张正面照片,就可以生成此人物的多种风格图片,正适合来搞AI写真。

效果展示

废话不多说,还是先看效果(大家可以猜猜此人是谁,文中会揭晓答案):

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID
www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID
www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

更多带生成参数的图片下载请看文末。

安装方法

之前我介绍过 InstantID的安装方法,需要插件和模型的可以直接添加下方领取~

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

使用InstantID

这里以 Stable Diffusion WebUI 为例,ComfyUI的使用示例见下文。

因为 InstantID 仅能在 SDXL 模型下使用,所以本文将使用 SDXL 模型进行演示。

基本设置

打开“文生图”页面,首先我们需要选择SD基础模型(模型下载方式见文末)、设置提示词和负向提示词。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

然后我们简单设置下生成参数,如下图所示。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

你可以直接使用我这几个参数的值,简单介绍下:

1、采样器:DPM++系列在在采样质量和效率上都比较高,是目前效果最优秀的反向扩散采样算法之一。

2、调度类型:用于控制采样过程中的噪声水平 ,这是 WebUI 1.9.0 之后从采样器分离出来的参数,可以单独设置,使用更灵活。Karras 噪声计划在初始采样步骤中的噪音水平较高,而在结尾采样步骤中的噪音水平较低,实验表明这样有助于提高生成图片的质量。

3、采样步数:一般设置为20-30,可根据具体效果调整。

4、使用SDXL模型时,宽度和高度需要设置为1024以上,这里是一张垂直图**,比例为3:4。

5、生成次数和每次数量:一次多生成几张,方便选择。生成次数是独立的生成几次,消耗时间根据次数加倍;每次数量是单次生成内的输出图片数量,比较消耗显存。

6、提示词引导系数:对于InstantID,不要设置的太高,3-5最佳,根据实际情况选择。

7、图像生成种子:-1代表随机数,每次生成都会产生新的变化。

ControlNet设置

InstantID 是通过 ControlNet 发挥作用的,我们重点看下相关设置。

这里需要两个 ControlNet,一个用于控制面部特征,另一个用于控制面部姿势。

先看第一个ControlNet,上传一张参考图片,勾选“启用”和“完美匹配像素”。“完美匹配像素”用于控制从参考图片中提取的特征信息的分辨率,以更加匹配生成图片的尺寸,无脑勾选就是了。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

“控制网类型”勾选Instant-ID,注意第一个ControlNet中的预处理器和模型选择,需要是:instant_id_face_embedding 和 ip-adapter_instant_id_sdxl,它们用于提取参考人物的面部特征,并应用到生成图片中。其它参数默认即可。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

再来看第2个ControlNet,它是用来控制生成图片中人物的面部姿势的。我们可以选择其它人物的图片,这不会影响面部特征的控制,仅影响人物的头部姿势。注意不是人物整体的姿势,当然人物的头部姿势也会对整体的姿势产生一定的影响。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

注意这里的三个参数:

预处理器:instant_id_face_keypoints,脸部的关键点,或者说面部姿势。

模型:control_instant_id_sdxl。

控制模式:以ControlNet为主,不选这个生成图片的线条会比较粗糙。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

最后,我们只要点击“生成”,静待写真图生成就好了。

使用ComfyUI工作流

我在 ComfyUI 中也测试了 InstantID 的生成效果,制作了两个工作流,一个和WebUI中的能力类似,另一个还结合了IPAdapter,可以提取参考图片的风格。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

在 ComfyUI 中使用 InstantID 时,需要安装一些插件,可以到文末领取~

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID
www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID


www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID


www.zeeklog.com  - AI写真教程:Stable Diffusion 之 InstantID

Read more

印度统治阶级锁死底层人的5大阳谋

印度统治阶级锁死底层人的5大阳谋

基于社会学和心理学视角: 1. 情感道德: 统治阶级通过塑造道德规范和情感价值观,引导底层人群的行为。例如,宣扬“勤劳致富”“忍耐美德”等观念,让底层人接受现状并自我约束。这种道德框架往往掩盖结构性不平等,使人们将个人困境归咎于自身而非系统。 2. 欲望控制: 通过消费主义和媒体宣传,统治阶级刺激底层人的物质与社会欲望(如名牌、地位),但同时设置经济壁垒,使这些欲望难以实现。底层人被困在追求“更好生活”的循环中,精力被分散,无法聚焦于挑战权力结构。 3. 情绪煽动: 利用恐惧、愤怒或民族主义等情绪,统治阶级可以通过媒体或公共事件转移底层人对社会问题的注意力。例如,制造外部敌人或内部对立(如阶层、种族矛盾),让底层人内耗而非联合反抗。 4. 暴利诱惑: 通过展示少数“成功案例”或快速致富的机会(如赌博、投机),诱导底层人追逐短期暴利。这种机制不仅让底层人陷入经济风险,还强化了对现有经济体系的依赖,削弱长期变革的可能性。 5. 权力震撼: 通过展示统治阶级的权力(

By Ne0inhk