开启AI绘画 “工作流时代” 的神奇应用----Comfy UI | 使用CNB平台搭建ComfyUI

开启AI绘画 “工作流时代” 的神奇应用----Comfy UI | 使用CNB平台搭建ComfyUI

文章目录

概要

ComfyUI 是一款基于节点流程的可视化 AI 生成工具,核心围绕 Stable Diffusion 等主流生成式 AI 算法构建,通过图形化节点拆解生成全流程,实现从文本 / 图像输入到图像 / 视频输出的 “精准可控创作”。

腾讯云 CNB(Cloud Native Build,官网:cnb.cool)是基于 Docker 生态的云原生开发协作平台,核心定位是通过容器化技术与资源池化能力,为开发者提供 “一键就绪” 的远程开发环境,尤其聚焦开源项目协作与 AI 工具落地,无需本地配置复杂硬件与环境即可开展开发、测试与创作。链接:cnb

操作流程

接下来展示使用腾讯云cnb搭建comfyui的流程:

(1)到CNB网站 fork 项目
链接:cnb
可以直接使用已经搭建好的comfyui 仓库,避免配置环境的时间,我是用的模板项目如下:comfyui_base

进入项目界面后需要fork项目到自己的账户,第一次登录时没有组织,需要创建一个组织(内容随便写),仓库名可以稍微做些修改,比如后面加个123.--------fork整个仓库。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

(2)启动项目
到自己的仓库启动项目,点击comfyui起飞。

在这里插入图片描述

在终端输入 y 可以启动项目

在这里插入图片描述

启动项目后点击弹出的链接会显示下面的界面:

在这里插入图片描述

下载模型:
模型地址:模型地址

在这里插入图片描述


复制模型的下载链接:

在这里插入图片描述

执行下载命令:
需要将模型放到 /workspace/ComfyUI/models/checkpoints 路径下:
执行命令代码如下:

aria2c https://cnb.cool/ai-models/stable-diffusion-v1-5/stable-diffusion-v1-5/-/lfs/6ce0161689b3853acaa03779ec93eafe75a02f4ced659bee03f50797806fa2fa?name=v1-5-pruned-emaonly.safetensors 
在这里插入图片描述

重新启动应用,选择下载的模型,点击运行就可以出图了。

在这里插入图片描述


还可以安装一个节点,点击Manager,下载crystools节点,安装完之后点击restart,重启成功后在进入comfyui

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


(3)同步到自己仓库
回到后台,将增加的内容同步到自己的仓库,无需构建镜像,使用命令如下:

cd /workspace find /workspace/ComfyUI/custom_nodes -mindepth 2-type d -name ".git"-exec rm -rf {}+ git add . git commit -m "同步更新" git push 
在这里插入图片描述


使用 kill 1 可以关闭项目页面

在这里插入图片描述

Read more

人工智能生成物(AIGC)独创性判断标准——以文生图模式为例

讨论AI绘画独创性标准,分析案例。 本文仅围绕“文生图”模式进行讨论,以期探究人工智能生成物(AIGC)独创性判断标准。 引言 随着人工智能在图片生成领域的普及与利用,一般公众的创作成本普遍降低,不再需要经过长期的学习与训练,仅在弹指之间即可创作出堪比大师的精美画作。然而,人工智能创作的便利,也引发了人们对于生成式人工智能可版权性、著作权归属、著作权侵权责任等问题的思考与讨论。1仅以创作形式来看,目前人工智能生成物(AIGC)存在“文生图”和“图生图”两种形式。 其中,“文生图”模式吸引学者及实务界讨论较多,近期较为火热的“春风送来了温柔”案、“伴心”案、“幻之翼透明艺术椅”案也均围绕这一创作形式展开。故,本文仅围绕“文生图”模式进行讨论,以期探究人工智能生成物(AIGC)独创性判断标准。 案情回放 围绕“文生图”模式下的人工智能生成物(AIGC)能否认定为“具有独创性并能以一定形式表现的智力成果”

AI绘画描述关键词逻辑优化:从语义理解到生成效率提升

快速体验 在开始今天关于 AI绘画描述关键词逻辑优化:从语义理解到生成效率提升 的探讨之前,我想先分享一个最近让我觉得很有意思的全栈技术挑战。 我们常说 AI 是未来,但作为开发者,如何将大模型(LLM)真正落地为一个低延迟、可交互的实时系统,而不仅仅是调个 API? 这里有一个非常硬核的动手实验:基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。 从0到1构建生产级别应用,脱离Demo,点击打开 从0打造个人豆包实时通话AI动手实验 AI绘画描述关键词逻辑优化:从语义理解到生成效率提升 背景痛点分析 当前主流AI绘画工具如Stable Diffusion、Midjourney等,普遍存在Prompt关键词堆砌导致的语义冲突问题。通过分析超过5000条用户提交的Prompt数据,发现以下典型低效模式: 1. 冗余修饰词重复 * 案例:

大模型微调主要框架 Firefly vs LLaMA Factory 全方位对比表

Firefly vs LLaMA Factory 全方位对比表 + 生物医药垂类微调选型建议 一、核心维度对比表格 对比维度Firefly(流萤)LLaMA Factory开发主体个人开源:杨建新(YeungNLP),前Shopee NLP工程师,中山大学硕士社区开源:hiyouga核心维护,全球开源社区协同迭代项目定位聚焦中文大模型的轻量化训练框架+配套中文优化模型通用型全栈大模型微调框架,无语言/模型偏向,极致兼容支持基座模型以中文友好模型为主(Llama系列、Qwen、ChatGLM、Firefly自训模型),覆盖有限但深度适配全主流开源模型全覆盖(Llama、Qwen、Mistral、DeepSeek、GLM、Yi、Firefly等),几乎无适配成本支持微调方式基础SFT、LoRA/QLoRA、增量预训练,进阶对齐方法较少SFT、DPO/IPO/KTO、RLHF、预训练、多模态微调,全流程对齐方案完整中文优化原生深度优化:中文分词、语料、表达逻辑专项适配,

VSCode Copilot 终极魔改:以智谱 GLM-5.1 为例,一文搞定任意大模型接入

VSCode Copilot 终极魔改:以智谱 GLM-5.1 为例,一文搞定任意大模型接入

VSCode Copilot 终极魔改:以智谱 GLM-5.1 为例,一文搞定任意大模型接入 前言:为何你的 Copilot 需要一次“魔改”? 本文旨在帮助所有希望突破 VSCode Copilot 模型限制、追求更高代码效率和性价比的开发者。如果你也曾面临以下困境,那么这篇文章就是为你量身打造的: * Copilot 官方模型不够用:想尝试最新、最强的国产模型(如智谱 GLM、文心一言、Kimi)却无从下手。 * API 订阅成本高:官方或其他国外模型的订阅费和按量计费(通常以美元结算)让个人开发者望而却步。 * 替代品体验有瑕疵:其他辅助插件在某些场景下不如原生的 Copilot 轻便、流畅。 本文将提供一个终极解决方案:通过一个 VSCode 插件,无缝接入任何支持 OpenAI 兼容接口的大模型。我将以当前备受瞩目的国产模型智谱 GLM-5.1 为例,