本地使用ComfyUI运行Stable Diffusion 3.5
本地使用 ComfyUI 运行 Stable Diffusion 3.5-FP8 你有没有试过用一张消费级显卡,在不到两分钟内生成一张细节拉满的 1024×1024 分辨率图像?现在,这已经不是幻想。随着 **Stable Diffusion 3.5-FP8** 的发布,开源文生图模型正式迈入'高效推理'时代——不仅画质不输原版,速度更快、显存更省,甚至能在…
博客作者
数据科学家
356
已发布文章
11K
博客获赞
720K
博客浏览
第 3 页
本地使用 ComfyUI 运行 Stable Diffusion 3.5-FP8 你有没有试过用一张消费级显卡,在不到两分钟内生成一张细节拉满的 1024×1024 分辨率图像?现在,这已经不是幻想。随着 **Stable Diffusion 3.5-FP8** 的发布,开源文生图模型正式迈入'高效推理'时代——不仅画质不输原版,速度更快、显存更省,甚至能在…

摘要 WebGPU是W3C GPU for the Web工作组设计的全新Web图形与计算API,旨在为浏览器提供接近原生GPU性能的高效渲染能力。相比上一代WebGL,WebGPU基于现代GPU架构设计,支持计算着色器、多线程渲染和更细粒度的资源管理。将从技术原理、安装部署、使用方法、优劣势分析以及与竞品的全面对比等多个维度,带你深入了解这项将改变Web图…
**Xilinx(AMD) vivado软件全部付费IP核及license许可介绍和获取** **制作不易,记得三连哦,给我动力,持续更新!!!** **License或IP src源码 文件下载:****Xilinx IP 完整license获取** **(点击蓝色字体获取)(可提供IP源码)** 一、介绍 Vivado是Xilinx(现属AMD)FPGA…
 简介 **Happy Coder** 是一个为 Claude Code 和 Codex 设计的移动端和 Web 客户端,支持实时语音功能、端到端加密,功能齐全。该项目由 slop…

 环境配置 本机显卡:双 3090 系统环境:WSL Ubuntu 版本信息: torch==2.6.0 conda==24.5.0 cuda==12.4 python==3.12…

前言 DALL·E 3 是 OpenAI 最新的图像生成技术,通过对文本描述的深度理解和**扩散模型**的应用,能够快速生成高质量、细节丰富的图像。将从**图像生成机制**、**分辨率与格式选择**、**多图生成功能**、**编辑器界面操作**及 API 的使用等多个方面,全面解析 **DALL·E 3** 的功能与应用场景,为用户在创意设计、广告制作、教育…
B 站自动字幕用户脚本:快捷键开关 + 自动开启字幕(2026 新版适配) > 项目地址:GitHub 仓库 --- 一、脚本介绍 你是否经常在 B 站看视频时反复手动开启字幕?是否希望切换视频时字幕能自动开启? 这个用户脚本就是为了解决这些问题而开发的。 **B 站自动字幕脚本** 提供了以下功能: 🎯 **快捷键控制**:按 C 键快速开启或关闭字幕…
Home Assistant 界面美化指南:打造个性化智能家居 想要让智能家居控制界面既美观又实用吗?Home Assistant 提供了强大的界面定制功能,让你可以完全掌控界面的视觉风格。本指南将带你从基础设置到高级技巧,一步步打造专属于你的智能家居美学体验。 为什么你的 Home Assistant 界面需要美化? 界面美化不仅仅是改变颜色,它能显著提升…

引言 Neo4j Desktop 2.0 版本默认安装在 C 盘,且不提供安装路径选择界面,这会占用大量 C 盘空间。因此,需要手动设置安装路径。 安装包下载:https://neo4j.com/deployment-center/?desktop-gdb 文件夹创建及环境变量设置 首先需要在 C 盘以外的位置创建一个 **Neo4j2** 文件夹,再在下面…

Prompt 提示词工程通过设计指令、上下文、输入与输出格式,引导大语言模型精准完成任务,并依托'核销流程'(解析 - 拆解 - 理解 - 生成 - 验证)确保结果合规。文章系统讲解提示词编写策略、幻觉与输出不匹配的应对方法,展示内容生成、数据分析等场景案例,并展望自动提示词生成、多模态融合等未来趋势。 引言 在人工智能飞速发展的当下,大语言模型(LLM)如…

近期在 RSS、CoRL、ICRA、IROS 等机器人顶会上发表的关于'灵巧手'(dexterous hand)的研究论文。内容涵盖灵巧手的定义与分类、基础控制器设计、低成本力反馈手套、抓取类型合成、海量演示数据生成、指尖微振动重构、视觉运动策略、多接触建模、触觉隐式表示、纸张抓取、人手结构设计、野外交互、通用接口、LLM 奖励函数、鲁棒抓取、杂乱场景抓取、…

深入解析医疗送药机器人的三重链式编程技术,涵盖空间拓扑优化、动态算法决策及多级容错控制。文章探讨了研究背景、国内外现状及创新点,重点剖析了基于 SLAM 的三维语义地图构建、动态障碍物概率场建模等核心原理,旨在提升机器人在复杂医疗环境下的导航效率、智能决策能力与系统稳定性。
FPGA 时序优化涉及关键路径分析、寄存器重定时及流水线设计。文章通过 Vivado 工具实践,讲解了如何利用专用进位链、逻辑复制及布局约束压缩延迟。针对多时钟域,介绍了两级触发器同步与异步 FIFO 格雷码方案。结合高速采集案例,展示了四级流水线 FFT 与跨时钟域处理的具体实施步骤,强调早仿真、早约束的工程习惯以确保时序收敛。

介绍 Stable Diffusion 大模型的基础知识。主要对比了 SD1.5 和 SDXL 两个主流版本的理论差异与现实优缺点,指出 SD1.5 生态成熟适合商用,SDXL 画质更好但要求高。介绍了 LCM/Turbo 等加速模型的特点。提供了 LibLib、Civitai 等下载渠道及常用写实、二次元模型的推荐列表。最后说明了 ComfyUI 中模型的…

使用 Rokid 灵珠平台零代码搭建旅游 AR 智能体的流程。涵盖平台登录、基础信息配置、人设与回复逻辑设置(含系统提示词编写)、预设开场白设定及调试优化环节。通过可视化编排实现情感陪伴与旅游服务功能的端侧部署,适配 Rokid Glasses 智能眼镜,完成从创意到落地的敏捷开发。
对比了 Qwen-Image-Edit-2511 与 Stable Diffusion 在图像编辑任务中的表现。Qwen-2511 采用原生编辑架构,擅长保持人物一致性、几何结构精准及批量处理;SD 基于生成模型,依赖插件和掩码,适合创意发散但调试成本高。实测显示 Qwen-2511 在换背景、多主体风格迁移、工业线稿增强等场景更稳定高效,适合生产环境;SD…
对论文 AI 检测率过高的问题,提出了八种实用解决方案。核心在于打破 AI 固有的句式与逻辑模式,而非简单替换词汇。具体方法包括变换语态、添加具体细节、优化连接词、调整段落结构、引用最新文献、利用格式排版技巧、语言混合处理以及选择合适的工具。通过这些手段,可以在保持学术严谨性的同时,显著降低 AI 识别率,确保论文顺利通过审核。

解析了 GitHub Copilot 的三种指令文件:copilot-instructions.md(项目全局)、AGENTS.md(Agent 专属任务)和.instructions.md(目录局部)。通过对比生效范围、触发方式及优先级,提供了 Python 项目的实战配置示例。旨在帮助开发者根据粒度分层和功能隔离原则,精准配置 Copilot 行为,提升…
在 Linux 系统中利用 Docker 容器化技术部署 Ollama 大语言模型及 Open-WebUI 可视化管理界面的完整流程。内容涵盖 Docker 环境搭建、国内镜像源配置、NVIDIA GPU 驱动支持、Ollama 容器启动参数设置以及 Open-WebUI 的 CUDA 版本部署。最终实现本地私有化大模型的交互体验,适用于开发测试与智能应用构…

探讨了机器人架构设计的核心准则,强调在进行工程落地前应先完成系统性论文论证。文章指出当前行业存在跳过规划盲目开发的误区,导致项目烂尾。提出'工程论文'概念,将其定义为系统顶层设计与可行性验证的蓝图,旨在用确定性逻辑对抗物理世界的不确定性,保障项目流程闭环与资源高效利用。