从零开始:Stable Diffusion API本地部署与实战调用指南

1. 环境准备与本地部署

想要玩转Stable Diffusion API,第一步得先把环境搭建好。这就像你要做菜,总得先有个厨房对吧?我推荐直接从GitHub克隆官方stable-diffusion-webui项目,这是最稳妥的选择。不过要注意,你的显卡最好是NVIDIA的,显存至少4GB起步,不然跑起来会非常吃力。

安装过程其实比想象中简单。先确保系统有Python 3.10.6,然后按顺序执行这几个命令:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git cd stable-diffusion-webui pip install -r requirements.txt 

启动时有个关键点要注意:必须加上--api参数!这个参数就像是打开大门的钥匙,不加的话API功能就用不了。启动命令长这样:

python launch.py --api 

第一次运行会自动下载模型文件,文件比较大可能要等一会儿。我遇到过下载卡住的情况,这时候可以手动把模型文件放到models/Stable-diffusion目录下。模型文件一般叫v1-5-pruned-emaonly.safetensors或者类似的名字。

2. API接口配置与验证

服务启动后,默认会在7860端口监听。打开浏览器访问http://localhost:7860,能看到熟悉的WebUI界面。这时候API其实已经可以用了,但为了安全起见,建议设置下认证。

在webui-user.bat(Windows)或者webui.sh(Linux/Mac)里,可以加上这些参数:

set COMMANDLINE_ARGS=--api --api-auth username:password 

这样就需要用Basic Aut

Read more

最新 AI 论文盘点(2026-03-18):6 篇新作看记忆、长上下文、医疗评测、机器人策略与世界模型

最新 AI 论文盘点(2026-03-18):6 篇新作看记忆、长上下文、医疗评测、机器人策略与世界模型 今天这批新论文里,我觉得有几条线特别值得看。 一条是 LLM / Agent 的记忆与长上下文,讨论怎么把“记住信息”和“真正用好上下文”这两件事拆开来做。 一条是医疗与真实场景评测,重点不再是静态 benchmark,而是更贴近临床和工作流的真实使用偏好。 还有一条是机器人与具身智能,不少工作开始把重点放在“少改模型、更多利用结构和搜索”上,而不是一味增大训练规模。 这篇挑 6 篇我认为更值得盘的论文,尽量少复述摘要,多讲它到底在解决什么问题、方法核心新在哪里、为什么值得关注、局限和边界是什么。 1. NextMem:给 LLM Agent 做“潜在事实记忆” 论文: NextMem: Towards Latent Factual

科研快报 |从特斯拉到科沃斯:具身智能让机器人成真!

科研快报 |从特斯拉到科沃斯:具身智能让机器人成真!

Prism Path 科   研   快   报 CS跨学科顶尖期刊论文资讯 -NO.2025018- 机器人技术中的人工智能路线图 A roadmap for AI in robotics 期刊:Nature Machine Intelligence(Q1/一区) 发布日期:2025年06月19日 DOI: 10.1038/s42256-025-01050-6 2025年最后一篇顶刊文章分享。我们借着一篇发表在《Nature Machine Intelligence》顶刊的论文,带大家聚焦于具身智能这个极具潜力的热门领域。 目录 一、论文观点概述 二、具身智能:概念与前沿应用 01 人形机器人 02 仓储/物流机器人 03 服务型机器人 三、具身智能实现的主要瓶颈

【Part 4 XR综合技术分享】第一节|技术上的抉择:三维实时渲染与VR全景视频的共生

【Part 4 XR综合技术分享】第一节|技术上的抉择:三维实时渲染与VR全景视频的共生

《VR 360°全景视频开发》专栏 将带你深入探索从全景视频制作到Unity眼镜端应用开发的全流程技术。专栏内容涵盖安卓原生VR播放器开发、Unity VR视频渲染与手势交互、360°全景视频制作与优化,以及高分辨率视频性能优化等实战技巧。 📝 希望通过这个专栏,帮助更多朋友进入VR 360°全景视频的世界! Part 4|XR综合技术分享 最后一Part了,我将分享一些关于当前常用的XR综合技术,内容涵盖三维实时渲染与全景视频的共生、多模态交互体验的融合,以及AI如何深度赋能XR应用,推动智能化发展。同时畅想通向全感知XR智能沉浸时代的未来,探索如何通过更先进的技术不断提升用户体验。毕竟,360°全景视频仅是XR应用中的冰山一角。 第一节|技术上的抉择:三维实时渲染与VR全景视频的共生 文章目录 * 《VR 360°全景视频开发》专栏 * Part 4|XR综合技术分享 * 第一节|技术上的抉择:三维实时渲染与VR全景视频的共生 * 1、VR内容形态的分化与融合 * 1.1 三维实时渲染的发展 * 1.2

【保姆级教程】从零部署宇树 Unitree 机器人 ROS 2 环境 (Go2/B2/H1) (Humble + 真实硬件)

摘要 本文为希望在ROS 2 (Humble) 环境下开发宇树 (Unitree) 机器人(支持 Go2, B2, H1)的开发者提供了一篇详尽的、从零开始的部署指南。我们将首先在 Ubuntu 22.04 上安装 ROS 2 Humble,然后重点讲解如何配置 unitree_ros2 功能包,实现 ROS 2 节点与机器人底层 DDS 系统的直接通信。本教程基于官方文档,并针对 Humble 环境进行了优化,可跳过 Foxy 版本复杂的 CycloneDDS 编译步骤。 核心环境: * 操作系统: Ubuntu 22.04 (Jammy) * ROS 2 版本: Humble