AI绘画报错

优质文章学习记录

11 Apr 2026 — 1 min read

提示输出验证失败：CheckpointLoaderSimple: - 值不在列表中：ckpt_name: 'v1-5-pruned-emaonly-fp16.safetensors' 不在 ['anything-v5-PrtRE.safetensors'] 中

模型文件夹里面没模型

这是官方链接：v1-5-pruned-emaonly.safetensors

https://huggingface.co/runwayml/stable-diffusion-v1-5/tree/main

点击同一行的小下载箭头。然后把文件放在：models/checkpoints文件夹里

你还需要标准的VAE文件，也就是：vae-ft-mse-840000-ema-pruned.safetensors

https://huggingface.co/stabilityai/sd-vae-ft-mse-original/tree/main

这个文件放在：models/vae文件夹里

现在你已经拥有运行所需的一切了。慢慢来。你最初生成的图片会很糟糕。但是继续尝试，很快你就能得到很棒的结果。

部署Qwen3-VL-32b的踩坑实录：多卡跑大模型为何vLLM卡死而llama.cpp却能“大力出奇迹”？

踩坑实录：多卡跑大模型Qwen-VL，为何vLLM模型加载卡死而llama.cpp奇迹跑通还更快？前言：部署经历针对 Qwen2.5-32B-VL-Instruct 满血版模型的部署实战。手头的环境是一台配备了 4张 NVIDIA A30（24GB显存）的服务器。按理说，96GB的总显存足以吞下 FP16 精度的 32B 模型（约65GB权重）。然而，在使用业界标杆 vLLM 进行部署时，系统却陷入了诡异的“死锁”——显存占满，但推理毫无反应，最终超时报错。尝试切换到 Ollama（底层基于 llama.cpp），奇迹发生了：不仅部署成功，而且运行流畅。这引发了我深深的思考：同样的硬件，同样模型，为何两个主流框架的表现天差地别？本文将围绕PCIe通信瓶颈、Tensor Parallelism（张量并行）与 Pipeline

Qwen1.5-0.5B-Chat教育助手开发：轻量模型集成实战教程

Qwen1.5-0.5B-Chat教育助手开发：轻量模型集成实战教程 1. 引言：为什么选择这个“小”模型？如果你正在寻找一个能快速集成到教育应用里的AI对话模型，但又担心模型太大、部署太麻烦、成本太高，那么你来对地方了。今天我们要聊的，是阿里通义千问开源家族里最“苗条”的成员——Qwen1.5-0.5B-Chat。别看它只有5亿参数，在动辄百亿、千亿参数的大模型时代显得有点“小巧”，但在特定的教育辅助场景下，它却是一个“小而美”的绝佳选择。想象一下这些场景： * 你想给在线学习平台加一个智能答疑助手，回答学生关于课程内容的简单问题。 * 你需要一个能批改选择题、填空题，并给出简单解析的自动化工具。 * 你的应用运行在普通的云服务器甚至本地电脑上，没有强大的GPU支持。在这些情况下，动辄需要几十GB显存的大模型就显得“杀鸡用牛刀”了。而Qwen1.5-0.5B-Chat就像一个专为轻量级任务定制的“瑞士军刀”，部署简单、响应迅速、资源占用极低。本教程将手把手带你，基于ModelScope（

服务器上 VsCode 的 Github Copilot：加载超时？优化与修复方案

服务器上 VS Code 的 GitHub Copilot 加载超时问题：优化与修复方案当在服务器环境使用 VS Code 的 GitHub Copilot 时，加载超时通常由网络配置或资源限制引起。以下是结构化解决方案： 1. 网络层优化配置代理（若需跨墙）在 VS Code 的 settings.json 添加： "http.proxy": "http://your-proxy-ip:port", "https.proxy": "http://your-proxy-ip:port", "http.proxyStrictSSL"

MS-S1 MAX，AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

1、安装amd gpu驱动和Rocm wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install

Read more

部署Qwen3-VL-32b的踩坑实录：多卡跑大模型为何vLLM卡死而llama.cpp却能“大力出奇迹”？

Qwen1.5-0.5B-Chat教育助手开发：轻量模型集成实战教程

服务器上 VsCode 的 Github Copilot：加载超时？优化与修复方案

MS-S1 MAX，AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b