local-dream 项目实现安卓端 Stable Diffusion 高效运行与骁龙 NPU 加速

Stable Diffusion 作为主流模型，凭借出色的图像生成能力备受青睐。然而，其对硬件性能要求较高，多数用户只能在电脑端体验。随着'local-dream'项目的出现，这一局面被打破。该项目专注于让安卓设备流畅运行 Stable Diffusion 模型，支持高通骁龙 NPU 加速，还兼容 CPU/GPU 推理。

项目核心目标与基础信息

'local-dream'项目的核心目标是打破硬件限制，让安卓用户在手机或平板上体验 Stable Diffusion 模型的强大功能。

项目源代码地址：https://github.com/xororz/local-dream 下载地址：https://github.com/xororz/local-dream/releases

丰富的功能体验

txt2img：文本驱动的创意生成

根据文本描述生成图像。用户输入提示词（Prompt），例如'masterpiece, best quality, loli, kafuu chino, solo, cute, white'，系统即可生成符合预期的图像。支持设置负向提示词（Negative Prompt）排除不想要的元素。

支持多种模型，包括 Anything V5.0、Absolute Reality、ChilloutMix 等。Anything V5.0 擅长动漫风格，Absolute Reality 和 ChilloutMix 偏向写实风格。模型总大小约 1.2GB。

img2img：图像转换的创意延伸

对现有图像进行转换，支持风格迁移、元素添加或效果调整。设计师可用于草图转成品，摄影爱好者可进行艺术化处理。

inpaint：精准修复的细节优化

重新绘制图像的选定区域，实现精准修复。例如移除多余物体或修改面部瑕疵。用户选定区域并输入提示词，系统根据提示词重新绘制。

强大的硬件支持与兼容性

全面的骁龙 NPU 支持

支持高通骁龙系列芯片 NPU 加速，涵盖旗舰级（Snapdragon 8 Gen 1/+/2/3/Elite/Elite Gen 5）及非旗舰芯片（Snapdragon 7 Gen 1/8s Gen 3）。旗舰芯片 NPU 性能强劲，大幅提升生成速度。

灵活的 CPU/GPU 推理兼容

不支持 NPU 的设备可使用 CPU/GPU 推理方案，仅需约 2GB 可用内存。虽速度不如 NPU，但兼容性强，适配各种配置。

多样化的模型支持与分辨率选择

灵活的模型导入与转换

支持本地导入基于 SD1.5 的 safetensor 模型用于 CPU/GPU 推理。NPU 加速用户可按指南将现有模型转换为 NPU 模型。

多样的分辨率支持

NPU 模式默认支持 512×512，可下载补丁启用 768×768 和 1024×1024。CPU/GPU 模式支持 128×128 至 512×512 等多种分辨率，平衡速度与质量。

实用的种子设置功能

种子（seed）用于实现图像可重现性。CPU 模式下种子最稳定，跨设备生成相同图像。GPU 模式下因驱动差异可能略有不同。NPU 模式下需相同芯片组才能保证一致性。

先进的技术实现

NPU 加速技术细节

采用高通 QNN SDK，针对 Hexagon NPU 优化。使用 W8A16 静态量化方案（权重 8 位，激活值 16 位），减少内存占用和计算量。实测生成 512×512 图像时间低至 7.9 秒。

CPU/GPU 推理技术细节

采用 MNN 框架，轻量级深度学习推理框架。使用 W8 动态量化方案，适应不同输入数据。支持多种分辨率，动态调整计算过程。

总结与展望

'local-dream'项目通过支持 NPU 加速和 CPU/GPU 推理，打破了硬件限制。采用高通 QNN SDK、MNN 框架及先进量化技术，确保模型在安卓设备上高效运行。未来有望扩展模型支持、提高分辨率及优化用户体验。

local-dream 项目实现安卓端 Stable Diffusion 高效运行与骁龙 NPU 加速