手机上也能运行Stable Diffusion?Github上开源且完全免费的AI生图软件!斩获1.4K Stars

手机上也能运行Stable Diffusion?Github上开源且完全免费的AI生图软件!斩获1.4K Stars

Hello,大家好!

今天给大家分享一款GitHub上1.4k星标的开源神器——手机端AI绘画工具,

软件已经整理在文末,有需要的朋友记得获取保存哦~

 链接:https://pan.quark.cn/s/fa5abdb93460

一、软件打开方式

这款工具为安卓APK安装包,共提供两个版本:带过滤器版本和不带过滤器版本,大家可以根据自己的需求选择。下载后直接安装到手机上即可运行,无需复杂配置。

二、软件的功能介绍

这是一款让安卓手机直接运行Stable Diffusion的AI绘画工具,主要特色包括:

全功能AI绘画

支持文生图:输入提示词一键生成图像

支持图生图:导入参考图片二次创作

支持图像修复:模糊图片一键变清晰

多模式加速

支持CPU/GPU/NPU三种运行模式

高通骁龙处理器可启用NPU加速,生成速度极快

非骁龙处理器也可用CPU/GPU流畅运行

开源免费

GitHub开源项目,完全免费无限制

模型可自由下载切换

三、使用指南

第一步:安装与首次设置

下载APK文件并安装至安卓手机

打开软件,首次使用会弹出处理器识别提示

高通骁龙处理器可开启NPU加速,非骁龙选择CPU/GPU模式

重要设置:点击「设置」→ 将下载源从默认地址切换为hf开头的镜像源,否则模型无法下载

第二步:下载模型

根据处理器类型选择对应模型

骁龙用户选择NPU模型(推荐1.1GB版本)

点击确定,软件自动下载并解压

等待解压完成即可使用

第三步:文生图操作

选择已下载的模型

输入提示词(支持中文)

点击「生成图像」

NPU加速下,生成一张图仅需3秒以内

生成完成后点击右上角保存按钮,图片保存至手机相册

点击「历史」可查看过往生成记录

第四步:图像修复

点击软件右上角魔法棒图标

选择需要变清晰的图片

选择动漫或真实模型

一键优化,模糊图秒变高清

第五步:图生图操作

选择模型

导入参考图片

软件自动基于参考图生成新图像

支持高级设置:分辨率、调度器等参数可手动调整

四、使用体验

以前想在手机上跑Stable Diffusion,要么得租云端服务器,要么得折腾PC远程连接。现在好了,一个APK装完,手机直接变身AI画室。

骁龙用户开NPU,三秒一张图,丝滑得不像是在跑AI;非骁龙用户用CPU模式,虽然慢一点,但也能完整跑通。文生图、图生图、老照片修复,桌面端能做的事手机一样不少。整套工具已打包整理,方便大家一次性获取使用,有需要的朋友快去下载试试吧!

五、下载链接

链接:https://pan.quark.cn/s/fa5abdb93460

Read more

Open WebUI重排序功能终极配置指南:从入门到精通

Open WebUI重排序功能终极配置指南:从入门到精通 【免费下载链接】open-webuiOpen WebUI 是一个可扩展、功能丰富且用户友好的自托管 WebUI,设计用于完全离线操作,支持各种大型语言模型(LLM)运行器,包括Ollama和兼容OpenAI的API。 项目地址: https://gitcode.com/GitHub_Trending/op/open-webui 你是否遇到过Open WebUI搜索结果不够精准、AI回答与预期相差甚远的问题?重排序功能正是解决这一痛点的关键利器。本文将带你从零开始,全面掌握Open WebUI重排序功能的配置、优化和应用技巧,让你的AI助手真正理解你的需求。 什么是重排序?为什么它如此重要? 重排序(Reranking)是Open WebUI检索系统中的智能优化模块。想象你在图书馆找书,初始搜索可能返回100本相关书籍,而重排序功能则像一位专业的图书管理员,根据你的具体需求将最匹配的10本放在最前面展示。 在Open WebUI中,重排序功能通过以下核心模块实现: * 重排序模型实现:位于backend/open_

眼科OCT图像分析:GLM-4.6V-Flash-WEB测量视网膜厚度

眼科OCT图像分析:GLM-4.6V-Flash-WEB测量视网膜厚度 在现代眼科临床实践中,医生每天要面对数十甚至上百张OCT图像。这些高分辨率的横截面影像虽然能清晰展示视网膜各层结构,但手动测量黄斑区厚度、追踪病灶变化的过程却极其耗时且易受主观因素影响。尤其是在基层医院或远程诊疗场景中,专业阅片医师资源紧张,亟需一种既能保持精准度又能快速响应的自动化分析工具。 正是在这样的背景下,GLM-4.6V-Flash-WEB 的出现显得尤为及时。它不是传统意义上的图像分割模型,而是一个具备“看懂图像+理解语言”双重能力的轻量级多模态视觉语言模型(VLM)。这意味着我们不再需要为每个测量任务单独训练一个深度学习网络,而是可以通过自然语言直接向系统提问:“请测量中心凹内核层的视网膜总厚度”,模型就能自动定位目标区域并返回结果——就像一位经验丰富的AI助手实时协助诊断。 模型架构与工作流程:从图像到语义推理 GLM-4.6V-Flash-WEB 基于Transformer的编码器-解码器结构构建,融合了视觉感知与语言理解两大能力。其核心流程并非简单的“输入图像→输出标签”,而是实现了真

Sonic数字人前端界面可用Vue + Three.js构建交互式预览

Sonic数字人前端界面可用Vue + Three.js构建交互式预览 在虚拟内容爆发的时代,我们正见证一场从“真人出镜”到“数字人上岗”的悄然变革。无论是电商平台的24小时客服、教育领域的AI讲师,还是短视频平台上活跃的虚拟主播,数字人已不再是科幻电影中的概念,而是切实走进了生产流程。然而,传统数字人系统依赖复杂的3D建模与动画绑定,开发周期长、成本高,难以满足轻量化和快速迭代的需求。 Sonic 的出现改变了这一局面。作为腾讯与浙江大学联合研发的轻量级口型同步模型,它仅需一张静态人脸图像和一段音频,就能生成唇形精准对齐、表情自然流畅的说话视频。这极大降低了数字人内容创作的技术门槛。但真正让这项技术“落地可用”的,是其前端交互体验的设计——如何让用户直观地上传素材、调节参数,并在点击“生成”前就大致预知结果? 答案正是:Vue + Three.js 构建的交互式预览系统。 为什么选择 Vue?不只是为了“写页面” 很多人认为前端框架只是用来“画按钮和表单”,但在数字人这类复杂应用中,Vue 扮演的是整个系统的“神经中枢”

前端数据库 IndexedDB 详解:构建强大的离线Web应用

IndexedDB 详解:构建真正强大的离线 Web 应用(2025–2026 实用指南) IndexedDB 是浏览器内置的 NoSQL 数据库,专门为前端设计,用于在客户端存储大量结构化数据,是目前实现离线优先(Offline First)、PWA、复杂前端状态持久化的最强工具。 一、为什么前端需要 IndexedDB?(对比其他存储方式) 存储方式容量限制(大致)数据结构事务支持异步/同步适合场景离线能力Cookie4KB键值对无同步会话标识、少量配置弱localStorage5–10MB键值对(字符串)无同步简单配置、用户偏好中sessionStorage5–10MB键值对无同步临时表单数据、tab 间状态弱Cache Storage较大(取决于浏览器)响应对象无异步静态资源缓存(Service Worker)强(资源)IndexedDB几百 MB ~ 几 GB对象存储有异步大量结构化数据、离线 CRUD、复杂应用最强 一句话结论: