Stable Diffusion XL 1.0 高性能推理:FP16 混合精度部署实测
基于 Stable Diffusion XL 1.0 的高性能推理方案,重点采用 FP16 混合精度部署。实测显示,相比 FP32 全精度,显存占用减少约 39%,推理速度提升约 42%,画质损失可忽略。文章涵盖环境搭建、模型配置、核心功能体验及参数调优技巧,为开发者在消费级硬件上部署 AI 绘画提供了完整参考。
博客作者
甜品控
329
已发布文章
13K
博客获赞
952K
博客浏览
第 6 页
基于 Stable Diffusion XL 1.0 的高性能推理方案,重点采用 FP16 混合精度部署。实测显示,相比 FP32 全精度,显存占用减少约 39%,推理速度提升约 42%,画质损失可忽略。文章涵盖环境搭建、模型配置、核心功能体验及参数调优技巧,为开发者在消费级硬件上部署 AI 绘画提供了完整参考。

OpenClaw 智能体框架的部署流程,涵盖服务器环境初始化、外部模型 API 配置、网关网络设置及 Web UI 远程访问方法。通过命令行工具完成 Onboarding 向导,支持自定义技能库加载。此外,还详细说明了如何对接飞书机器人实现企业级集成,并提供了 JSON 配置文件的高级编排示例,帮助用户快速构建自主智能体系统。

介绍基于 SpringBoot 和 Vue 的医院挂号就诊系统。系统采用前后端分离架构,后端使用 SpringBoot 框架结合 Spring Security 进行安全控制,前端采用 Vue 3 构建界面,数据库选用 MySQL。核心功能包括患者挂号、医生排班、病历管理及费用结算等。数据表设计涵盖患者信息、医生排班及挂号记录。系统支持 RESTful AP…
是对《AIGC 自动化编程:基于 ChatGPT 和 GitHub Copilot》一书的阅读心得。文章强调了利用大模型解决复杂编程问题的核心方法论:将复杂问题分解为小问题,逐个解决后再合并。作者分享了结合 ChatGPT 与 GitHub Copilot 的七步工作流,包括需求拆解、设计框架、代码生成及迭代优化。文中指出,AI 编程能力的上限取决于使用者的…

介绍 MCP(Model Context Protocol)协议及其在 Figma 与 Cursor 联动中的应用。通过 MCP 服务,开发者可直接读取 Figma 设计稿的结构化数据,结合 AI 自动生成多平台 UI 代码(如 Android、iOS、H5、React Native)。文章提供了连接流程、代码生成实操及效果对比,指出当前技术可消除设计到代码…
复盘了在金融 IT 受限环境中,因公司 Copilot API 不支持标准 Function Calling,如何通过 ReAct 模式和 Model Context Protocol (MCP) 手动构建支持工具调用的智能 Agent。方案包括设计协议适配器转换 MCP 工具、手动构建 System Prompt 引导模型输出 JSON、实现 ReAct…

记录了 OpenClaw 在 Linux 环境下的安装与调试过程。主要解决了 Web 管理面板无法访问、设备配对失败及大模型接入等问题。通过配置国内镜像源、设置网关绑定局域网、使用 SSH 隧道转发等方式实现了本地部署。最终成功接入千帆大模型 ERNIE-Lite-Pro,并分析了使用成本。推荐使用 openclaw-cn 版本以获得更好的国内兼容性。

介绍如何在 OpenHarmony 环境下适配 Flutter 三方库 shelf_web_socket。通过配置 shelf 和 shelf_io 依赖,开发者可在端侧构建高性能 WebSocket 微服务。内容涵盖核心 API 详解、基础配置代码、典型应用场景(如跨平台调试、多端同步)以及针对移动端休眠和端口竞合的适配挑战。旨在帮助开发者实现分布式实时信…
探讨了前端团队协作的最佳实践,旨在提高开发效率和代码质量。文章指出了常见的协作问题,如代码冲突、分支管理混乱、审查不规范等,并提供了针对性的解决方案。建议采用规范的 Git 工作流(如 Git Flow),制定统一的提交规范和代码审查标准。同时强调项目管理工具的使用和沟通协作的重要性,包括每日站会和技术分享。最后提醒团队协作需把握度,避免过度流程化导致效率降…
WebP 是由 Google 开发的开源光栅图像格式,支持有损、无损压缩及动画。相比 JPEG/PNG/GIF,WebP 在同等画质下体积更小(JPEG 小 25%-35%,PNG 小 26%),且支持透明通道和真彩色动画。目前主流浏览器及操作系统已原生支持,适用于 Web 性能优化与移动端资源轻量化。开发中可通过 HTML5 picture 标签实现兼容兜…

介绍使用 LLaMA-Factory 框架配合 LoRA 技术微调 GPT-OSS-20B 大语言模型的完整流程。涵盖云环境配置、依赖安装、数据集准备、训练参数设置、权重合并及 vLLM 推理部署。包含常见错误排查如 Token 不匹配和 Python 版本问题,提供可复现的配置示例与命令,适用于需要低成本微调大模型的开发场景。
在 Windows 环境下安装和编译 llama.cpp 的完整步骤。首先需配置 MinGW、W64DevKit 及 CMake 开发环境并设置变量;随后克隆官方仓库;最后使用 CMake 配合 Visual Studio 或 MinGW 进行构建,生成 Release 版本的可执行文件。
选择 Ollama 部署本地大模型的原因及优势,包括节省成本、保护隐私、安装简便、模型丰富及 API 标准化。详细说明了基于 Docker 和 Python 环境的准备工作,提供了验证 Docker 版本及配置 Conda 环境的命令示例,并简述了 Ollama 服务的启动流程及其背后的机制。
ZeroClaw 是一款基于 Rust 开发的轻量级 AI Agent 运行时工具,具备低资源占用、快速启动及多模型支持特性。文章详细阐述了其核心优势,提供了源码编译、包管理及 Docker 三种安装方式,并演示了初始化配置与常用命令。此外,还包含 Windows 平台的一键安装脚本示例、配置文件说明及常见问题解决方案,适用于本地或服务器环境部署。

智元机器人提出的可扩展在线后训练系统 SOP。针对 VLA 模型在真实场景部署中缺乏专家级熟练度的问题,SOP 采用 Actor-Learner 闭环架构,通过机器人集群持续采集交互数据并在云端进行在线学习优化。实验表明,SOP 能显著提升预训练模型性能,且效率随集群规模线性增长,有效解决了离线训练分布偏移的问题,为通用机器人策略的规模化落地提供了关键技术路…

一种混合强化学习框架,用于解决四旋翼无人机在复杂环境中的高速避障问题。训练阶段利用 Dijkstra 势场引导智能体跳出局部最优,并结合控制障碍函数(CBF)进行安全奖励塑形;部署阶段引入高阶控制障碍函数(HOCBF)实时滤波器,对神经网络动作进行硬性约束以确保数学上的碰撞避免。实验表明,该方法在仿真及实机测试中均表现优异,在室内障碍阵列和室外丛林环境中实现…
详细记录了 CTFShow Web 入门命令执行挑战(Web29 至 Web124)的通关思路与 Payload 构造。内容涵盖基础注入、参数逃逸、文件包含配合伪协议、无参数及无字母 RCE、绕过无回显、关键词模糊匹配、字符集受限、黑盒过滤 POST 参数、输出混淆、目录限制、UAF 利用、FFI 调用、环境变量字符拼接及白名单函数利用等多种绕过技巧。文章提…

介绍开源 AI 代理框架 OpenClaw 的基础认知、核心能力及一人公司 AI 团队构建模式。详细阐述了三种部署方案(阿里云无影、Kimi Claw、云服务器)的配置步骤,包括模型接入、飞书机器人对接及权限开通流程。旨在帮助用户快速搭建本地自主执行的个人 AI 助手,实现自动化任务处理与多平台协同。

基于 FPGA 实现卷积神经网络(CNN)的设计方案,涵盖基础知识、Vivado HLS 工具使用、IP 核(RAM、FIFO、MMCM)配置以及通信协议(UART、IIC、SPI)驱动。重点讲解了卷积层、激活层、池化层和 SoftMax 层的硬件实现细节,包括半精度浮点数(FP16)运算单元设计及泰勒展开法在激活函数中的应用。文章详细阐述了从卷积本质操作到…

基于 Dankoe《使命与收益》探讨 AI 时代写作的核心价值。文章指出写作是元技能,能提升学习、思考与谋生能力。相比编程,写作定义了问题解决的底层逻辑。公开写作通过反馈机制形成复利效应,训练元认知。AI 可替代执行,但人类需通过写作保持品味、能动性与连贯性。建议从日常记录开始,持续公开写作以适应未来。