Llama-Factory 训练中文小说续写模型的实践心得
分享了使用 Llama-Factory 微调 Baichuan2-7B 模型进行中文小说续写的实践经验。通过结合 QLoRA 技术,在单张 RTX 3090 上实现了高效微调。文章详细阐述了数据构建、训练配置、模型合并及部署流程,并针对生成风格、长文本连贯性及过拟合问题提供了优化方案。核心在于利用 LoRA 降低显存需求,配合高质量数据清洗,最终成功训练出具…
博客作者
操作系统研究者
352
已发布文章
7.8K
博客获赞
730K
博客浏览
第 7 页
分享了使用 Llama-Factory 微调 Baichuan2-7B 模型进行中文小说续写的实践经验。通过结合 QLoRA 技术,在单张 RTX 3090 上实现了高效微调。文章详细阐述了数据构建、训练配置、模型合并及部署流程,并针对生成风格、长文本连贯性及过拟合问题提供了优化方案。核心在于利用 LoRA 降低显存需求,配合高质量数据清洗,最终成功训练出具…

前端文件上传的优化方案。针对原生 input 标签在大文件上传时缺乏进度提示和断点续传的问题,阐述了分片上传、断点续传及拖拽上传的实现原理。通过切片处理、并发控制、进度回调及本地存储记录已上传分片,有效提升了上传的稳定性和用户体验。文中提供了基于 Fetch API 和 React Hooks 的代码示例,建议在开发中采用这些优化手段替代基础上传方式。
对 PaddleOCR-VL-WEB 在高并发场景下推理延迟高的问题,提出四层优化策略。通过启用 Paddle Inference 结合 TensorRT 加速算子,构建异步批处理队列提升 GPU 利用率,使用 OpenCV 替代 PIL 优化图像预处理,并压缩输出数据及迁移至 FastAPI 框架。实测在 RTX 4090D 环境下,端到端推理效率提升超…

在 Linux CentOS 7 环境下安装 OpenJDK 和 Tomcat 10 的步骤,包括环境变量配置及默认首页修改。随后通过 cpolar 工具进行内网穿透配置,将本地 Tomcat 服务的 8080 端口映射为公网可访问地址,支持随机域名或固定二级子域名,实现了本地 Web 应用在公网环境下的便捷调试与演示。
探讨了前端开发中使用组件库的必要性,指出手动编写组件会导致样式不统一和维护困难。通过对比手动实现与使用主流组件库(如 Ant Design、Material UI、Tailwind CSS + Shadcn UI)的代码示例,展示了利用成熟组件库如何提升开发效率和代码质量,建议开发者避免重复造轮子。
深入解析了 FPGA 领域的核心概念,包括 FMC 接口标准及其 VITA 规范(57.1 与 57.4 对比)、Xilinx UltraScale 架构与 MPSoC 组成。详细阐述了 LVDS、DDR2、QSPI、SPI、UART、JTAG 等关键硬件接口与通信协议的原理及应用区别。文章还对比了 MCU 与 FPGA 在本质、并行能力、时序确定性等方面的…
基于 ROS1 和 FAST_LIO 算法在 Ubuntu 20.04 环境下为宇树 G1 机器人配置建图系统的完整流程。内容涵盖系统依赖安装、工作空间搭建、Open3D 与 Livox SDK 配置、雷达参数调整以及通过终端启动建图流程和 RViz 可视化界面。
探讨前端监控的重要性及实施方法。通过对比无监控导致的开发盲区,介绍了使用 Sentry 进行错误监控、web-vitals 进行性能监控以及自定义事件追踪用户行为的正确实践。旨在帮助团队实现主动发现问题,提升应用稳定性与用户体验。

探讨 AI 驱动游戏在鸿蒙生态中的机会。指出游戏作为可控环境、即时反馈系统,与 AI 结合紧密。鸿蒙的分布式能力、端侧 AI 及软硬一体特性为游戏带来新变量。提出四大核心方向:AI 玩家、AI NPC、AI 游戏生成、多 Agent 游戏。建议开发者从小 Demo 切入,抽象接口并引入服务层。同时分析性能、设计、安全及成本挑战,预测短期辅助玩家、中期动态生成…

ESP32 内置 Wi-Fi 功能,可作为网页服务器向网络设备提供服务。基于 Arduino-ESP32 核心库中的 WebServer.h,介绍同步 WebServer 的适用场景及基础配置方法。通过 STA 模式连接 WiFi,注册路由路径并编写回调函数,实现静态页面展示。该方案适用于资源受限或低并发场景的物联网本地交互项目。
介绍 whisperX 语音识别工具的安装与使用。涵盖 Python 环境配置、PyTorch 依赖、命令行及 Python API 调用方法。支持单词级时间戳对齐和多说话人区分。包含常见问题解决方案,如 GPU 内存不足处理。适合需要高精度语音转写和字幕生成的开发者。
介绍如何在安卓手机上通过 Termux 和 Ubuntu 容器环境,本地部署 OpenClaw 应用及 Llama 大模型。步骤涵盖 Termux 初始化、Ubuntu 系统安装、Node.js 环境配置、Ollama 或 llama.cpp 模型加载、OpenClaw 安装与连接配置,以及浏览器访问方式。支持无需 Root 权限运行,适合具备基础命令行操作…

介绍如何利用 Rokid CXR-M SDK 在 Android 上开发 AR 演讲提词器应用。通过蓝牙连接眼镜,使用 WORD_TIPS 场景实现隐形提词。核心功能包括演讲稿管理、智能分页算法(按段落语义分割)、实时内容同步及翻页控制。解决了传统提词器不专业、设备昂贵的问题,利用 AR 眼镜提供隐蔽、便携的平视体验。代码采用 Kotlin 编写,封装了 S…

详述了在 Windows 系统下部署 OpenClaw 智能体的完整步骤。内容涵盖使用 nvm 管理 Node.js 22 环境,通过 PowerShell 脚本安装 OpenClaw,配置 Kimi 大模型 API 密钥,以及连接飞书自建应用实现消息交互。教程包含从环境准备、应用安装、权限配置到故障排查的全过程,帮助用户快速构建本地 AI 工作流。

盘点 2026 年 20 款主流 AI 编程工具,涵盖 AI 原生 IDE、代码编辑器及 Coding Agent 三大品类。详细解析了 Trae、IntelliJ IDEA、VS Code、Cursor、GitHub Copilot 等工具的核心定位、AI 功能亮点、适配技术栈、差异化优势及定价方案。旨在帮助不同技术方向与从业阶段的开发者,根据业务场景精准…
测试了 Qwen3-4B-Instruct 模型在纯 CPU 环境下的推理性能。测试环境为 Intel Xeon Platinum 8369B,32GB 内存。结果显示,简单问答场景下平均生成速度约 4.7 token/s,代码生成约 3.1 token/s,小说创作约 2.3 token/s。主要瓶颈在于首 token 延迟高及长序列生成缓慢,内存占用接近…

介绍无人机在光伏电站巡检中的应用。针对传统人工巡检效率低、风险高、漏检率高等痛点,阐述了基于多旋翼无人机、红外热像仪及 AI 算法的智能巡检系统架构。通过可见光、红外等多源数据融合,结合深度学习模型实现缺陷自动识别。实际案例表明,该技术可将巡检周期从数周缩短至数天,缺陷检出率提升至 96%,显著降低运维成本并提升发电效率。未来将向全自主化、集群协同及数字孪生…
基于 RMBG-2.0 模型的企业级背景去除系统集成方案。内容涵盖环境搭建、API 接口封装、Flask 后端服务构建以及支持拖拽上传的前端界面实现。教程详细展示了从依赖安装到 Docker 容器化部署的完整流程,包括性能优化建议和生产环境配置。通过前后端分离架构,实现了轻量高效的图像处理服务,适用于电商、设计等多种场景。
Calibre-Web 官方移除豆瓣 API 支持后,介绍通过第三方插件恢复元数据自动获取功能。涵盖源码部署、文件配置、服务重启、参数调优(缓存、并发)、搜索策略优化及常见问题排查。旨在帮助用户构建高效的电子书管理系统,实现元数据智能聚合与批量更新。
一种 AI 驱动的网络故障自动诊断系统架构。通过六层结构实现数据采集、规范化、知识推理、交互与执行闭环。核心包括结构化故障树建模、规则与机器学习结合的推理引擎、主动探测机制及安全执行模型。系统强调可解释性、证据链审计与最小验证集选择,支持从 MVP 到生产级的渐进式迭代,旨在降低 MTTR 并提高排障路径的可复现性。