
LLaMA Factory 大模型训练与微调指南
LLaMA-Factory 大模型训练与微调平台的安装部署、数据准备、SFT 训练、LoRA 合并、推理及评估流程。涵盖 CUDA 环境配置、Python 虚拟环境搭建、数据集格式规范(Alpaca/ShareGPT)、命令行与 WebUI 操作方式、模型量化与导出策略,以及如何使用 vLLM 进行批量推理和通用/NLG 能力评估。旨在帮助用户从零开始掌握…
博客作者
观照内心
355
已发布文章
10K
博客获赞
423K
博客浏览
第 6 页

LLaMA-Factory 大模型训练与微调平台的安装部署、数据准备、SFT 训练、LoRA 合并、推理及评估流程。涵盖 CUDA 环境配置、Python 虚拟环境搭建、数据集格式规范(Alpaca/ShareGPT)、命令行与 WebUI 操作方式、模型量化与导出策略,以及如何使用 vLLM 进行批量推理和通用/NLG 能力评估。旨在帮助用户从零开始掌握…

llama.cpp 高性能 C++ 库及其在本地部署大语言模型的应用。阐述了 LLaMA、llama.cpp 与 Ollama 的区别,解释了 GGUF 模型格式的优势。提供了在 Mac M1 和 Linux 环境下安装 llama.cpp 及运行推理的具体步骤,对比了不同硬件下的推理性能,并总结了端侧部署的意义。

HTTP 协议在实时通信中的局限性,对比了定时轮询和长轮询方案,引出 WebSocket 协议及其握手流程。重点讲解了 WebRTC 技术原理,包括 STUN 服务器穿透 NAT 的机制。最后通过 SpringBoot + Netty 后端与 Vue 前端的完整项目实战,演示了如何搭建 WebSocket 信令服务并实现浏览器端实时音视频通话,涵盖依赖配置、…

QClaw 是基于 OpenClaw 构建的本地化 AI 个人助手平台,支持 Windows 和 macOS 系统。它作为连接常用聊天软件(如微信、Telegram、WhatsApp 等)与 AI 大模型(如 Claude、GPT)的桥梁,允许用户在熟悉的 IM 界面中直接使用 AI 能力。核心架构采用网关模式,具备多渠道接入、多 Agent 路由、Skil…

基于 Spring Boot 和 Vue.js 的实时游戏匹配系统实现。前端使用 Vuex 管理状态,通过 WebSocket 与后端通信;后端利用 WebSocket Server 处理连接,结合 JWT 进行身份验证。核心逻辑包括用户匹配池管理、地图生成算法及前后端状态同步。实现了从匹配界面到对战界面的动态切换,确保数据实时传输与安全性。

PX4 开源飞控系统的基本概念、组成模块及架构。PX4 支持多种无人机类型,具备自动飞行、路径规划等功能。对比 ArduPilot,PX4 采用 C++ 核心与模块化架构,适合科研与二次开发。文章列出了适合学习的人群及入门所需的环境配置,为开发者提供无人机飞控开发的初步指引。

在 VS Code 中搭建 AI 开发环境的完整流程。首先对比了主流 AI 插件,推荐使用 RooCode。接着详细说明了插件的安装步骤及三种工作模式。随后讲解了如何通过摩搭社区免费对接模型 API,以及 Minimax、GLM、Deepseek 等付费原生 API 的配置方法。最后提供了环境测试、多模型管理、快捷键设置及资源监控等高级优化建议,帮助开发者高…

一种名为 HARVEST 的无线地下土壤健康监测平台。该系统采用无源、无芯片的射频反向散射技术,结合钉状传感探头与地面三重开口环谐振器天线,通过无人机进行远程读取。HARVEST 能够监测地下土壤的体积含水量(VWC)和电导率(EC),无需电池供电,成本低廉且易于规模化部署。研究通过电磁仿真、实验室测试及田间全生育期验证,证明了该平台在 1.8 米高度下的可…
对 Xcode 真机调试时出现的'Developer Disk Image could not be unmounted'错误进行分析。主要原因包括设备调试环境残留、版本不匹配或进程占用。解决方案涵盖重启设备与 Xcode、使用 ideviceimagemounter 工具手动卸载镜像、检查 DeveloperDiskImage.dmg 文件是否存在以及清理…

传统 IT 运维面临重复劳动多、操作风险高、信息孤岛及被动响应等问题。AI 驱动的自动化运维机器人通过融合 UI 自动化、API 调用、OCR 识别及 AI 大模型能力,模拟人类操作并自主执行巡检、故障自愈等任务。其核心价值在于解放人力聚焦高价值工作、实现 7x24 小时无人值守、保障操作零失误合规以及固化知识资产。典型场景包括智能巡检报告生成、安全事件闭环…

在 Windows 系统上安装 Cherry Studio 客户端的方法,支持配置在线 API 及本地 Ollama 模型。通过设置环境变量并配合内网穿透工具,可实现公网环境下远程调用本地部署的大语言模型,包括创建智能体、文生图等功能。文中演示了随机域名与固定二级子域名的隧道配置流程,帮助用户在不依赖公网 IP 的情况下随时随地访问本地 AI 服务。

演示了如何使用 Unity 引擎结合 Claude AI 工具,在不编写任何代码的情况下制作一款名为'飞翔的牛马'的类似 Flappy Bird 的小游戏。流程包括环境准备、需求描述、AI 生成代码、问题修复及素材替换。结果显示 AI 能高效完成基础游戏开发任务,但仍需人工介入处理细节和优化体验。

详细介绍在 IntelliJ IDEA 中安装和配置 GitHub Copilot 插件的步骤,包括账号授权与激活。内容涵盖智能代码补全、注释驱动开发、Copilot Chat 对话式编程及单元测试生成等核心功能,并提供提高上下文感知、精准编写 Prompt 及快速生成样板代码等进阶技巧。此外,汇总了常用快捷键,强调代码审查与隐私安全注意事项,并列出常见问题…
介绍 Dart 三方库 bones_ui 在 OpenHarmony 系统的适配方案。利用组件化思想构建跨平台 UI,解决屏幕缩放比设置、多终端自适应布局及原生 API 桥接问题。示例展示环境初始化、响应式组件创建及动态表单构建,旨在提升鸿蒙桌面级应用开发效率与交互体验。
Claude Code 与 OpenSpec 的环境搭建流程,涵盖 Node.js 配置、OpenSpec 初始化及 Claude Code 命令行/VSCode 集成。通过实际场景测试(新项目、老项目、数据库、注释等),评估了其在代码生成、规范一致性、协同协作等方面的表现。结果显示在存量项目中效果较好,但存在成本高、流程开销大、复杂需求理解不足等问题。适合…

FPGA 中嵌入式块存储器 RAM 的原理、类型及应用。首先阐述了 RAM 的随机存取、非破坏性读取等核心特性,并分析了其在数据速率匹配缓冲和图像帧缓冲中的典型应用。接着对比了 SRAM 与 DRAM,重点讲解了 Vivado 中 Block Memory Generator IP 核的配置,包括单端口、双端口及真双端口 RAM 的选择,以及写优先、读优先等…

一款基于 WebRTC 和 AI 技术的智能远程控制解决方案。该方案采用 Kotlin 开发 Android 应用,利用 WebRTC 实现低延迟的 P2P 视频流与控制指令传输,结合 Android 原生语音识别(STT)、Google ML Kit OCR 及 TTS 技术,实现语音指令到自动执行的闭环。系统包含远程控制和本地助手两种模式,支持企业 IT…

基于 FPGA 设计 AD4630 高精度 ADC 芯片的四通道 SPI 采集方案。内容涵盖芯片手册解析、SPI 信号协议与时序分析、寄存器配置流程及 FPGA 状态机代码实现。重点阐述了 CNV 采样时钟的硬件优化方法、回环模式验证配置以及测试模式下的数据采集校验。通过独热码状态机解决时序裕量问题,实现了稳定的数据读取与拼接,为类似高精度模拟信号采集系统提…

全球老龄化加剧导致养老护理需求激增,传统家庭护理模式面临劳动力短缺和成本压力。日本和中国在护理机器人领域各有侧重,日本注重技术深耕与情感交互,中国依托市场需求加速布局。人工智能与机器人技术成为缓解养老危机的关键手段,通过自动化照料、陪伴及辅助移动等功能,提升养老服务效率与质量,推动产业智能化发展。
企业微信群机器人 Webhook 的配置流程。内容涵盖准备工作(需有效账号、至少 3 人群聊、网络通畅)、创建步骤(添加机器人至群、填写名称头像等)及注意事项。旨在指导用户完成基础配置以实现自动化消息推送。