
LLaMA Factory 大模型微调实战指南
目录 一、LLaMA-Factory 简介 二、安装部署 三、数据微调 1、数据集的建立 2、数据集格式 3、模型参数 4、开始运行 5、导出模型 四、WebUI 评估预测与对话 导出 五、SFT 训练 命令行 六、LoRA 合并 合并 量化 七、推理 原始模型推理配置 微调模型推理配置 多模态模型 批量推理 八、评估 通用能力评估 NLG 评估 评估相关参数 一、LLaMA-Factory 简介…

目录 一、LLaMA-Factory 简介 二、安装部署 三、数据微调 1、数据集的建立 2、数据集格式 3、模型参数 4、开始运行 5、导出模型 四、WebUI 评估预测与对话 导出 五、SFT 训练 命令行 六、LoRA 合并 合并 量化 七、推理 原始模型推理配置 微调模型推理配置 多模态模型 批量推理 八、评估 通用能力评估 NLG 评估 评估相关参数 一、LLaMA-Factory 简介…
综述由AI生成VSCode Copilot 无法登录问题概述 Visual Studio Code (VSCode) 中的 GitHub Copilot 作为一款智能代码补全工具,极大提升了开发者的编码效率。然而,在实际使用过程中,部分用户频繁遭遇 Copilot 无法正常登录的问题,导致功能受限或完全不可用。该问题可能由多种因素引发,包括网络连接异常、身份验证失效、插件配置错误或系统环境限制等。 常见表现形式…

摘要 刚刚斩获全球人形机器人出货量的冠军,宇树科技(Unitree)已迅速转向高关注度营销的造势。2026 年初,宇树发布一段震撼视频:其 G1 人形机器人身着羽绒服,在新疆阿勒泰地区(被誉为人类滑雪发源地)的极寒环境中,顶着 -47.4℃的低温穿越茫茫雪原,最终用 13 万步精准刻出中央广播电视总台(CMG)2026 年冬奥会转播标识。这场看似炫酷的营销活动,背后既是 G1 极端环境适配能力的技…
LFM2.5-1.2B-Thinking 实战:打造个人 AI 写作助手 引言:当写作遇到瓶颈,你需要一个聪明的伙伴 你有没有过这样的经历?面对空白的文档,脑子里有无数想法,却不知道如何下笔。写工作报告时,总觉得语言干巴巴,缺乏感染力。构思一篇创意文案,绞尽脑汁也想不出让人眼前一亮的句子。如果你经常被这些问题困扰,那么今天介绍的这位'伙伴'可能会彻底改变你的写作体验。 LFM2.5-1.2B-Th…
目的 基于 Vivado 平台,通过对 MT25QL256 SPI Flash 进行在线烧写,实现 Xilinx 7K325t FPGA 程序在线更新升级。 MT25QL256 SPI Flash 描述 2.1. 功能特性 SPI 兼容串行总线接口 单速和双速传输 (STR/DTR) 时钟频率 STR 模式下所有协议最高 133 MHz DTR 模式下所有协议最高 90 MHz 双/四 I/O 命…
在 WSL Ubuntu 环境下配置 Neo4j 图数据库时,常遇到连接失败问题,常见报错包括: neo4j.exceptions.ServiceUnavailable: Unable to retrieve routing information Connection refused (Errno 111) 针对 WSL Ubuntu 环境,提供以下两种解决方法: 方法一:使用 Windows…
Cosmos-Reason1-7B 机器人抓取前的重力与稳定性分析 引言:当机器人学会'思考'物理世界 想象一下,你面前有一张桌子,上面放着一个装满水的玻璃杯。你想把它拿起来,你的大脑会在一瞬间完成一系列复杂的判断:这个杯子重不重?表面滑不滑?我该用多大的力气?抓哪个位置最稳?这些基于重力、摩擦力和稳定性的直觉判断,是人类与生俱来的物理常识。 但对于机器人来说,这曾是一个巨大的挑战。传统的机器人抓…

综述由AI生成简介 Termux Termux 是一款运行于 Android 系统的开源终端模拟器。该软件提供了 Linux 环境,即使设备不具备 root 权限也可使用。通过自带的包管理器(Pacman、APT),Termux 可以安装许多现代化的开发和系统维护工具,例如 zsh、Python、Ruby、NodeJS、MySQL 等软件。 Termux 目前已经恢复在 Google Play 更新,但仍在 F…
利用 ClawdBot 和 MoltBot 组合,在本地设备部署粤语与英语双向翻译机器人。通过集成 vLLM、LibreTranslate 及 Whisper 等开源模型,实现完全离线的语音识别、OCR 及文本翻译功能,解决海外华人社区语言沟通障碍。方案强调数据隐私保护,无需云端上传,支持 Telegram 群聊实时响应,并提供运维优化建议。
基于飞书的多 Agent 系统架构设计,通过 OpenClaw Gateway 实现飞书应用与 AI Agent 的对接。系统采用多 Agent 架构,每个飞书机器人对应独立的 AI Agent,拥有专属的工作空间、知识库和模型配置。 隔离性说明: 每个 Agent 的模型状态完全独立 每个 agent 对应一个飞书机器人 每个 agent 的技能单独安装维护 模型切换仅对当前会话生效(…

一、主要参考 ZJU-FAST-Lab/ego-planner 二、硬件组成 所用硬件设备如下: OrangePi 5 MAX / Intel NUC Holybro Pixhawk 6C Intel RealSense D435i Depth Camera 4S 2300mAh 45C 电池 HKSRC 2205-2450KV / T-Motor V2306-2400KV 电机 HKSRC 45…
综述由AI生成机器人重力补偿技术:MuJoCo 实现解析与原理分析 技术挑战引入:重力场中的机器人控制困境 在精密制造领域,当六轴机械臂以 0.1mm 精度装配半导体元件时,未补偿的重力会导致末端执行器产生 2.3mm 的静态偏移,直接超出工艺允许误差范围。医疗手术机器人在进行脑组织穿刺时,重力引起的臂端下垂可能造成 0.5mm 的定位误差,这在神经外科手术中可能导致严重后果。这两个典型场景揭示了同一个核心问题…

综述由AI生成Vivado Aurora 8B/10B IP 核配置详解 Aurora 8B/10B 是 Xilinx 开发的一种轻量级、链路层的高速串行通信协议。它比单纯的 GT(Transceiver)收发器更高级(因为它帮你处理了对齐、绑定、甚至流控),但比以太网或 PCIe 更简单、延迟更低。 官方手册较为复杂,建议结合实际配置进行理解。实际使用中,很多部分由 IP 核自动生成,主要工作在于修改参数。…
项目介绍 dirsearch 是一款高效、多线程的 Web 路径扫描工具,专为渗透测试人员和网络安全研究人员设计,用于发现目标网站的隐藏目录、敏感文件及未授权接口。其支持自定义字典、代理配置、请求头伪装等功能,适用于红队渗透、漏洞挖掘及资产测绘等场景。 核心功能 **多线程扫描**:默认 20 线程,可自定义调整以提高效率。 **智能错误处理**:自动过滤重复状态码(如 404),降低误报率。 *…

本项目是一个面向 **eNSP(华为网络模拟器)实验/教学场景** 的前后端分离平台,支持导入 .topo 拓扑、自动连接本地 eNSP 设备 Console 抓取 display current-configuration,并结合拓扑与配置进行故障分析、输出修复建议与命令。同时集成 Ping 工具、子网计算器、网络扫描等常用辅助能力。 > 适用场景:课程实验、网络排障训练、批量配置生成、拓扑可视…
PyTorch Grad-CAM 完整教程:从入门到生成高质量 AI 热力图 核心概念:理解 Grad-CAM 技术原理 Grad-CAM(梯度加权类激活映射)是一种先进的可解释 AI 技术,通过分析模型的梯度信息生成热力图,直观展示模型在决策过程中的关注区域。PyTorch Grad-CAM 工具包支持多种神经网络架构,包括 CNN、Vision Transformer 等,适用于分类、检测、分…
> 2025 年中,Andrej Karpathy 提出 Context Engineering 比 Prompt Engineering 更重要。不到一年,2026 年 2 月,一个新概念横空出世——Harness Engineering。以第三人称视角,梳理这一概念的起源、内涵与演进脉络,并以 CLI-Anything 项目为案例,探讨 Harness Engineering 在"让所有软…

综述由AI生成一、为什么 2026 年必须掌握大模型本地部署 随着大模型技术的普及,企业对数据隐私的诉求、边缘场景的实时响应需求,以及云部署的成本压力,都推动了**大模型本地部署**成为 AI 开发的核心技能。2026 年,本地部署不再是可选方案,而是: **隐私合规刚需**:金融、医疗等敏感行业必须将数据留在本地环境 **边缘场景标配**:自动驾驶、工业物联网等低延迟场景需要本地推理能力 **成本优化关键**…

AI 自动化数据标注平台架构与关键技术实现 !AI 自动化数据标注平台架构图 文章目录 自动化数据标注的重要性 自动化数据标注平台架构 关键技术实现 3.1 主动学习与半监督学习 3.2 预标注技术 平台核心功能模块 4.1 智能标注辅助 4.2 质量控制机制 4.3 项目管理与协作 实际应用案例 5.1 目标检测项目自动化 性能优化策略 6.1 分布式处理 6.2 缓存与增量学习 面临的挑战与解…

大模型工程化与传统 AI 工程的核心差异解析 !在这里插入图片描述 > **学习目标**:是基础入门部分,帮助读者建立大模型工程化的初步认知。通过学习,你将全面掌握'大模型工程化与传统 AI 工程:核心差异解析'这一核心主题。 --- 一、引言:为什么这个话题如此重要 在大模型技术快速发展的今天,大模型工程化与传统 AI 工程的核心差异解析已经成为每个 AI 工程师必须掌握的核心技能。…