使用 LLaMA-Factory 微调 Qwen2.5 并转换为 GGUF 格式部署
利用 LLaMA-Factory 对 Qwen2.5-7B-Instruct 进行 LoRA 微调,并通过 llama.cpp 将权重转换为 GGUF 格式的完整流程。重点解决转换过程中因 transformers 版本不兼容导致的 tokenizer.json 解析错误,提供具体修复方案和验证步骤,助力本地高效部署。
博客作者
这位作者暂未填写个人简介。
215
已发布文章
7K
博客获赞
129K
博客浏览
第 2 页
利用 LLaMA-Factory 对 Qwen2.5-7B-Instruct 进行 LoRA 微调,并通过 llama.cpp 将权重转换为 GGUF 格式的完整流程。重点解决转换过程中因 transformers 版本不兼容导致的 tokenizer.json 解析错误,提供具体修复方案和验证步骤,助力本地高效部署。

Python 在人工智能开发中占据主导地位,凭借简洁语法与丰富生态成为首选语言。梳理从零开始的学习路径,包括环境配置、基础语法、数据科学三件套(NumPy、Pandas、Matplotlib)、机器学习经典算法(Scikit-learn)以及深度学习框架(PyTorch、TensorFlow)的实战代码。内容覆盖项目流程、模型评估及时间分配建议,旨在帮助开发…

FPGA IP 核配置中 FIFO 的参数设置要点。涉及视频时域变换 FIFO 的输入输出位宽差异(8bit 转 16bit)及存储深度 512words 配置。采用不同读写时钟并生成对应控制信号。DCFIFO2 选项中启用读出侧数据量信号 usedw[] 防止溢出,并开启异步清零。DDR2 写 FIFO 配置逻辑类似。

Rokid 眼镜 AI 天气应用结合 GPS 定位与 AI 旅游规划功能,通过 Kotlin 开发。核心实现包括 LocationHelper 自动获取位置并处理直辖市逆地理编码问题,ConversationContext 管理多轮对话上下文及续播意图识别,以及利用 Claude API 生成个性化旅游建议。解决了 TTS 播报重叠、LLM 延迟控制等工程问…

基于 Stable Diffusion 与 Diffusers 库,深入解析 AIGC 插画生成的技术架构与代码实现。内容涵盖环境搭建、模型加载、提示词构建、参数调优及风格迁移全流程,辅以游戏角色与广告海报的实际应用案例。文章还探讨了版权伦理、计算资源限制等挑战,并展望了实时交互与跨模态融合的未来趋势,为开发者提供从理论到实践的完整参考方案。

AI Agent 推理架构主要包含 ReAct 与 Plan-and-Execute 两种模式。ReAct 交替思考与行动,适合简单任务但缺乏全局视野且上下文成本高;Plan-and-Execute 先规划后执行,具备全局视角、成本可控及可审计优势,但可能过度设计简单任务。建议采用混合架构,以 Plan-and-Execute 管理全局流程,Executor…

PentAGI 是基于大语言模型的自动化渗透测试工具。本文介绍如何在 Ubuntu 22.04 环境下通过 Docker 快速部署 PentAGI。主要步骤包括准备 API 密钥、配置 Docker 镜像加速、修改容器端口监听地址以及启动服务。部署完成后,可通过浏览器访问 Web 界面进行安全测试。注意使用需获得授权,仅限合规研究。
AI 代理工具正从对话转向执行操作。梳理了 Claude Code、Cowork、OpenCode、OpenWork、OpenClaw 及 Codex 六大项目,分析其定位差异与适用场景。它们分别覆盖终端命令行、桌面图形界面、开源模型无关方案及操作系统级控制。通过对比目标用户与技术理念,指出未来工作模式将转变为指挥 AI 团队而非单纯编码。开发者需关注如何组…

OpenClaw 作为具备高权限的 AI 工具,安全部署是核心前提。提供阿里云一键部署、Docker 容器隔离及本地安全安装三套方案,详解阿里云百炼 Coding Plan API 接入流程。内容覆盖环境准备、分步实操、安全加固与问题排查,旨在帮助读者零基础搭建安全隔离的 AI 助理,兼顾实用性与安全性,实现低成本稳定运行。

本文演示了如何使用科大讯飞星辰 RPA 与 Agent 平台搭建小红书自动发文机器人。内容涵盖服务端与客户端的 Docker 部署配置、账号登录认证、以及通过可视化编排实现网页元素拾取、笔记生成与发布的完整流程。同时展示了 Astron Agent 智能体的快速生成方法,为业务自动化提供零代码解决方案。

北斗导航抗干扰算法采用 FPGA 实现,涵盖空域滤波与空时联合处理两种方案。通过 MATLAB 仿真验证算法有效性后,在 FPGA 端落地数字下变频、权值计算及数据加权模块。实验对比了基于 NIOS II 软核与 Verilog 逻辑两种实现路径,利用 Cyclone III 和 Cyclone V 系列芯片搭建硬件平台。实测数据显示,空域算法权值更新仅需…

Spatial Joy 2025 AR&AI 全球开发大赛提供高额奖金与硬件支持,设应用游戏及智能体双赛道。参赛者需原创适配 Rokid 设备,官方提供算力与 SDK 资源。适合希望积累空间计算经验或展示技术视野的开发者,获奖履历在行业内认可度高。

SpringAI 结合 Deepseek 大模型的应用开发实践涵盖了对话机器人基础、会话记忆管理、Function Calling 智能客服构建及 RAG 检索增强生成技术。内容涉及 ChatClient 配置、ChatMemory 存储策略(内存与数据库)、Tool 定义与提示词工程,并探讨向量数据库(Redis)在知识库检索中的应用及潜在问题。适合希望深…
前端安全涉及输入验证、API 调用及依赖管理。常见风险包括 XSS 攻击、敏感信息明文存储及第三方库漏洞。解决方案涵盖使用 textContent 替代 innerHTML、强制 HTTPS 传输、实施内容安全策略 CSP 以及添加 CSRF Token。定期更新依赖并执行安全审计是保障系统稳定的关键措施。

AI 幻觉指大语言模型生成看似合理但事实错误的内容。成因包括数据污染、知识截止、模型不知其不知及自回归机制。高危场景涉及医疗法律金融,需通过 RAG、RLHF、工具调用及人工核实降低风险。推理模型与不确定性校准有助于改善表现,但无法彻底消除。用户应保持信任但核实的态度。

十款国产主流 AI 大模型工具,涵盖 DeepSeek、Kimi、文心一言、通义千问等。各工具在逻辑推理、长文档处理、研究报告生成、微信集成及办公自动化等方面各有侧重。DeepSeek 适合复杂逻辑对话,Kimi 擅长长文本分析,秘塔 AI 专注于研报生成,元宝集成于微信生态,天工 AI 强化办公场景。用户可根据具体需求选择合适工具,注意部分工具存在幻觉风险…

Web 安全学习需先理清前后端交互与 API 契约,明确后端是安全防线核心。文章系统梳理了 SQL 注入、XSS、CSRF、SSRF 等常见漏洞原理及绕过方式,重点解析了 PHP 环境下的 CTF 实战技巧,包括弱类型比较、伪协议利用及命令执行绕过。强调攻击者可绕过前端直接构造请求,因此后端必须实施严格的身份认证、授权校验与参数过滤,建立纵深防御体系。

医疗连续体机器人模块化控制界面设计涉及软件环境搭建、手眼协调校准及性能测试。采用 Ubuntu 集成 RT_PREEMPT 内核保障实时性,结合 ZeroMQ 通信协议降低延迟。通过动作捕捉系统验证轨迹跟踪精度,设定 CPU 占用率与内存泄漏等稳定性指标。实验验证了系统在狭小解剖环境中的高精度运动控制能力,满足手术操作同步需求。
OpenClaw 标志着 AI Agent 从玩具迈向基础设施,通过 MCP 协议实现工具链标准化与记忆机制融合。项目支持本地 Docker 与云原生部署,在移动端 DevOps、多智能体协作及物理交互场景展现高价值。面对商标争议与生态分叉,社区展现出反脆弱性。在中国市场,网络环境与 API 适配成为落地关键。开发者需从 CRUD 转向编排能力,重视沙箱安全…

Redis 作为高性能内存数据库支持多种数据结构,包括字符串、哈希、列表、集合及有序集合等。文章详细阐述了各结构的特点与应用场景,并深入讲解了基于 Redis 的分布式锁实现方案,涵盖 SETNX 基本用法、带过期时间的 SET 命令改进版以及 Redlock 集群算法。同时提供了最佳实践建议,如设置合理超时、使用唯一标识、处理时钟漂移等问题,帮助开发者在分…