
cann-recipes-train 仓库深度解读:昇腾平台下 DeepSeek-R1 与 Qwen2.5 强化学习训练优化实践
cann-recipes-train 仓库深度解读:昇腾平台下 DeepSeek-R1 与 Qwen2.5 强化学习训练优化实践 前言 > 自 DeepSeek-R1 发布以来,大模型的强化学习(RL)训练掀起了新一轮的技术热潮。各大厂商与开源社区纷纷投入实践,持续探索更高效的 RL 训练体系。将基于 cann-recipes-train 仓库,解读两个实践…
博客作者
Spark计算专家
351
已发布文章
9.3K
博客获赞
653K
博客浏览
第 3 页

cann-recipes-train 仓库深度解读:昇腾平台下 DeepSeek-R1 与 Qwen2.5 强化学习训练优化实践 前言 > 自 DeepSeek-R1 发布以来,大模型的强化学习(RL)训练掀起了新一轮的技术热潮。各大厂商与开源社区纷纷投入实践,持续探索更高效的 RL 训练体系。将基于 cann-recipes-train 仓库,解读两个实践…

AI 自动化数据标注平台架构与关键技术实现 !AI 自动化数据标注平台架构图 文章目录 自动化数据标注的重要性 自动化数据标注平台架构 关键技术实现 3.1 主动学习与半监督学习 3.2 预标注技术 平台核心功能模块 4.1 智能标注辅助 4.2 质量控制机制 4.3 项目管理与协作 实际应用案例 5.1 目标检测项目自动化 性能优化策略 6.1 分布式处理…

一、全球老龄化态势与护理需求激增 1.1 人口结构剧变下的养老挑战 当前,全球人口结构正经历着深刻变革,老龄化浪潮汹涌来袭。世界卫生组织数据清晰地勾勒出未来的图景:到 2050 年,全球 60 岁以上人口预计将飙升至 21 亿,老龄化率一举突破 25%。这一趋势在部分国家尤为显著,日本、韩国、德国等已深陷超深度老龄化的泥沼,养老问题成为社会发展的沉重负担。…

> 'Work Smart, Not Hard'——在这个 AI 爆发的时代,WorkBuddy 作为腾讯出品的 AI 原生桌面智能体工作台,正在重新定义我们与电脑交互的方式。它不是简单的 AI 聊天机器人,而是一个真正能'干活'的智能助手。 前言:从'用电脑'到'指挥电脑' 想象一下这样的工作场景: 你坐在电脑前,面对一堆杂乱的文件、表格、发票需要整理,原…
前端错误处理最佳实践 引言 错误处理?听起来就像是前端工程师为了显得自己很专业而特意搞的一套复杂流程。你以为随便加个 try-catch 就能解决所有错误?别做梦了!到时候你会发现,错误处理的代码比业务代码还多,维护起来比业务代码还麻烦。 你以为 console.error 就能记录所有错误?别天真了!console.error 只会在控制台打印错误,用户根…

介绍如何利用 KSWEB 和 Termux 在旧安卓手机上搭建 Typecho 博客环境,并通过 cpolar 内网穿透实现公网访问。步骤包括安装配置 KSWEB 启用 PHP/Apache/MySQL,部署 Typecho 源码,设置数据库,以及通过 Termux 安装 cpolar 客户端创建隧道。最终实现无需公网 IP 即可安全访问本地博客,适合预算有…

如何使用 AI 工具制定系统化的学习计划,涵盖从数学基础、经典机器学习、深度学习到大模型、AI 工程化及边缘 AI 的七个阶段。内容强调实战技能,提供具体的技术栈、练习项目及时间规划建议,旨在帮助读者从零开始构建 AI 能力并产出可展示的作品集。

OpenClaw AI 框架接入企业微信的完整方案,包含 API 模式机器人和自建应用两种路径。内容覆盖前置准备、核心接入流程、生产环境部署优化及常见问题排查。通过私有化部署保障数据安全,实现智能问答、流程自动化等企业级能力落地,有效提升办公效率。

图数据库的基本概念、核心思想及应用场景,详细阐述了 Neo4j 图数据库的特点、功能及数据模型,并涵盖了基于 Docker 的搭建过程以及 Neo4j 的技术使用详解,包括数据准备、操作命令、查询语法、索引操作等内容,为开发者提供从搭建到项目使用的深度指导。
介绍使用 Ollama 在本地部署 Llama-3.2-3B 大模型的完整流程。涵盖跨平台安装步骤、模型拉取与管理、REST API 调用及 Python 集成示例。内容包含提示词优化技巧、性能实测数据及常见问题排查指南,旨在帮助开发者以低资源消耗实现高效本地 AI 应用。

一款基于 STM32F103C8T6 主控的智能家居环境监测系统。系统集成了 DHT11 温湿度、MQ 系列气体传感器及光照检测模块,通过 OLED 屏幕显示数据。利用 ESP8266 WiFi 模块接入机智云云平台,支持手机 App 远程监控与控制。具备手动与自动两种模式,可根据环境阈值自动触发报警、开窗通风或照明控制。文章展示了硬件原理图、PCB 设计及…

介绍基于 Protege 和 Neo4j 构建教育领域知识图谱的完整流程。内容包括工具安装配置、OWL 文件转换为 Turtle 格式、导入 Neo4j 数据库、使用 APOC 导出 JSON 数据。随后通过 Python 脚本清洗数据以适配 ECharts 格式,最后结合 Vue 实现前端可视化展示。文中提供了具体的 Cypher 查询命令及数据处理代码示…
阅读了 LLaMA 论文,介绍了首个完全开源且效果媲美闭源的大语言模型。该系列模型参数量从 7B 到 65B,使用 1.4 万亿 tokens 的纯开源数据训练。核心优化包括 RMSNorm 预归一化、SwiGLU 激活函数和 RoPE 位置编码。实验表明 13B 模型优于 GPT-3,65B 模型达到当时最佳水平。此外还涵盖了预训练数据构成、架构细节、优化…

GitHub Copilot 在 VSCode 中的安装与配置方法。作为人工智能协作编程工具,它通过插件形式提供即时代码建议和对话式辅助。用户需登录 GitHub 账号,注意网络环境要求。主要功能包括代码补全和聊天会话,当前提供免费额度但有使用限制。

对 ComfyUI Mixlab 插件中 Whisper.available False 报错提供解决方案。问题根源在于代码未处理模型目录缺失导致的异常,以及模型文件结构不符合要求。通过修改 __init__.py 增强日志输出定位问题,在 Whisper.py 中添加目录自动创建逻辑,并手动创建 models/whisper 目录及放置包含 config.…

AI Coding 是基于大型语言模型的新型编程方式,要求开发者掌握模型边界感知、上下文工程等技能。文章介绍了从辅助编码向代理编程的转变,详细阐述了任务拆解策略、上下文金字塔构建及结构化提示词模板。此外,还涵盖了需求澄清、调试协议、版本控制及工程化实践(如 MCP 架构、Wiki 管理),旨在帮助开发者建立高效、可控的 AI 辅助开发工作流,避免幻觉与上下文…
介绍 ComfyUI Manager,一款用于 ComfyUI 生态的核心管理工具。它提供插件管理、模型配置和环境优化功能,支持一键安装、依赖自动处理及环境快照备份。文章涵盖系统兼容性检查、Windows/Linux/macOS 安装路径选择、插件与模型资源中心使用、常见问题排查及安全策略定制等内容,旨在帮助创作者降低技术门槛,提升 AI 绘画工作流效率。
介绍在 ROS2 框架下配置 Unitree Go2 四足机器人的完整流程。涵盖开发环境搭建、传感器集成、避障算法实现及楼梯攀爬模式配置。通过 Nav2 导航栈实现自主导航与 SLAM 地图构建,并提供多机器人协作方案及故障排查建议。旨在帮助开发者利用现有 SDK 实现高级运动控制功能,确保系统稳定可靠。
如何利用 AI 工具辅助进行 imToken 生态下的智能合约交互开发与监控脚本编写。通过描述需求,AI 可生成基于 ethers.js 的代币交互代码及基于 Python 的大额转账监控脚本,并自动添加安全注释。文章总结了提升 AI 开发效率的技巧,如明确功能模块、定义输入输出格式等,并强调了检查合约地址、测试环境验证及安全权限控制等注意事项。该工作流能显…
解析了 AI 开发领域的五个核心概念。Vibe Coding 指用自然语言描述需求让 AI 生成代码;AI Agent 是具备目标导向、自主规划和工具使用能力的智能体;提示词(Prompt)是决定 AI 输出质量的指令;MCP 协议解决模型记忆与外部信息接入问题;Skills 则是扩展 AI 操作现实世界能力的工具包。理解这些概念有助于掌握下一代 AI 开发…