
DeepSeek R1 在 RK3588 上的 RKLLM 转换与 Web 部署流程
在瑞芯微 RK3588 开发板上部署 DeepSeek R1 7B 大模型的完整流程。内容包括升级 NPU 驱动至 0.9.8 版本,在 x86 环境下将 Hugging Face 的 safetensors 权重转换为 RKLLM 格式,通过 C++ 或 Python 脚本在板端进行推理,以及集成 Gradio 实现局域网 Web 访问。文章提供了具体的代…
博客作者
容器化爱好者
346
已发布文章
10K
博客获赞
680K
博客浏览
第 5 页

在瑞芯微 RK3588 开发板上部署 DeepSeek R1 7B 大模型的完整流程。内容包括升级 NPU 驱动至 0.9.8 版本,在 x86 环境下将 Hugging Face 的 safetensors 权重转换为 RKLLM 格式,通过 C++ 或 Python 脚本在板端进行推理,以及集成 Gradio 实现局域网 Web 访问。文章提供了具体的代…
在 Visual Studio Code 中禁用 GitHub Copilot 代码补全功能的方法。用户只需点击右下角 Copilot 图标并关闭 Inline Suggestions 选项即可。操作后图标状态会改变,若遇补全失效可优先检查该设置。
如何在有限显存的消费级显卡上使用 LLaMA Factory 框架结合 QLoRA 技术微调 70B 大语言模型。内容涵盖环境准备、命令行启动微调、显存优化策略(如 4-bit 量化、梯度累积)、自定义数据集格式及常见问题解决方案。通过合理配置参数,可有效降低硬件门槛并实现模型微调。

综述了次模函数(Submodular Function)在机器学习和人工智能中的应用。核心概念是边际收益递减(Diminishing Returns),即集合中新增元素的贡献随集合增大而减小。它被视为离散优化中的凸函数,具有理论上的近似最优保证(如贪心算法可达 1-1/e)。主要应用于特征选择、数据集压缩、文本摘要、主动学习等离散优化问题,帮助在指数级搜索空…
Akagi 是一款专为雀魂游戏设计的智能助手,通过实时捕获数据流并利用 AI 模型提供决策建议。其核心功能、Windows 与 macOS 安装步骤、关键配置参数、网络代理设置及实战操作流程。同时提供了安全使用建议和性能优化方案,帮助用户提升麻将技能并理解对局表现。

Cursor 近日推出 Automations 功能,允许 AI Agent 全天候自动评审、监控和修复代码。该功能利用云端 Agent 驱动构建测试,支持定时或事件触发(如 Slack、GitHub PR)。内部已应用安全审查、智能责任人分配及事件响应等场景。虽然能提升效率,但开发者对自主 Agent 合并代码的安全责任边界表示担忧。
将 Llama-3 模型接入 verl 框架进行强化学习后训练的完整流程。内容包括环境安装与依赖配置,针对 Llama-3 的 tokenizer 和 chat template 处理,基于 GRPO 算法的训练脚本配置,自定义奖励函数实现以控制生成质量,以及常见问题的排查方案如 OOM 和生成循环。最后提供了将 verl 分布式 checkpoint 转换…

OpenClaw 是一款开源的本地优先 AI 智能体框架,支持通过自然语言指令执行电脑操作任务。其核心定位、隐私保护特性及多模型兼容性。内容涵盖本地与云端部署步骤、常用指令与场景实操、核心架构解析(网关、路由、智能体循环等)以及自定义技能与安全优化建议。适合希望实现自动化办公或进行二次开发的开发者参考。
介绍 Next Scene Qwen Image LoRA 模型在 AIGC 镜头控制中的应用。内容涵盖环境配置(Python 3.10+、PyTorch 2.0+、ComfyUI)、模型安装步骤及提示词模板。详细解析了平移、旋转、变焦等基础镜头运动类型的参数设置建议,并提供了广告设计、游戏开发等应用场景。通过调整 LoRA 权重强度与组合控制技巧,可实现专…
介绍前端国际化最佳实践,对比硬编码字符串与使用专业库(如 i18next)的差异。方案涵盖翻译资源统一管理、参数化翻译、浏览器语言自动检测、日期时间数字货币本地化及 RTL 语言支持。通过规范化的 i18n 配置和组件封装,提升多语言用户体验,为业务全球化做准备。
OpenClaw(前身为 Clawdbot/Moltbot)发布 v2026.3.1 及 v2026.2.26 版本更新。主要特性包括外部密钥管理、线程绑定 Agent、Android 深度集成以及优先采用 WebSocket 传输。该工具旨在将本地 AI 助手从概念转化为实际可用的常驻应用。

介绍 Stable Diffusion 3.5 在低显存环境下的运行方案。通过 FP8 量化降低模型占用,利用 CPU Offloading 处理 T5-XXL 编码器瓶颈,并优化系统虚拟内存设置。提供结合 4-bit 量化与 NF4 精度的 Python 代码示例,帮助 8GB-12GB 显存用户实现大模型生成。

NWPU VHR-10 是包含 10 类地理空间目标的遥感数据集,共 650 张高分辨率图像。数据集结构、类别统计及标注格式(YOLO/COCO),并提供了基于 YOLOv8 的完整训练、推理及模型导出代码示例,涵盖配置优化与小目标检测策略。

介绍 Flutter 库 llm_json_stream 在鸿蒙系统的适配方法。该库用于解决大模型流式输出中 JSON 结构不完整的问题,通过状态机实时还原数据结构。文章涵盖原理分析、安装配置、核心 API 使用及代码示例,并讨论了内存优化和异常处理策略,适用于构建实时 AI 交互应用。

基于 EasyDSS 平台的无人机 RTMP 高清直播技术方案。重点分析了 RTMP 协议的低延迟优化(2-5 秒)、H.265 高效编码带来的画质与带宽平衡,以及多格式转码(HLS/FLV)实现的跨终端适配能力。该方案解决了传统无人机直播的痛点,支持 API 集成与权限管控,适用于应急调度、巡检安防等多场景。

预训练语言模型的发展及核心思想,详细解析了 BERT 模型的架构与预训练任务(MLM、NSP)。通过 Hugging Face Transformers 库,演示了基于 BERT-base-chinese 的中文文本分类实战流程,包括数据集加载、分词预处理、模型搭建、微调训练及推理预测。文章还总结了 BERT 优化技巧及改进模型方向,为开发者提供了从理论到实…

详细解析了 FPGA 内部的五大核心硬件资源:LUT、FF、BRAM、DSP 和 PLL。LUT 用于实现组合逻辑,FF 用于存储状态,BRAM 提供大容量片内存储,DSP 专用于乘加运算,PLL 负责时钟管理。文章还介绍了如何编写代码以正确推断这些资源,以及如何解读 Vivado 综合报告中的资源使用率,帮助开发者优化设计避免时序问题。
在 Windows 10 系统中关闭 Microsoft 365 Copilot 频繁弹窗的六种方法。包括任务栏临时隐藏、组策略彻底禁用、注册表修改、Office 应用内单独关闭、PowerShell 命令设置以及完全卸载 Copilot。普通用户推荐使用组策略方式,技术用户可选择注册表或 PowerShell。根据实际需求选择合适方案即可有效解决干扰问题。

针对 HarmonyOS NEXT 系统升级后 WebView 无法调用相机拍照的问题,分析了隐私安全策略变更导致 H5 文件选择需宿主拦截的原因。尝试了现成壳子、反编译、JS 绕过等方案均失败。最终采用 ArkTS 编写原生 WebView 套壳应用,实现了文件上传(相机 + 相册)、权限申请及沉浸式体验等功能,解决了现场拍照上传的业务需求。

介绍 OpenClaw 自动化 Agent 的完整部署流程。涵盖云服务器选型、大模型 API 接入、基于 Node.js 的环境安装、网络工具配置(搜索、网页抓取、浏览器)、文件同步方案及个性化设置。通过斜杠命令管理任务状态,利用多群组隔离记忆,并强调让 AI 自主配置的重要性,旨在打造可独立工作的远程 AI 员工。