
Claude Code 与 OpenClaw 源码解析及高级应用实战
Claude Code 安装配置、VSCode 集成、子代理(Subagent)、技能(Skill)与插件机制,以及 Agent Teams 协作模式。同时涵盖 OpenClaw 源码结构、Remotion 视频自动化框架及财报自动化等应用场景。内容包含命令行操作、权限管理、上下文优化及高质量提问技巧,适合开发者深入掌握 AI 编程辅助工具。
博客作者
心如止水
350
已发布文章
11K
博客获赞
690K
博客浏览
第 4 页

Claude Code 安装配置、VSCode 集成、子代理(Subagent)、技能(Skill)与插件机制,以及 Agent Teams 协作模式。同时涵盖 OpenClaw 源码结构、Remotion 视频自动化框架及财报自动化等应用场景。内容包含命令行操作、权限管理、上下文优化及高质量提问技巧,适合开发者深入掌握 AI 编程辅助工具。
OmniXtreme 提出两阶段框架解决人形机器人高动态控制通用性壁垒。第一阶段基于流匹配的可扩展预训练,通过专家策略蒸馏规避梯度干扰;第二阶段采用驱动感知的残差 RL 后训练,弥合仿真与现实差距。实验表明该方法在多样化极端动作跟踪保真度上显著优于基线,成功打破保真度与可扩展性的权衡困境,并在真实机器人上实现了空翻等高难度动作的鲁棒执行。

2025 年 AI 行业回顾,以 DeepSeek R1 开源推动推理模型民主化,至 Manus 被 Meta 收购验证 Agent 商业化潜力。技术范式从预测下一个词转向 System 2 思考,Scaling Law 在推理侧确立,氛围编程成为现实。生态方面多模态模型竞争激烈,2026 年预计向多模态 Agent 闭环及盈利时代迈进。
介绍如何在 Python 中适配国产大模型 DeepSeek。内容包括通过 OpenAI 兼容接口快速切换云端 API,以及使用 Ollama 进行本地私有化部署。此外,还探讨了云端推理结合本地检索的混合架构,并提供了关于提示词优化、速率限制处理和显存管理的避坑指南,帮助开发者实现安全可控的 AI 应用集成。
介绍 Fish Speech 1.5 文本转语音模型的镜像部署方案。该方案预装 Xinference 推理引擎与 WebUI 界面,无需手动配置环境即可启动服务。内容涵盖模型能力介绍、三步启动流程、日志验证方法以及文本优化技巧,旨在帮助用户快速实现零门槛的语音合成应用。
文章总结了 2026 年 Web 前端开发的八大趋势,涵盖 AI 优先开发流程、元框架成为默认起点、TypeScript 与全栈类型安全标配、TanStack 工具链主导、边缘计算与 WebAssembly 提升性能、组件化与设计系统强制要求、现代 CSS 复兴以及框架多元化格局。核心观点是前端角色从单纯写代码转向架构设计与 AI 协作,强调性能、无障碍及…

大模型时代人形机器人的感知体系升级,重点阐述了视觉 - 语言模型(VLM)的核心作用。内容涵盖 CLIP、BLIP、Flamingo 等模型的演进与分工,解析了文本与视觉的语义对齐机制,包括统一嵌入空间构建、对比学习及跨模态注意力。此外,还探讨了基于语言的视觉任务控制(VIF),展示了如何通过语言指令驱动视觉感知与行动决策,实现机器人在复杂场景中的理解与执行…
Android 端 WebRTC 集成的实战指南。分析了 API 碎片化、硬件兼容性、ICE 协商等痛点。对比了原生库与第三方框架(如 LiveKit)的优劣。详细阐述了基础环境配置、PeerConnection 建立流程及视频渲染优化。提供了视频参数黄金组合表、硬件编码注意事项及生产环境避坑指南(内存泄漏、TURN 策略、OPUS 静音问题)。最后探讨了…
PRIDE-PPPAR 是武汉大学研发的开源多 GNSS 处理软件,专注于 PPP 模糊度快速解算。详述了基于 Linux/macOS 环境的安装流程,包括依赖库安装、源码编译、环境变量配置及测试验证。内容涵盖核心特性、配置文件调整、常见问题排查及高级设置,适用于科研与专业高精度定位应用。

MCP 是模型上下文协议,用于统一 LLM 与外部工具的通信。介绍如何在 VSCode 中安装 Copilot MCP 扩展,通过 Process 或 SSE 方式添加 Server,并使用 @mcp 指令调用工具读取文件等内容。
探讨了前端国际化的重要性及常见误区,指出硬编码和简单替换无法处理复数、日期货币格式等问题。推荐使用 i18next 库配合 React Hooks 进行多语言管理,利用 Intl API 处理本地化格式化。文章提供了配置示例、复数规则、RTL 支持及文件分离命名空间等最佳实践,强调根据实际需求把握国际化范围以提升用户体验而非炫技。
介绍如何在云端部署 Openclaw 并结合飞书实现多机器人配置。主要步骤包括准备基础环境、创建多个飞书企业自建应用以获取凭证、启动 Openclaw 服务并创建对应 Agent、通过配置菜单绑定飞书渠道与 Agent、设置事件订阅及测试验证。最终实现不同机器人分工协作,如办公助手、资讯推送等场景,提升自动化效率。
分享了在维护大型存量项目时,利用 GitHub Copilot 的 Plan Mode 配合多模型路由策略(架构师 GPT-5.3-Codex 规划 + 工匠 Claude 实现)的最佳实践。通过交互式确认计划减少幻觉,解决了传统 Ask+Agent 模式缺乏最终确认的问题。实战案例展示了基于 Spring Boot + DDD 架构的动态 Server 改…

梳理了 AI 大模型应用开发的四阶段学习路线。筑基篇涵盖 Python、Linux、数学及机器学习深度学习基础;进阶篇深入 NLP、Transformer 架构及预训练模型原理;实战篇介绍 Hugging Face、LangChain 等工具链与向量数据库;精进篇涉及模型量化、部署优化及前沿探索。文章强调动手实践,推荐通过 RAG 系统、智能助手等项目巩固技…

系统梳理了 Web 自动化测试中的核心函数与实战技巧,涵盖元素定位(cssSelector、xpath)、测试对象操作(点击、输入、获取文本)、窗口与弹窗控制(句柄切换、Alert 接口)、等待机制(强制、隐式、显示等待)以及浏览器参数设置(无头模式、加载策略)。文章通过 Python Selenium 代码示例,演示了如何解决元素找不到、操作时序错乱、窗口…

GitHub Copilot 提供 Plan 和 Agent 两种模式。Plan 模式先分析代码库并生成执行计划,经用户确认后才修改代码;Agent 模式则自主判断并直接修改。Plan 适合多文件重构、架构调整等复杂任务,便于追溯和审阅;Agent 适合单文件快速修复或探索性任务。Plan 模式依赖清晰的任务描述,且规划结果仍需人工验证,本质是将控制权交还给…
探讨了利用 AI 技术辅助解析加密字符串(如 Base64、Hex 等)的方法。分析了编码多样性带来的挑战及 AI 在模式识别和效率上的优势。介绍了构建解码工具的开发思路,包括特征库建立、检测模块实现及 Web 界面搭建。同时强调了安全性、性能优化及错误处理等实际注意事项,并展望了引入深度学习支持更多加密算法的未来方向。

前后端分离架构下基于 JWT 的无感 Token 刷新机制。通过 Access Token 短效与 Refresh Token 长效结合,解决用户频繁登录问题。前端使用 Axios 拦截器捕获 401 错误自动调用刷新接口并重试请求;后端利用 Spring Boot、Redis 存储 Refresh Token 并校验,确保安全性。实现了双 Token 机制…
whisper.cpp 在 Windows、Linux、macOS 及 Android 平台的部署流程。涵盖环境搭建、模型下载与量化选择、性能优化及常见问题诊断。支持本地离线语音识别,提供编译安装步骤与监控维护建议,适用于个人使用或企业级应用。
介绍基于 ESP32-S3 芯片的语音对话机器人'小智'的开发教程。涵盖硬件选型、软件环境搭建(ESP-IDF)、本地语音唤醒(ESP-SR WakeNet)、流式音频传输(WebSocket)以及云端大模型接入(SenseVoice ASR + DeepSeek/Qwen LLM)。通过 ESP32 端采集音频并上传至服务器,服务器进行语音识别与文本生成后…