灭霸的博客文章 | 极客日志

Python

EgoPoseFormer v2：AR/VR 场景中的第一视角人体动捕技术

前言第一视角人体动捕（Egocentric Motion Capture）是 AR/VR 的关键技术，但面临视角受限、严重自遮挡以及 3D 标注数据稀缺等难题。重点解析 EgoPoseFormer v2 (EPFv2) 及其相关技术对比。一、EgoPoseFormer v2 **论文链接**：https://arxiv.org/abs/2603.0409…

发布于 2026/4/698K 浏览588 点赞

Python

开源 ROS 智能割草机器人：硬件选型、软件架构与部署指南

开源 ROS 智能割草机器人：硬件选型、软件架构与部署指南基于开源 ROS 项目的智能割草机器人，是解决家庭草坪维护痛点的创新方案。它不仅提供了低成本的家庭草坪维护方案，更通过自主导航割草技术，让庭院自动化变得触手可及。庭院维护的 3 大核心难题现代家庭在庭院维护中面临着诸多挑战，这些问题不仅耗费时间精力，还常常成为家庭生活质量的隐形负担。 **时间成…

发布于 2026/4/612K 浏览968 点赞

PythonSaaSWeChat

企业微信外部群 Webhook 配置与消息发送指南

在企业微信的自动化体系中，**群机器人（Webhook）** 是实现系统消息自动同步到外部群最快捷、门槛最低的工具。虽然 2026 年官方对外部群机器人的管理更加精细化，但只要掌握正确的配置流程和调用逻辑，它依然是效率提升的神器。以下是完整的实操步骤：第一步：获取 Webhook 地址 **添加机器人：** 打开企业微信电脑端，进入你需要配置的外部群，点…

发布于 2026/4/658K 浏览20 点赞

编程语言PPT制作AI大前端java算法

实测 Gemini Pro：谷歌多模态 AI 的实际应用能力

前言： > AI 圈的迭代速度，永远超出我们的预期。就在半年前，我们还在讨论 ChatGPT 的迭代升级、国产大模型的扎堆亮相，以为行业会进入一段平稳的沉淀期。没想到谷歌突然甩出重磅炸弹——Gemini Pro 正式开放公测，凭借'原生多模态'的核心优势，一上线就霸占科技热搜，成为 AI 爱好者和职场人的新宠。 > 作为常年折腾各类 AI 工具的博主，我第一…

发布于 2026/4/669K 浏览758 点赞

PythonAI算法

Python AI 入门：从 Hello World 到图像分类

Python AI 入门：从 Hello World 到图像分类一、Python AI 的 Hello World 1.1 环境搭建首先，我们需要搭建 Python AI 的开发环境： 1.2 第一个 AI 程序让我们来编写一个最简单的 AI 程序 - 线性回归：二、从线性回归到神经网络 2.1 神经网络基础线性回归是最简单的 AI 模型，而神经网…

发布于 2026/4/683K 浏览298 点赞

PythonAI算法

从 SEO 到 GEO：315 晚会曝光的 AI 投毒黑产及技术防御

事件回顾：当 315 晚会遇上 AI 安全 1.1 晚会曝光核心内容 2026 年 3 月 15 日晚，央视 315 晚会曝光了一条针对 AI 大模型的灰色产业链——GEO（Generative Engine Optimization，生成式引擎优化）黑产。 **攻击流程极简版：** 虚构一款不存在的产品（如"Apollo-9 智能手环" 用 AI 批量生成…

发布于 2026/4/695K 浏览626 点赞

编程语言AI算法

GPT、LLaMA 与 MOE：自回归模型与混合专家架构演进

对比了自回归模型（如 GPT、LLaMA）与掩码模型（如 BERT）的训练目标与适用场景，详解了 LLaMA 在归一化、激活函数及位置编码上的设计选择，并阐述了混合专家（MOE）架构中路由与专家的权衡机制。文章提供了工程选型建议，指出生成任务应选解码器架构，表示任务应选编码器或嵌入模型，同时提醒 MOE 部署需关注路由负载均衡与带宽消耗，避免常见误区。

发布于 2026/4/640 浏览6 点赞

编程语言AI

使用 LiteLLM 接入 GitHub Copilot Chat API 低成本运行 Claude Code

介绍如何通过 LiteLLM 本地代理，将 Claude Code 接入 GitHub Copilot Chat API。旨在利用现有 Copilot 订阅额度降低 Anthropic API 成本，并解决网络不稳定问题。步骤包括创建 LiteLLM 配置文件、安装启动代理、配置环境变量及验证连接。需注意此方案非官方推荐，使用前应评估合规风险。

发布于 2026/4/634 浏览2 点赞

编程语言SaaSAI

Copilot Chat 功能介绍与使用指南

Microsoft Copilot Chat 的功能与使用方法。该工具面向拥有 Microsoft 365 标准版及以上许可的用户免费提供，具备企业级数据安全特性，不用于模型训练。支持多端访问及文档处理。文章详细说明了登录步骤、提示词编写技巧及智能体自动化功能，帮助用户通过精准指令、验证来源和优化对话来提升工作效率。此外，还介绍了现成模板与自定义智能体的应用…

发布于 2026/4/639 浏览4 点赞

Python

Discord 机器人创建与配置流程

在 Discord 开发者门户创建应用及 Bot 用户的完整流程。内容包括新建应用、添加 Bot 用户、开启必要的特权网关意图（如消息内容意图）、获取并安全保存 Bot Token、通过 OAuth2 生成邀请链接并将 Bot 加入服务器。此外，还涵盖了服务器权限配置、频道 ID 获取方法、Token 安全管理建议以及常见错误排查方案。

发布于 2026/4/634 浏览4 点赞

PythonAI

基于 OpenClaw 的多机器人协作团队构建

介绍如何在已有 OpenClaw 服务基础上，通过创建多个飞书应用并配置不同的 Channel 账号，实现多机器人分工协作。主要步骤包括新建飞书应用、备份并修改 openclaw.json 配置文件、开启长连接订阅、授予必要权限以及配对测试。最终实现不同机器人处理不同任务（如脚本生成与资讯获取），避免单机器人上下文限制导致的遗忘问题。

发布于 2026/4/633 浏览2 点赞

编程语言SaaSAI算法

Palantir 大模型平台解析：从本体论到企业 AI 决策实战

Palantir 平台通过 Ontology（本体）整合数据、逻辑与行为，实现企业级 AI 实时决策。其核心能力包括多源异构数据整合、业务规则定义及人机协同闭环。平台支持模拟功能以评估决策影响，为知识图谱与大模型应用提供可参考范式，助力组织提升决策质量与效率。

发布于 2026/4/647 浏览6 点赞

JavaScriptNode.jsAI

基于腾讯混元多模态 AI 的智能视频分析与创作助手

介绍基于腾讯混元多模态 AI 构建的智能视频分析与创作助手。通过 MCP 协议连接开发环境与 API，实现从视频到脚本的自动化生成。系统支持对象识别、镜头语言分析及情感倾向判断，可输出包含分镜、台词及制作要点的详细脚本。项目采用 Node.js 环境，提供开源配置示例，旨在提升短视频创作效率。

发布于 2026/4/643 浏览8 点赞

编程语言AI算法

OpenClaw 实战：持久记忆与 RAG 知识库构建

介绍 OpenClaw 的持久记忆与 RAG 知识库构建方案，解决 AI 会话结束后信息丢失的问题。文章阐述了记忆与上下文的区别，提出了 OpenClaw 的文件即真理设计哲学，并介绍了长期精炼记忆、日常日志和归档记忆的三层架构概念，旨在帮助开发者构建真正懂用户的智能助理。

发布于 2026/4/633 浏览2 点赞

JavaAIjava

基于 AI 辅助的 Java 零基础入门与基础实战指南

介绍如何利用 AI 工具（如通义灵码、DeepSeek）辅助学习 Java。内容涵盖开发环境搭建（IDEA、VS Code、JDK 配置）、Java 基础语法（变量、常量、运算符、流程控制）、数组操作及面向对象编程核心概念（类、对象、封装、继承、多态）。通过计算器、猜数字游戏等实战案例，展示如何借助 AI 生成代码并理解原理，适合零基础初学者快速入门。

发布于 2026/4/632 浏览3 点赞

编程语言AI

VS Code 集成 GitHub Copilot 配置与实战指南

在 Visual Studio Code 中安装和配置 GitHub Copilot 的详细步骤。内容涵盖扩展安装、账号认证、网络代理注意事项以及核心设置项（如内联建议触发、延迟、上下文大小）的调优。通过合理配置，可有效减少干扰并提升编码协作效率。

发布于 2026/4/634 浏览1 点赞

Shell / BashAI

OpenClaw 浏览器控制：Chrome Debug 模式配置指南

介绍如何通过 Chrome Debug 模式配置 OpenClaw 浏览器控制。通过创建独立数据目录并复制登录信息，解决 AI 助手每次需重新登录及手动点击插件的问题。配置后，AI 可自动连接调试端口，保留登录状态，实现无需人工干预的浏览器自动化操作。

发布于 2026/4/634 浏览5 点赞

MATLAB / Octave算法

无人机 PID 调参指南：参数分析与优化方法

介绍无人机 PID 调参的核心流程。首先理解比例、积分、微分三个参数的作用；其次采集飞行数据并进行误差分析；利用频域洞察发现震荡源；遵循循序渐进原则优化参数；最后通过阶跃响应和频谱图验证效果。旨在帮助开发者提升飞行器稳定性。

发布于 2026/4/642 浏览7 点赞

编程语言

发那科机器人与西门子 PLC 通讯方案：网关与 Modbus TCP 配置及代码

介绍发那科机器人与西门子 PLC 的两种通讯方案：基于网关的 EtherNet/IP 转 Profinet 方案，以及基于 Modbus TCP 的直接通讯方案。涵盖机器人侧参数设置、网关配置、TIA Portal 硬件组态及 SCL 测试代码。重点说明 IP 网段一致性、数据长度匹配、重启生效、字节序交换等关键配置细节与故障排查方法，适用于不同规模产线的自…

发布于 2026/4/647 浏览4 点赞

灭霸

发布的文章

EgoPoseFormer v2：AR/VR 场景中的第一视角人体动捕技术

开源 ROS 智能割草机器人：硬件选型、软件架构与部署指南

LLaMA-Factory 全流程模型训练与推理

企业微信外部群 Webhook 配置与消息发送指南

实测 Gemini Pro：谷歌多模态 AI 的实际应用能力

Python AI 入门：从 Hello World 到图像分类

从 SEO 到 GEO：315 晚会曝光的 AI 投毒黑产及技术防御

GPT、LLaMA 与 MOE：自回归模型与混合专家架构演进

使用 LiteLLM 接入 GitHub Copilot Chat API 低成本运行 Claude Code

Copilot Chat 功能介绍与使用指南

Discord 机器人创建与配置流程

基于 OpenClaw 的多机器人协作团队构建

Palantir 大模型平台解析：从本体论到企业 AI 决策实战

基于腾讯混元多模态 AI 的智能视频分析与创作助手

OpenClaw 实战：持久记忆与 RAG 知识库构建

基于 AI 辅助的 Java 零基础入门与基础实战指南

VS Code 集成 GitHub Copilot 配置与实战指南

OpenClaw 浏览器控制：Chrome Debug 模式配置指南

无人机 PID 调参指南：参数分析与优化方法

发那科机器人与西门子 PLC 通讯方案：网关与 Modbus TCP 配置及代码