【开源发布】MCP Document Converter：让你的 AI 助手精通 25 种文档转换神技！

优质文章学习记录

08 Apr 2026 — 4 min read

【个人主页：玄同765】

大语言模型（LLM）开发工程师｜中国传媒大学·数字媒体技术（智能交互与游戏设计）

深耕领域：大语言模型开发 / RAG知识库 / AI Agent落地 / 模型微调

技术栈：Python / LangChain/RAG（Dify+Redis+Milvus）| SQL/NumPy | FastAPI+Docker ️

工程能力：专注模型工程化部署、知识库构建与优化，擅长全流程解决方案

「让AI交互更智能，让技术落地更高效」

欢迎技术探讨/项目合作！关注我，解锁大模型与智能交互的无限可能！

前言：AI 时代的文档处理困境

【好消息】MCP Document Converter 已正式入驻 MCP 官方 Server 列表，并同步发布至 PyPI！

作为一名开发者，在使用 Trae 或 Claude 等 AI 助手时，你是否也曾感到力不从心？

扔给 AI 一个复杂的 PDF，它却告诉你“无法直接读取”？
想要 AI 帮你把 Markdown 文档导出为格式精美的 Word 或 PDF，却得手动复制粘贴？
网页 HTML 代码太乱，AI 分析起来总是抓不住重点？

为了彻底打通 AI 与各种文档格式之间的“次元壁”，我开发并开源了 MCP Document Converter。就在今天，它已正式入驻 MCP 官方 Server 列表！

核心亮点：不仅仅是转换，更是 AI 的“语义翻译官”

MCP Document Converter 是基于 Anthropic 推出的 MCP (Model Context Protocol) 协议开发的。它最大的特点是：让 AI 拥有了操作文档的原生能力。

目前，该工具支持以下 5 种核心格式的双向自由转换，共计 25 种转换组合：

📄 PDF (.pdf)：采用结构化提取技术，尽可能保留文档原始层级。
📘 Word (.docx)：支持样式、表格的解析与生成，让 AI 也能写公文。
🌐 HTML (.html)：语义化标签解析，支持自定义 CSS 注入，生成精美页面。
📝 Markdown (.md)：针对 AI 交互优化的 MD 格式，支持 YAML 元数据。
📃 Text (.txt)：最纯粹的文本处理，自动检测编码。

为什么它更懂 AI？ 因为它在转换过程中会优先保留文档的语义元数据（如标题、作者、创建时间），确保 AI 在处理文档时不会“断章取义”。

快速上手：三步解锁 AI 的“文档超能力”

我已经将项目发布到了 PyPI，并完美适配了 uv 工具链。你无需下载源码，只需几行配置即可启用。

1. 安装依赖

pip install mcp-document-converter

2. 配置 AI 助手（以 Trae/Claude 为例）

在你的 MCP 配置文件中添加如下代码：

方式一：通过 uvx 直接运行（推荐，自动管理环境）

{ "mcpServers": { "mcp-document-converter": { "command": "uvx", "args": ["mcp-document-converter"] } } }

方式二：如果你已经安装到本地环境

{ "mcpServers": { "mcp-document-converter": { "command": "python", "args": ["-m", "mcp_document_converter"] } } }

实战场景：让 AI 动起来

配置完成后，你可以直接在对话框里给 AI 下指令：

场景 A：“帮我把 docs/guide.md 转成带公司样式的 PDF，存到 output/ 文件夹。”
场景 B：“读取这个 resume.pdf，把它转成 Markdown 格式，然后根据内容提取出候选人的技能列表。”
场景 C：“这个 HTML 页面太乱了，帮我转成干净的 Word 文档发给同事。”

AI 会自动调用 convert_document 接口，在后台静默完成所有工作，你只需要坐享其成。

结语：开源精神与未来

MCP Document Converter 采用插件化架构，未来我会持续增加对更多格式（如 Excel、PPT、EPUB）的支持。

如果你觉得这个工具有所帮助，欢迎：

GitHub 点个 Star：xt765/mcp-document-converter
Gitee 镜像参与贡献：xt765/mcp-document-converter
PyPI 地址：https://pypi.org/project/mcp-document-converter/
MCP 官方注册表查询：点击查看官方收录状态
留言反馈：在 ZEEKLOG 或 GitHub Issue 中告诉我你的需求。

让我们一起，用 MCP 协议重新定义 AI 的工作流！

OpenClaw 接入飞书机器人保姆级教程

如果你的 OpenClaw 已完成初始部署、WebUI 可正常收发回复，现在想接入飞书机器人，这篇教程会带你从创建机器人到配置完成，一步到位。相信你在部署 OpenClaw 时已经踩过不少坑，这篇文章会帮你尽量避开飞书对接中的常见问题，少走弯路。废话不多说，教程正式开始！原文地址内置飞书插件如果您使用的是最新版本的 OpenClaw那么已经内置了 Feishu 插件，通常不需要让我们单独进行安装。如果您使用的是之前比较旧的版本，或者是没有内置的 Feishu 的插件，可以手动进行安装，执行下方命令：创建飞书机器人我们先来创建飞书的应用，我们可以复制下方地址进行一键直达创建企业自建应用打开后，我们点击【创建企业自建应用】，如果您还没有飞书账号的话，请先注册飞书的账号后再进行创建应用我们创建企业自建应用然后输入应用名称和应用描述，还有应用图标，我们都可以自定义进行上传，或者选择其他照片当作应用图标。输入完之后我们点击创建获取 AppID 和 AppSecret 我们点击凭证与基础信息一栏查看我们的App ID 和 App

RTD1296PB与RK3568在NAS与智能家居中的实战性能较量

1. 从NAS到智能家居：为什么需要关注这两颗芯片？如果你正在搭建家用NAS系统或者规划智能家居中枢设备，处理器选型绝对是绕不开的关键决策。RTD1296PB和RK3568作为市面上主流的中端ARM处理器，经常让开发者陷入选择困难。我在实际项目中用过这两款芯片，深刻体会到它们的差异不仅体现在参数表上，更直接影响着设备的实际体验。 RTD1296PB是瑞昱半导体面向家庭影音市场推出的老将，凭借出色的视频处理能力和成熟的OpenWRT支持，在早期NAS设备中占据重要地位。而瑞芯微的RK3568则是后来居上的多面手，22nm制程搭配Cortex-A55架构，在保持低功耗的同时提供了更强的扩展性。实测下来，两者的性能差距在日常使用中可能不会立即显现，但在特定场景下会拉开明显差距。 2. 硬件架构深度对比：藏在参数背后的细节 2.1 计算核心与制程工艺先看最核心的CPU部分，RK3568采用4核Cortex-A55设计，最高主频2.0GHz，相比RTD1296PB的Cortex-A53架构有着明显的IPC提升。我在压力测试中发现，同样的文件压缩任务，RK3568能快15-20%。

Unitree Go2机器人ROS2仿真终极指南：从零构建完整四足机器人仿真方案

Unitree Go2机器人ROS2仿真终极指南：从零构建完整四足机器人仿真方案【免费下载链接】go2_ros2_sdkUnofficial ROS2 SDK support for Unitree GO2 AIR/PRO/EDU 项目地址: https://gitcode.com/gh_mirrors/go/go2_ros2_sdk 在机器人技术快速发展的今天，仿真环境已成为算法验证和系统测试不可或缺的环节。本文将为开发者提供完整的Unitree Go2四足机器人在ROS2框架下的Gazebo仿真集成方案，涵盖从基础部署到高级导航功能的完整实现路径。无论是进行步态算法研究、自主导航开发，还是多机器人协同测试，本指南都将为您提供可操作的技术方案。两种技术路线：轻量级快速部署 vs 全功能定制开发 💡 轻量级快速部署方案基于官方SDK的快速集成路径，适合需要快速验证基础功能的开发者：核心优势： * 5分钟完成环境部署 * 开箱即用的基础运动控制 * 完善的传感器数据流 * 多机器人协同支持技术实现： # 核心启动文件：go2_

基于大疆MSDK实现的无人机视觉引导自适应降落功能

基于大疆MSDK实现的无人机视觉引导自适应降落功能概述最初需求：想要无人机在执行完航线任务后，一键落到一个指定的位置，简化人工控制。实现一套完整的无人机自主降落功能,通过虚拟摇杆控制使无人机飞向指定位置，再利用视觉识别引导无人机精确降落到具体位置。本文中采用自适应降落策略,根据高度动态调整精度要求和下降速度,以实现安全、精确的降落。核心点: * 虚拟摇杆导航替代FlyTo功能 * 双轴(X/Y)位置偏移实时调整 * 高度自适应降落策略 * 视觉识别引导定位 * 智能避障管理系统架构整体流程否是高于50m 20-50m 5-20m 低于5m 是否是否否是用户触发Return to Vehicle 获取无人机GPS位置计算与目标点距离启动虚拟摇杆导航飞向目标位置 5m/s 距离小于10m? 开始自适应降落视觉识别系统计算X/Y偏移量