【开源发布】MCP Document Converter:让你的 AI 助手精通 25 种文档转换神技!

【开源发布】MCP Document Converter:让你的 AI 助手精通 25 种文档转换神技!
在这里插入图片描述

  【个人主页:玄同765

大语言模型(LLM)开发工程师中国传媒大学·数字媒体技术(智能交互与游戏设计)

深耕领域:
大语言模型开发 / RAG知识库 / AI Agent落地 / 模型微调

技术栈:Python / LangChain/RAG(Dify+Redis+Milvus)| SQL/NumPy | FastAPI+Docker ️

工程能力:专注模型工程化部署、知识库构建与优化,擅长全流程解决方案 

     

「让AI交互更智能,让技术落地更高效」

欢迎技术探讨/项目合作! 关注我,解锁大模型与智能交互的无限可能!

前言:AI 时代的文档处理困境

【好消息】MCP Document Converter 已正式入驻 MCP 官方 Server 列表,并同步发布至 PyPI!

作为一名开发者,在使用 Trae 或 Claude 等 AI 助手时,你是否也曾感到力不从心?

  • 扔给 AI 一个复杂的 PDF,它却告诉你“无法直接读取”?
  • 想要 AI 帮你把 Markdown 文档导出为格式精美的 Word 或 PDF,却得手动复制粘贴?
  • 网页 HTML 代码太乱,AI 分析起来总是抓不住重点?

为了彻底打通 AI 与各种文档格式之间的“次元壁”,我开发并开源了 MCP Document Converter。就在今天,它已正式入驻 MCP 官方 Server 列表


核心亮点:不仅仅是转换,更是 AI 的“语义翻译官”

MCP Document Converter 是基于 Anthropic 推出的 MCP (Model Context Protocol) 协议开发的。它最大的特点是:让 AI 拥有了操作文档的原生能力。

目前,该工具支持以下 5 种核心格式的双向自由转换,共计 25 种转换组合

  1. 📄 PDF (.pdf):采用结构化提取技术,尽可能保留文档原始层级。
  2. 📘 Word (.docx):支持样式、表格的解析与生成,让 AI 也能写公文。
  3. 🌐 HTML (.html):语义化标签解析,支持自定义 CSS 注入,生成精美页面。
  4. 📝 Markdown (.md):针对 AI 交互优化的 MD 格式,支持 YAML 元数据。
  5. 📃 Text (.txt):最纯粹的文本处理,自动检测编码。

为什么它更懂 AI? 因为它在转换过程中会优先保留文档的语义元数据(如标题、作者、创建时间),确保 AI 在处理文档时不会“断章取义”。


快速上手:三步解锁 AI 的“文档超能力”

我已经将项目发布到了 PyPI,并完美适配了 uv 工具链。你无需下载源码,只需几行配置即可启用。

1. 安装依赖
pip install mcp-document-converter 
2. 配置 AI 助手(以 Trae/Claude 为例)

在你的 MCP 配置文件中添加如下代码:

方式一:通过 uvx 直接运行(推荐,自动管理环境)

{ "mcpServers": { "mcp-document-converter": { "command": "uvx", "args": ["mcp-document-converter"] } } } 

方式二:如果你已经安装到本地环境

{ "mcpServers": { "mcp-document-converter": { "command": "python", "args": ["-m", "mcp_document_converter"] } } } 

实战场景:让 AI 动起来

配置完成后,你可以直接在对话框里给 AI 下指令:

  • 场景 A:“帮我把 docs/guide.md 转成带公司样式的 PDF,存到 output/ 文件夹。”
  • 场景 B:“读取这个 resume.pdf,把它转成 Markdown 格式,然后根据内容提取出候选人的技能列表。”
  • 场景 C:“这个 HTML 页面太乱了,帮我转成干净的 Word 文档发给同事。”

AI 会自动调用 convert_document 接口,在后台静默完成所有工作,你只需要坐享其成。


结语:开源精神与未来

MCP Document Converter 采用插件化架构,未来我会持续增加对更多格式(如 Excel、PPT、EPUB)的支持。

如果你觉得这个工具有所帮助,欢迎:

让我们一起,用 MCP 协议重新定义 AI 的工作流!

Read more

AI课堂生成网站丨OPENMAIC丨清华团队开源项目

AI课堂生成网站丨OPENMAIC丨清华团队开源项目

OpenMAIC(谐音“My课”)是一个AI教学平台,它能为你生成一个专属的7x24小时AI教室。在这个教室里,你是唯一的真人学生,而老师、助教和同学都由AI智能体扮演。 * AI老师:负责主讲课程,可以在虚拟白板上实时书写、画图,并进行语音讲解。 * AI助教与同学:会与你实时互动,他们可以提问、发起讨论,模拟真实课堂的临场感。 你只需要输入一个课程主题(如“什么是摩擦力”)或上传一份文档,系统就能自动生成包含幻灯片、随堂测验、互动模拟和项目式学习活动的完整课程。 🎓 主要特点 * 极速课程构建:只需输入关键词或上传文档,AI即可在约30分钟内自动生成一套结构完整的教学包,成本极低。 * 拟真多角色课堂:通过多智能体协同,模拟出教师、助教和不同性格的同学,他们可以说话、在白板上绘画,并与你进行实时讨论,显著增强学习的参与感。 * 跨应用轻量调用:通过内置的OpenClaw集成,用户可以直接在飞书、Slack等主流协作工具中,通过简单的指令触发课程生成。 * 全格式灵活交付:生成的课件支持导出为可编辑的PPT文件或打包为独立的HTML文件,方便二次编辑和使用。

QClaw 上手指南:我用了一周龙虾,感觉自己白用了两年 AI

QClaw 上手指南:我用了一周龙虾,感觉自己白用了两年 AI

欢迎来到我的博客,代码的世界里,每一行都是一个故事 🎏:你只管努力,剩下的交给时间 🏠 :小破站 QClaw 上手指南:我用了一周龙虾,感觉自己白用了两年 AI * 先说清楚:OpenClaw 是什么,龙虾又是怎么来的 * 第一次打开:它先问你是谁 * 微信直联:手机变成了 AI 的遥控器 * 接入自定义模型:你的 API 你做主 * Skills 插件:能力边界一直在扩 * 角色系统:不是换个语气,是换个工作模式 * 定时任务:让 AI 主动替你干活 * 它是怎么「记住你」的 * 本地跑意味着什么 * 适合什么人用 * 最后 如果你最近在关注 AI 工具圈,大概率听说过一个叫 OpenClaw 的东西,中文社区管它叫「龙虾」。这个开源项目在

我发现了一个能“一锅端”豆包、即梦所有AI水印的骚操作,99%的人都不知道!(附保姆级教程)

我发现了一个能“一锅端”豆包、即梦所有AI水印的骚操作,99%的人都不知道!(附保姆级教程)

大家好,我是顾北,专注于 AI 应用探索与副业实践,长期关注 AI 技术趋势、实用工具以及 Github 线索探索。 前天发布的 Google AI Studio 去除水印的小技巧后,就吸引到很多朋友私聊我说:“豆包、即梦以及不同模型 AI 生成的图片能不能去除水印",针对于这个问题,我这两天就吭哧吭哧的找解决方案,你别说,真的就被我找到了。 不管是即梦还是豆包,不管是针对于懂一点 AI 的普通玩家,还是专业的 AI 绘图设计师,看完这篇文章,都有所获的。 接下来,就按照豆包去水印、即梦去水印、以及后面的最终大招来分享给你。请你仔细阅读完,看到后面有惊喜哦! 一键去除豆包生图水印 去除豆包生成图片水印方式有两种。 *  第一种:去除水印操作简单,方便,缺点是有可能去除不干净。 * 第二种:去除水印操作麻烦一点,但优点是一键去除得很干净。

从零搭建可落地 Agent:一文吃透 AI 智能体开发全流程

从零搭建可落地 Agent:一文吃透 AI 智能体开发全流程

🎁个人主页:我滴老baby 🎉欢迎大家点赞👍评论📝收藏⭐文章 🔍系列专栏:AI 文章目录: * 【前言】 * 一、先搞懂:2026年爆火的AI Agent,到底是什么? * 1.1 Agent的核心定义 * 1.2 Agent的4大核心能力 * 1.3 2026年Agent的3个热门落地场景 * 二、框架选型:2026年6大主流Agent框架,新手该怎么选? * 三、实战环节:从0到1搭建可落地的“邮件处理Agent”(全程代码+步骤) * 3.1 实战准备:环境搭建(10分钟搞定) * 3.1.1 安装Python环境 * 3.1.2 创建虚拟环境(避免依赖冲突) * 3.1.