别再花冤枉钱！这个AI Skill能免费生成PPT，文件还能直接保存编辑

优质文章学习记录

12 Apr 2026 — 7 min read

大家好

AI时代来临后，有很多人对于AI 生成PPT有需求

但是网上的AI生成PPT功能，不是收费就是限制次数，要不就是一个HTML文件不能下载为PPT

今天给大家分享一个skill，只要把它安装好，以后生成PPT就不用再花钱了

Skill获取方式

GitHub地址：
https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/document-skills/pptx
国内访问友好地址：
https://skillsmp.com/skills/davila7-claude-code-templates-cli-tool-components-skills-scientific-document-skills-pptx-skill-md

这个skill在GitHub的星标已经18.7K，足以说明很牛B

点击“wget skill.zip”即可将其下载到本地

使用演示

接下来使用opencode来说明这个skill要如何使用
如果还没有安装opencode的小伙伴，可以看我之前的文章
用opencode进入这个skill的目录

全网都在刷的 AI Skills 怎么用？别死磕 Claude Code，OpenCode 才是国内首选！

进入skill目录

opencode有两种安装方式，一个是桌面端，一个是命令行，两种选择其中一个即可

1、桌面端opencode

点击左侧的➕，再选择解压后的skill目录即可

2、命令行

原理相同，用cd命令进入到解压缩后的目录，再执行opencode

cd D:\SoftSetup\skills\guanfang\pptx opencode

1、生成PPT

这里我先用桌面端的opencode来演示
与市面上的其他AI生成PPT的方式相同，直接描述需求即可。
我这里习惯使用@方式先调用出需要使用的技能，不@也可以，大模型会根据需要自己调用。
例如：这里我让它生成一个介绍opencode的ppt

使用炫酷的方式介绍Opencode，所有代码写在一个html中，再将Html变为ppt

通过上图可以看到，用了6分钟，生成出完整的PPT

这款skill的实现方式，也是通过先生成html再将html转换为PPT，我这个例子是让它从无到有，全流程的生成了一遍，也可以给它一个html让它改为ppt，后面有演示

下图是生成的PPT，里面都是英文，看不懂，接着让它改

直接在opencode里输入，改为中文

总体用了4分钟，把一份英文PPT改为了中文

2、HTML改写为PPT

接下来演示，直接使用已有的html生成PPT，很多人可能认为opencode生成的ppt样式不够美观，所以可以选择使用其他模型先生成html文件，再用这个skill转换为PPT

这里我用GLM-4.7生成了一个html文件，效果如下

接下来把这个html加入到opencode，用这个skill来进行生成

这里要说明下，目前opencode的桌面端还不支持html文件的上传，所以接下来需要使用命令行模式操作

操作方法很简单，只需要把你的文件拖进opencode命令行

接下来让它开始转换

这里要注意，选择build模式，如果你是plan模式，那么是无法生成内容的

用时6分钟，把html改为了PPT，文件路径和名称都写的很明白

来看看效果，对比起来还是GLM-4.7生成的效果好看些

这里也要说明一下，并不是每次生成的效果都很好，所以个人建议，还是在opencode中自己配上喜欢的大模型API，让它直接生成，不要使用这种三方模型生成后再转换的方式

总体功能说明

上面演示的PPT生成是这个skill的主要技能，也是大家需求比较多的功能

这个skill本身还支持下面的功能，这里不再展示，用法都是相同的

🎨 HTML到PowerPoint转换
html2pptx库：将HTML精确转换为PowerPoint幻灯片
精确定位：保持HTML元素的准确位置和样式
占位符支持：为图表、表格预留区域（class="placeholder"）
格式验证：自动验证HTML规范，防止常见错误

📝 内容操作
文本提取：使用markitdown将PPTX转换为Markdown
内容替换：批量替换幻灯片文本内容
目录分析：提取演示文稿结构和所有文本元素
格式保持：在替换时保持原有样式和格式

🔧 底层OOXML操作
解包/打包：解压缩和重压缩PPTX文件
XML编辑：直接操作幻灯片XML结构
媒体管理：处理图片、音频等媒体文件
关系维护：更新文件间的关系和引用

📈 数据可视化
图表创建：条形图、折线图、饼图、散点图等
表格设计：基础表格、合并单元格、自定义格式
形状绘制：矩形、圆形、圆角矩形等形状
图像处理：添加、调整、定位图片

🎨 设计系统
18种预设配色方案：经典蓝、珊瑚绿、勃艮第奢华等
视觉布局：两列布局、全幅布局、网格系统
排版规范：Web安全字体、对比度、层次结构
样式创新：几何图案、边框处理、排版特效

总结

回过头来看，只是用几分钟的搭建安装时间，就换来了一个永久免费的PPT生成工具。不用再为"这个月次数用完了"而焦虑，也不用忍受生成结果只能在线查看的尴尬。

这个skill的强大之处在于，它把最复杂的AI推理和格式转换都封装好了，你只需要用自然语言告诉它想要什么。无论你是要汇报工作、做演讲，还是给学生上课，它都能成为你的得力助手。

当然，AI生成的PPT未必每次都完美无缺，但它至少能帮你完成80%的基础工作，剩下的20%润色才是你的创意所在。这不正是AI时代我们与工具合作的最佳方式吗？

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，谢谢你看我的文章，我们，下次再见

Gemini cli 源码分析之工具篇-WebFetch工具

查看完整的Gemini cli 源码分析系列课程 Gemini CLI源码启示录：AI工程师必须掌握的终端开发范式 WebFetch工具深度分析概述 WebFetch工具 (packages/core/src/tools/web-fetch.ts) 是Gemini CLI项目中的一个核心工具，用于从URL获取和处理网页内容。该工具结合了AI能力和传统网页抓取技术，提供了智能的内容获取和处理功能。核心架构主要组件 WebFetchTool(主工具类) ├── WebFetchToolInvocation(工具调用实现) ├── parsePrompt(URL解析函数) └── GroundingMetadata(引用和元数据接口) 继承关系 * WebFetchTool 继承自 BaseDeclarativeTool<WebFetchToolParams, ToolResult> * WebFetchToolInvocation 继承自 BaseToolInvocation<WebFetchToolParams, ToolResult> 核心功能分析

借助 AI 助手更快构建更优质 Android 应用：从 Android Studio 的 Gemini 到中国开发者的实用替代方案

引言：AI 正在重塑 Android 开发工作流近年来，Google 在 Android Studio 中深度集成了其新一代 AI 模型 Gemini，旨在帮助开发者更高效地编写、调试和优化代码。然而，对于身处中国大陆的开发者而言，由于网络限制、账号体系及数据隐私等因素，原生 Gemini 往往“看得见、用不上”。但这并不意味着我们无法享受 AI 编程带来的效率红利。事实上，随着国产大模型的快速成熟，通义灵码、CodeGeeX 等本土化 AI 编程助手已能提供媲美甚至超越 Gemini 的中文开发体验。本文将： * 客观分析 Android Studio 中 Gemini 的功能与国内可用性 * 重点推荐真正适合中国开发者的 AI 替代方案 * 通过真实开发场景演示，

零基础学AI大模型之RunnableLambda

大家好，我是工藤学编程 🦉一个正在努力学习的小博主，期待你的关注实战代码系列最新文章😉C++实现图书管理系统（Qt C++ GUI界面版）SpringBoot实战系列🐷【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案分库分表分库分表之实战-sharding-JDBC分库分表执行流程原理剖析消息队列深入浅出 RabbitMQ-RabbitMQ消息确认机制（ACK）AI大模型零基础学AI大模型之RunnableParallel 前情摘要 1、零基础学AI大模型之读懂AI大模型 2、零基础学AI大模型之从0到1调用大模型API 3、零基础学AI大模型之SpringAI 4、零基础学AI大模型之AI大模型常见概念 5、零基础学AI大模型之大模型私有化部署全指南 6、零基础学AI大模型之AI大模型可视化界面 7、零基础学AI大模型之LangChain 8、零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路 9、零基础学AI大模型之Prompt提示词工程 10、零基础学AI大模型之LangChain-Prompt

Spring AI Alibaba与 Agent Scope到底选哪个？

文章目录 * 引言 * 概念纠正 * 目前的两大发展方向 * Workflow模式(工作流) * 运行机制 * 后端视角类比 * 适用场景 * Agentic 模式 (智能体 / 自主模式) * 运行机制：Loop (循环) * 后端视角类比 * 适用场景 * AgentScope java 和 Spring AI Alibaba的区别 * 总结引言 Spring AI Alibaba 和 Agent Scope 虽然都出自阿里巴巴，但它们的核心设计理念、适用场景以及对“Agent（智能体）”的定义有本质的区别。那我们怎么根据自己的场景来选择不同的框架呢？今天就来讲讲这两者适用的不同场景与相关概念，坐稳扶好！概念纠正有些人总是认为chatbot(ChatGPT、DeepSeek等)就是Agent，其实是错误的。 Agent = LLM(大脑)