别再花冤枉钱!这个AI Skill能免费生成PPT,文件还能直接保存编辑

别再花冤枉钱!这个AI Skill能免费生成PPT,文件还能直接保存编辑

大家好

AI时代来临后,有很多人对于AI 生成PPT有需求

但是网上的AI生成PPT功能,不是收费就是限制次数,要不就是一个HTML文件不能下载为PPT

今天给大家分享一个skill,只要把它安装好,以后生成PPT就不用再花钱了

Skill获取方式

GitHub地址:
https://github.com/davila7/claude-code-templates/tree/main/cli-tool/components/skills/scientific/document-skills/pptx
国内访问友好地址:
https://skillsmp.com/skills/davila7-claude-code-templates-cli-tool-components-skills-scientific-document-skills-pptx-skill-md

这个skill在GitHub的星标已经18.7K,足以说明很牛B

图片

点击“wget skill.zip”即可将其下载到本地

使用演示

接下来使用opencode来说明这个skill要如何使用
如果还没有安装opencode的小伙伴,可以看我之前的文章
用opencode进入这个skill的目录

全网都在刷的 AI Skills 怎么用?别死磕 Claude Code,OpenCode 才是国内首选!

进入skill目录

opencode有两种安装方式,一个是桌面端,一个是命令行,两种选择其中一个即可

1、桌面端opencode

点击左侧的➕,再选择解压后的skill目录即可

图片

2、命令行

原理相同,用cd命令进入到解压缩后的目录,再执行opencode

cd D:\SoftSetup\skills\guanfang\pptx opencode

图片

1、生成PPT

这里我先用桌面端的opencode来演示
与市面上的其他AI生成PPT的方式相同,直接描述需求即可。
我这里习惯使用@方式先调用出需要使用的技能,不@也可以,大模型会根据需要自己调用。
例如:这里我让它生成一个介绍opencode的ppt

使用炫酷的方式介绍Opencode,所有代码写在一个html中,再将Html变为ppt

图片

通过上图可以看到,用了6分钟,生成出完整的PPT

这款skill的实现方式,也是通过先生成html再将html转换为PPT,我这个例子是让它从无到有,全流程的生成了一遍,也可以给它一个html让它改为ppt,后面有演示

下图是生成的PPT,里面都是英文,看不懂,接着让它改

图片

直接在opencode里输入,改为中文

图片

总体用了4分钟,把一份英文PPT改为了中文

图片

2、HTML改写为PPT

接下来演示,直接使用已有的html生成PPT,很多人可能认为opencode生成的ppt样式不够美观,所以可以选择使用其他模型先生成html文件,再用这个skill转换为PPT

这里我用GLM-4.7生成了一个html文件,效果如下

图片

接下来把这个html加入到opencode,用这个skill来进行生成

这里要说明下,目前opencode的桌面端还不支持html文件的上传,所以接下来需要使用命令行模式操作

操作方法很简单,只需要把你的文件拖进opencode命令行

图片

接下来让它开始转换

图片

这里要注意,选择build模式,如果你是plan模式,那么是无法生成内容的

用时6分钟,把html改为了PPT,文件路径和名称都写的很明白

图片

来看看效果,对比起来还是GLM-4.7生成的效果好看些

图片

这里也要说明一下,并不是每次生成的效果都很好,所以个人建议,还是在opencode中自己配上喜欢的大模型API,让它直接生成,不要使用这种三方模型生成后再转换的方式

总体功能说明

上面演示的PPT生成是这个skill的主要技能,也是大家需求比较多的功能

这个skill本身还支持下面的功能,这里不再展示,用法都是相同的

🎨 HTML到PowerPoint转换
html2pptx库:将HTML精确转换为PowerPoint幻灯片
精确定位:保持HTML元素的准确位置和样式
占位符支持:为图表、表格预留区域(class="placeholder")
格式验证:自动验证HTML规范,防止常见错误

📝 内容操作
文本提取:使用markitdown将PPTX转换为Markdown
内容替换:批量替换幻灯片文本内容
目录分析:提取演示文稿结构和所有文本元素
格式保持:在替换时保持原有样式和格式

🔧 底层OOXML操作
解包/打包:解压缩和重压缩PPTX文件
XML编辑:直接操作幻灯片XML结构
媒体管理:处理图片、音频等媒体文件
关系维护:更新文件间的关系和引用

📈 数据可视化
图表创建:条形图、折线图、饼图、散点图等
表格设计:基础表格、合并单元格、自定义格式
形状绘制:矩形、圆形、圆角矩形等形状
图像处理:添加、调整、定位图片

🎨 设计系统
18种预设配色方案:经典蓝、珊瑚绿、勃艮第奢华等
视觉布局:两列布局、全幅布局、网格系统
排版规范:Web安全字体、对比度、层次结构
样式创新:几何图案、边框处理、排版特效

总结

回过头来看,只是用几分钟的搭建安装时间,就换来了一个永久免费的PPT生成工具。不用再为"这个月次数用完了"而焦虑,也不用忍受生成结果只能在线查看的尴尬。

这个skill的强大之处在于,它把最复杂的AI推理和格式转换都封装好了,你只需要用自然语言告诉它想要什么。无论你是要汇报工作、做演讲,还是给学生上课,它都能成为你的得力助手。

当然,AI生成的PPT未必每次都完美无缺,但它至少能帮你完成80%的基础工作,剩下的20%润色才是你的创意所在。这不正是AI时代我们与工具合作的最佳方式吗?

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,谢谢你看我的文章,我们,下次再见

Read more

Gemini cli 源码分析之工具篇-WebFetch工具

Gemini cli 源码分析之工具篇-WebFetch工具

查看完整的Gemini cli 源码分析系列课程 Gemini CLI源码启示录:AI工程师必须掌握的终端开发范式 WebFetch工具深度分析 概述 WebFetch工具 (packages/core/src/tools/web-fetch.ts) 是Gemini CLI项目中的一个核心工具,用于从URL获取和处理网页内容。该工具结合了AI能力和传统网页抓取技术,提供了智能的内容获取和处理功能。 核心架构 主要组件 WebFetchTool(主工具类) ├── WebFetchToolInvocation(工具调用实现) ├── parsePrompt(URL解析函数) └── GroundingMetadata(引用和元数据接口) 继承关系 * WebFetchTool 继承自 BaseDeclarativeTool<WebFetchToolParams, ToolResult> * WebFetchToolInvocation 继承自 BaseToolInvocation<WebFetchToolParams, ToolResult> 核心功能分析

借助 AI 助手更快构建更优质 Android 应用:从 Android Studio 的 Gemini 到中国开发者的实用替代方案

引言:AI 正在重塑 Android 开发工作流 近年来,Google 在 Android Studio 中深度集成了其新一代 AI 模型 Gemini,旨在帮助开发者更高效地编写、调试和优化代码。然而,对于身处中国大陆的开发者而言,由于网络限制、账号体系及数据隐私等因素,原生 Gemini 往往“看得见、用不上”。 但这并不意味着我们无法享受 AI 编程带来的效率红利。事实上,随着国产大模型的快速成熟,通义灵码、CodeGeeX 等本土化 AI 编程助手已能提供媲美甚至超越 Gemini 的中文开发体验。 本文将: * 客观分析 Android Studio 中 Gemini 的功能与国内可用性 * 重点推荐 真正适合中国开发者的 AI 替代方案 * 通过 真实开发场景演示,

零基础学AI大模型之RunnableLambda

零基础学AI大模型之RunnableLambda

大家好,我是工藤学编程 🦉一个正在努力学习的小博主,期待你的关注实战代码系列最新文章😉C++实现图书管理系统(Qt C++ GUI界面版)SpringBoot实战系列🐷【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案分库分表分库分表之实战-sharding-JDBC分库分表执行流程原理剖析消息队列深入浅出 RabbitMQ-RabbitMQ消息确认机制(ACK)AI大模型零基础学AI大模型之RunnableParallel 前情摘要 1、零基础学AI大模型之读懂AI大模型 2、零基础学AI大模型之从0到1调用大模型API 3、零基础学AI大模型之SpringAI 4、零基础学AI大模型之AI大模型常见概念 5、零基础学AI大模型之大模型私有化部署全指南 6、零基础学AI大模型之AI大模型可视化界面 7、零基础学AI大模型之LangChain 8、零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路 9、零基础学AI大模型之Prompt提示词工程 10、零基础学AI大模型之LangChain-Prompt

Spring AI Alibaba与 Agent Scope到底选哪个?

Spring AI Alibaba与 Agent Scope到底选哪个?

文章目录 * 引言 * 概念纠正 * 目前的两大发展方向 * Workflow模式(工作流) * 运行机制 * 后端视角类比 * 适用场景 * Agentic 模式 (智能体 / 自主模式) * 运行机制:Loop (循环) * 后端视角类比 * 适用场景 * AgentScope java 和 Spring AI Alibaba的区别 * 总结 引言 Spring AI Alibaba 和 Agent Scope 虽然都出自阿里巴巴,但它们的核心设计理念、适用场景以及对“Agent(智能体)”的定义有本质的区别。那我们怎么根据自己的场景来选择不同的框架呢?今天就来讲讲这两者适用的不同场景与相关概念,坐稳扶好! 概念纠正 有些人总是认为chatbot(ChatGPT、DeepSeek等)就是Agent,其实是错误的。 Agent = LLM(大脑)