ChatGPT 插件生态现状
ChatGPT 插件数量近期呈现大爆发态势,总数已达 390 个。与刚开放时的 74 个相比,增长超过 400%。值得注意的是,其中 112 个插件都是在同一天上线的。
ChatGPT 插件数量近期增长显著,总数达 390 个。本文介绍了利用 AI Agents 配合联网插件实现自动写书的玩法,并针对 ChatGPT 无法感知实时插件信息的痛点,提出了两种解决方案:一是借助联网插件读取外部数据,二是通过思维链提示词分批发送数据。实测表明,这两种方法均能让 ChatGPT 识别并使用插件,但需注意上下文长度管理和模型选择。此外,文章还指出了当前自动化流程在排版导出环节的局限性,并给出了插件库维护及内容审核的最佳实践建议。

ChatGPT 插件数量近期呈现大爆发态势,总数已达 390 个。与刚开放时的 74 个相比,增长超过 400%。值得注意的是,其中 112 个插件都是在同一天上线的。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online
虽然早期插件质量参差不齐,体验一般,但随着更多新插件加入,各种'联动出奇迹'的插件组合也被挖掘了出来。最近很火的玩法是只给一个主题,让 AI 自动搜集资料并写出一本电子书。
这个玩法的核心在于利用 AI Agents 插件自动分解复杂任务、制订步骤并按顺序执行。再配合上两个联网插件负责搜集资料,自动写书流程即可跑通。
该玩法之所以备受关注,还有一个现实原因:此前有人用 AI 写了 97 本电子书在网上售卖,虽然质量普遍不高,但也赚取了 2000 美元。现在有了自动工作流程,效率提升明显。
然而,面对如此众多的插件,如何找到需要的功能?又如何从中发现更多 1+1>2 的工作流程呢?能否让 ChatGPT 自己来推荐?
这里存在一个技术瓶颈:无论 GPT-3.5 还是 GPT-4,其训练数据对现实世界的知识截止至 2021 年 9 月,连自身拥有插件功能这一特性在初期都不知道。
经过反复尝试,目前已有方法可以让 ChatGPT 知晓所有插件的功能。只要描述你的需求,就能找出合适的插件。还可以要求 ChatGPT 开脑洞,推荐哪些插件联用能完成更复杂的任务。
通过 OpenAI 开放的聊天记录分享功能,我们可以把已获得所有插件知识的 ChatGPT 会话分享出来。有账号的朋友只需要点击'继续这个对话',就可以提问任何有关插件的问题。
首先,通过爬虫和数据清洗脚本等手段,获得所有插件的名称和功能描述。由于一次全部输入给 ChatGPT 超出长度限制,可以借助联网插件读取外部数据。
实际测试下来,Web Request 插件体验最好,速度稳定,对于长内容可以自动分页读取。
具体操作步骤如下:
这种方法的优点是使用了 GPT-4,回答非常准确,并且外部插件列表可以随时更新。但缺点同样是使用了 GPT-4,占用每 3 小时 25 条对话的宝贵限额。
第二种方法不使用插件,采用分批发送数据的方式,GPT-3.5 和 GPT-4 都适用。但 3.5 的回答经常会出错,比如插件名称只写了一半,或者对插件功能的理解有小问题。
总的来说也算够用,毕竟 GPT-3.5 没有使用次数限制,大不了多问几次。让 ChatGPT 分批次接收数据需要用到思维链提示,分步骤描述整个任务流程。
关键提示词模板:
- 你的任务是回答任何关于 ChatGPT 插件的问题。
- 现在一共有 390 个插件,接下来我会以'{编号} {名称} - {功能描述}'的方式分批把插件数据发给你。
- 在未接收完全部插件数据之前,只需要阅读并记住这些数据,并回复'收到,请继续发送下一批数据'。
- 接收完全部插件数据之后,请回复'已收到全部插件数据,接下来可以任意提问了',并在后续对话中使用与提问相同的语言回答问题。
- 收到这一条消息后,请回复'收到,请开始发送数据'。
关键之处在于指定收到数据时的回复,尽量简短一些。不要让 ChatGPT 自己发挥,它自己说的话也会占用上下文长度。聊太多,ChatGPT 就会脑袋过载,把前面的内容遗忘。
忘掉任务的问题可以通过反复提醒来解决,忘掉数据就成了狗熊掰棒子,输入后面的忘掉前面的。在前面的试验中,即使是 GPT-4 也会出现忘掉自己的任务的情况,并且因为收到连续的英文数据太多,都不记得用户是用中文提问的了。
输入按思维链方式打磨好的提示词后,就可以分批发送数据了。ChatGPT 回复'收到'后,继续发送后面的数据就行。等全部发送完后,下一条消息就可以开始提问。
当然如果使用分享的聊天记录就可以省去插件读取资料或手动发送资料的过程,直接开始提问。只要注意在提问时明确指定用前面读取的 390 个插件数据回答就行,不然有小概率会出现瞎编的情况。
还记得文章开头提到的自动写书插件组合吗?原作者推荐使用的 3 个插件分别是 AI Agents、WebRequest 和 WebPilot。
按原作者演示,只需要一句提示词就能开启整个流程,后续无脑说'keep going'就可以了。我们尝试把原作者给的提示词直接换成中文,发现也是可以成功调用 AI Agents 插件的,并且生成的内容也自动换成了中文。
不过可惜的是,再往后的排版、导出环节就需要 OpenAI 官方插件 Code Interpreter(代码解释器)才能做到了。目前代码解释器插件还在 alpha 测试阶段,需要排队申请测试资格。
当然,写作部分完成后,如果有什么需要修改的地方也可以随时提出来。相当于把工作外包给 AI,而自己当着甲方,内容就写好了。
在使用上述方法时,建议遵循以下最佳实践以确保效果:
通过外部链接读取或思维链分批注入,可以有效解决 ChatGPT 对实时插件信息认知不足的问题。结合 AI Agents 等工具,自动化工作流已经初具规模。尽管目前仍存在如 Code Interpreter 访问受限等挑战,但随着生态完善,AI 辅助创作的能力将进一步提升。