LLMs Python解释器程序辅助语言模型（PAL）Program-aided language models (PAL)

Ne0inhk

15 Jan 2025 — 8 min read

正如您在本课程早期看到的，LLM执行算术和其他数学运算的能力是有限的。虽然您可以尝试使用链式思维提示来克服这一问题，但它只能帮助您走得更远。即使模型正确地通过了问题的推理，对于较大的数字或复杂的运算，它仍可能在个别数学操作上出错。这是您早些时候看到的一个示例，其中LLM试图像计算器一样工作，但得到了错误的答案。

www.zeeklog.com - LLMs Python解释器程序辅助语言模型（PAL）Program-aided language models (PAL)

请记住，这个模型实际上没有进行任何真正的数学运算。它只是尝试预测完成提示的最有可能的标记。模型在数学上出错可能会对您的用例产生许多负面影响，具体取决于您的用例，例如向客户收取错误的总额或获取食谱中的测量值不正确。

您可以通过允许您的模型与擅长数学的外部应用程序（例如Python解释器）进行交互来克服这一限制。一种有趣的增强LLM的框架是称为“辅助编程语言模型Program-aided language models ”（PAL）的程序。这项工作首次由卡内基梅隆大学的Luyu Gao和合作者于2022年提出，将LLM与外部代码解释器配对以执行计算。该方法利用链式思维提示来生成可执行的Python脚本。模型生成的脚本将传递给解释器以执行。右侧的图像来自论文，显示了一些示例提示和完成。

您稍后将在示例中了解这些示例，所以现在不必担心阅读所有细节。

PAL背后的策略是使LLM生成包含计算机代码的推理步骤的完成。然后将此代码传递给解释器以执行解决问题所需的计算。您可以通过在提示中包含一些单个或少量推理的示例来指定模型的输出格式。

让我们更详细地看一下这些示例提示的结构。

您将继续使用Roger购买网球的故事作为单次示例。此设置现在应该看起来很熟悉。这是一个链式思维示例。
您可以在突出显示为蓝色的行上以文字形式看到推理步骤。

与您之前看到的提示不同之处在于，粉红色显示的Python代码行包含了将涉及计算的推理步骤转化为代码的行。

基于每个推理步骤中的文本声明变量。它们的值可以直接分配，就像这里的第一行代码一样，

或者使用推理文本中的数字进行计算，正如您在第二行Python代码中看到的那样。

模型还可以使用它在其他步骤中创建的变量，就像您在第三行中看到的那样。

请注意，每个推理步骤的文本以井号(#)开始，以便Python解释器可以将其跳过作为注释。

这个提示以要解决的新问题结束。在这种情况下，目标是确定一个面包店在一天的销售后和从一家杂货店合作伙伴那里退回一些面包后剩下多少面包。

在右侧，您可以看到LLM生成的完成。再次，链式思维的推理步骤显示为蓝色，Python代码显示为粉红色。正如您所看到的，模型创建了多个变量来跟踪烘焙的面包、一天中各个时间段销售的面包

以及杂货店退回的面包。

然后通过在这些变量上执行算术运算来计算答案。

模型正确地确定了应该添加或减去哪些术语以获得正确的总数。

现在您知道如何构建示例，以告诉LLM根据其推理步骤编写Python脚本，让我们来看看PAL框架如何使LLM能够与外部解释器进行交互。

为了准备使用PAL进行推理，您将格式化提示以包含一个或多个示例。
每个示例应包含一个问题，后面是解决问题的Python代码行的推理步骤。
接下来，您将附加您希望回答的新问题到提示模板中。
您生成的PAL格式提示现在包含示例和要解决的问题。
接下来，您将传递此组合提示给您的LLM，
然后LLM将生成一个以示例中的提示为基础的Python脚本形式的完成。
现在，您可以将脚本交给Python解释器，用于运行代码并生成答案。

对于前一幻灯片上看到的面包店示例脚本，答案是74。您现在将附加包含答案的文本，因为您知道答案是正确的，因为计算是在PAL格式的提示中进行的。到此为止，您的提示包含了上下文中的正确答案。

现在，当您将更新后的提示传递给LLM时，它将生成包含正确答案的完成。鉴于面包店面包问题中的数学相对简单，模型可能已经使用链式思维提示正确地得出了答案。

但是对于更复杂的数学问题，包括大数的算术、三角学或微积分，PAL是一种强大的技术，允许您确保您的应用程序执行的任何计算都是准确可靠的。

您可能想知道如何自动化此过程，以便不必手动在LLM和解释器之间传递信息。这就是您之前看到的编排器的用处。

所示的编排器作为黄色框是一个技术组件，可以管理信息流和对外部数据源或应用程序的调用的启动。它还可以根据LLM输出中包含的信息来决定采取什么行动。

请记住，LLM是您的应用程序的推理引擎。最终，它会创建编排器将解释和执行的计划。

在PAL中，只有一个要执行的操作，即执行Python代码。LLM实际上不必决定运行代码，它只需要编写脚本，然后编排器将其传递给外部解释器以运行。

但是，大多数现实世界的应用程序可能会比简单的PAL架构复杂得多。

您的用例可能需要与多个外部数据源进行交互。正如您在商店示例中看到的，您可能需要处理多个决策点、验证操作和对外部应用程序的调用。您如何使用LLM来支持更复杂的应用程序？让我们在下一个视频中探讨一种策略。

Reference

https://www.coursera.org/learn/generative-ai-with-llms/lecture/6jh5Z/program-aided-language-models-pal

【OpenClaw从入门到精通】第10篇：OpenClaw生产环境部署全攻略：性能优化+安全加固+监控运维（2026实测版）

摘要：本文聚焦OpenClaw从测试环境走向生产环境的核心痛点，围绕“性能优化、安全加固、监控运维”三大维度展开实操讲解。先明确生产环境硬件/系统选型标准，再通过硬件层资源管控、模型调度策略、缓存优化等手段提升响应速度（实测响应效率提升50%+）；接着从网络、权限、数据三层构建安全防护体系，集成火山引擎安全方案拦截高危操作；最后落地TenacitOS可视化监控与Prometheus告警体系，配套完整故障排查清单和虚拟实战案例。全文所有配置、代码均经实测验证，兼顾新手入门实操性和进阶读者的生产级部署需求，帮助开发者真正实现OpenClaw从“能用”到“放心用”的跨越。优质专栏欢迎订阅！【DeepSeek深度应用】【Python高阶开发：AI自动化与数据工程实战】【YOLOv11工业级实战】【机器视觉：C# + HALCON】【大模型微调实战：平民级微调技术全解】【人工智能之深度学习】【AI 赋能：Python 人工智能应用实战】【数字孪生与仿真技术实战指南】【AI工程化落地与YOLOv8/v9实战】【C#工业上位机高级应用：高并发通信+性能优化】【Java生产级避坑指南：

ARM Linux 驱动开发篇--- Linux 并发与竞争实验（互斥体实现 LED 设备互斥访问）--- Ubuntu20.04互斥体实验

🎬 渡水无言：个人主页渡水无言 ❄专栏传送门：《linux专栏》《嵌入式linux驱动开发》《linux系统移植专栏》 ❄专栏传送门：《freertos专栏》《STM32 HAL库专栏》 ⭐️流水不争先，争的是滔滔不绝 📚博主简介：第二十届中国研究生电子设计竞赛全国二等奖 |国家奖学金 | 省级三好学生 | 省级优秀毕业生获得者 | ZEEKLOG新星杯TOP18 | 半导纵横专栏博主 | 211在读研究生在这里主要分享自己学习的linux嵌入式领域知识；有分享错误或者不足的地方欢迎大佬指导，也欢迎各位大佬互相三连目录前言一、实验基础说明 1.1、互斥体简介 1.2 本次实验设计思路二、硬件原理分析（看过之前博客的可以忽略）三、实验程序编写 3.1 互斥体 LED 驱动代码（mutex.c） 3.2.1、设备结构体定义（28-39

Flutter for OpenHarmony：swagger_dart_code_generator 接口代码自动化生成的救星（OpenAPI/Swagger）深度解析与鸿蒙适配指南

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net 前言后端工程师扔给你一个 Swagger (OpenAPI) 文档地址，你会怎么做？ 1. 对着文档，手写 Dart Model 类（容易写错字段类型）。 2. 手写 Retrofit/Dio 的 API 接口定义（容易拼错 URL）。 3. 当后端修改了字段名，你对着报错修半天。这是重复劳动的地狱。 swagger_dart_code_generator 可以将 Swagger (JSON/YAML) 文件直接转换为高质量的 Dart 代码，包括： * Model 类：支持 json_serializable，带 fromJson/

Linux 开发别再卡壳！makefile/git/gdb 全流程实操 + 作业解析，新手看完直接用----《Hello Linux!》(5)

文章目录 * 前言 * make/makefile * 文件的三个时间 * Linux第一个小程序－进度条 * 回车和换行 * 缓冲区 * 程序的代码展示 * git指令 * 关于gitee * Linux调试器-gdb使用 * 作业部分前言做 Linux 开发时，你是不是也遇到过这些 “卡脖子” 时刻？写 makefile 时，明明语法没错却报错，最后发现是依赖方法行没加 Tab；想提交代码到 gitee，记不清 git add/commit/push 的 “三板斧”，还得反复搜教程；用 gdb 调试程序，输了命令没反应，才想起编译时没加-g生成 debug 版本；甚至连写个进度条，都搞不懂\r和\n的区别，导致进度条乱跳…… 其实这些问题，

Reference

Read more

【OpenClaw从入门到精通】第10篇：OpenClaw生产环境部署全攻略：性能优化+安全加固+监控运维（2026实测版）

ARM Linux 驱动开发篇--- Linux 并发与竞争实验（互斥体实现 LED 设备互斥访问）--- Ubuntu20.04互斥体实验

Flutter for OpenHarmony：swagger_dart_code_generator 接口代码自动化生成的救星（OpenAPI/Swagger） 深度解析与鸿蒙适配指南

Linux 开发别再卡壳！makefile/git/gdb 全流程实操 + 作业解析，新手看完直接用----《Hello Linux!》(5)

Flutter for OpenHarmony：swagger_dart_code_generator 接口代码自动化生成的救星（OpenAPI/Swagger）深度解析与鸿蒙适配指南