OpenAI 演讲：通过 API 将大模型集成到应用程序中

OpenAI 演讲解析了通过 API 将大模型集成到应用程序的方法。内容涵盖语言模型的工作原理与局限性，重点讲解了函数调用功能（Function Calling）如何将模型与外部工具连接。通过三个演示案例展示了自然语言转 SQL、调用外部 API 及代码审查的应用。问答环节讨论了错误处理策略、数据隐私安全、并行调用支持及权限控制等实际问题。

leon发布于 2025/2/6更新于 2026/7/2739 浏览

OpenAI 演讲：如何通过 API 将大模型集成到自己的应用程序中

OpenAI 的员工 Sherwin Wu 和 Atty Eleti 在 QCon 上讨论了如何使用 OpenAI API 将这些大语言模型集成到应用程序中，并通过使用 API 和工具将 GPT 连接到外部世界以扩展 GPT 的功能。

Atty Eleti：我想带大家回到 1973 年，也就是 50 年前。1973 年，《科学美国人》（Scientific American）发表了一篇非常有趣的文章，他们在文章中比较了各种动物的运动。他们着手比较运动的效率。换句话说，一只动物从 A 点到 B 点燃烧了多少卡路里，与它们的体重等是否有关？他们比较了各种动物，鸟类、昆虫，当然还有我们人类，并将它们根据效率从高到低进行了排名。他们发现，就运动的效率而言，秃鹫的最高。

秃鹫是一种美丽的鸟类，原产于加利福尼亚州和南美洲的一些地区，有时它可以飞数百英里而无需扇动翅膀。它具有非常好的滑翔能力。另一方面，人类行走，在榜单中的排名相当平庸，大约排在榜单三分之一的位置。《科学美国人》这篇文章的精妙之处在于，除了所有物种之外，他们还增加了一个项目，那就是骑自行车的人。骑自行车的人在竞争中大获全胜，击败了所有竞争对手，其运动效率几乎是秃鹫的两倍。

我很喜欢这个故事，因为它有一个很简单的认识，只要用一点工具，有一点机械帮助，我们就能极大地增强我们的能力。你们中的一些人可能以前听过这个故事。你可能会想，我是在哪里看到的？这个故事是苹果公司创立之初史蒂夫·乔布斯（Steve Jobs）经常讲的。他和苹果团队利用这个故事作为早期 Macintosh 的灵感来源。史蒂夫比较了这个故事，并说到：'人类是工具的制造者。'

我们制造了像自行车这样的工具来增强我们完成任务的能力。就像自行车是运动的工具一样，计算机也是我们思维的工具。它增强了我们的能力、创造力、想象力和生产力。事实上，史蒂夫曾经用这个神奇的短语来形容个人计算机。他说：'计算机是思维的自行车'。这篇文章发表十年后的 1983 年，苹果公司发布了 Macintosh，并掀起了个人计算的革命。当然，多年后的今天，我们仍然每天都在使用 mac 电脑。

2023——人工智能和语言模型

那是 1973 年。现在是 2023 年，50 年后，计算已经发生了很大的变化。如果《科学美国人》的工作人员再次进行这项研究，我敢打赌他们会在名单上再增加一个'物种'。对我们大多数人来说，这个'物种'在公众的想象中只存在了大约六个月的时间。我谈论当然是人工智能，或者具体来说是语言模型。

自去年 11 月 ChatGPT 推出以来，人工智能和语言模型已经在全球范围内引起了公众的广泛关注。更令人兴奋的是，它们吸引了世界各地开发者的想象力。我们已经看到很多人将人工智能集成到他们的应用程序中，使用语言模型来构建全新的产品，并提出与计算机交互的全新方式。自然语言交互终于成为了可能，并且质量很高。但这存在局限性，也存在问题。对于任何使用过 ChatGPT 的人来说，我们都知道它的训练数据是 2021 年 9 月之前的，所以它不知道当前的事件。

在大多数情况下，像 ChatGPT 这样的语言模型是根据训练中的记忆进行操作的，因此它们与当前事件或所有 API、我们每天使用的自己的应用程序和网站无关。或者，如果你在一家公司工作，它不会连接到你公司的数据库和你公司的内部知识库等等。这使得语言模型的使用受到了限制。你可以写一首诗，可以写一篇文章，可以从中得到一个很棒的笑话，可以搜索一些东西。但如何将语言模型与外部世界联系起来呢？如何增强人工智能的能力，让它来代表你执行行动，让它做比它固有能力更多的事情呢？

概述

如果计算机是思维的自行车，那么人工智能思维的自行车是什么？这就是我们要探讨的问题：一辆人工智能思维的自行车。我们将讨论 GPT，这是 OpenAI 开发的一组旗舰语言模型，以及如何将它们与工具或外部 API 和函数集成，以支持全新的应用程序。我叫 Atty。是 OpenAI 的一名工程师。Sherwin 是我的搭档，我们是 OpenAI 的 API 团队的成员，共同构建了 OpenAI API 和其他各种开发者产品。

我们将讨论三件事。首先，我们将讨论语言模型及其局限性。我们将快速介绍它们是什么以及它们是如何工作的。先培养下对它们的直观认识。然后还要了解它们的不足之处。其次，我们将讨论我们发布的一个全新特性，即使用 GPT 进行函数调用。函数调用是将 OpenAI 的 GPT 模型插入外部世界并让它执行操作的方式。最后，我们将通过三个快速演示样例来演示如何使用 OpenAI 模型和 GPT 函数调用功能，并将其集成到公司产品和辅助项目中。

大语言模型（LLMs）及其局限性

Sherwin Wu：首先，我想对 LLM 做一个非常高层级的概述：它们做什么，它们是什么，它们如何工作。然后再谈谈它们开箱即用的一些限制。对于那些已经关注这个领域一段时间的人来说，这可能是你们都知道的信息，但我只是想在深入讨论细节之前确保我们都能达成共识。

非常高层级的 GPT 模型，包括 ChatGPT、GPT-4、GPT-3.5-turbo，它们都是我们所说的自回归语言模型。这意味着它们是巨大的人工智能模型，它们接受过庞大的数据集的训练，包括互联网、维基百科、公共 GitHub 代码和其他授权材料。它们被称为自回归，因为它们所做的只是综合所有这些信息。它们接受一个 prompt，或者我们可以称之为上下文。它们查看 prompt。然后它们基本上只是决定，给定这个 prompt，给定这个输入，下一个单词应该是什么？它实际上只是在预测下一个单词。

OpenAI 演讲：如何通过 API 将大模型集成到自己的应用程序中