大模型 AI 应用架构详解

关于大模型 AI 应用架构的文章目前并不多，在经过几次小的项目探索后，本文旨在梳理一套通用的 AI 产品架构，供开发者与产品经理参考。

如果说 2023 年是大模型基础设施爆发的一年，机会主要给了大厂或拿到大笔融资的创业者；那么 2024 年将是 AI 应用落地爆发的一年，意味着普通开发者和中小团队有更多的机会加入这一浪潮。本文将结合基于大模型的 AI 产品架构，探讨如何构建高质量的问答机器人及垂直领域应用。

1. 从 AI 产品的诉求出发看设计

一切的设计都是从需求出发，大模型 AI 产品也不例外。最近接触到的核心诉求是：如何基于自己的知识库构建专属的问答机器人。

典型场景包括：

绘本馆老板：希望通过机器人对话推荐书籍，提高社群活跃度。
留学咨询机构：希望机器人解答专业论文难题，获取留学线索。
企业内部 HR：希望通过机器人进行日常政策答疑解惑。

这些需求早已存在，但传统技术难以完美解决。早期大模型做出来的机器人常被称为'人工智障'，而当前大模型虽然能力增强，却出现了'幻觉'问题（即一本正经地胡说八道）。解决幻觉问题、确保回答基于私有数据，是 2024 年 AI 技术落地的关键趋势。

1.1 为什么不能直接用 ChatGPT？

你可能会问：直接使用 ChatGPT 不就好了吗？

对于绘本馆老板而言，ChatGPT 的通用推荐能力往往不够精准，且无法将用户沉淀在自己的业务系统中。真正的诉求通常包含以下三点：

个性化数据：问答中用到的知识库和数据（如客户标签、阅读历史）必须使用私有的。
业务逻辑融合：需要结合传统互联网的数据洞察能力（如库存状态、用户画像）给出更精准的回答。
可控的表达：强大的知识检索、整合、表达能力，这恰恰是 RAG 等架构要解决的核心。

解决这三个问题的背后，依托的是一个完整的 AI 产品架构。架构的每一层负责解决不同的问题。

2. 基于大模型的 AI 产品架构

优秀的 AI 产品架构通常分为四层：用户层、应用层、模型层和生成层。以下以问答机器人为例展开讨论。

AI 产品架构图

2.1 用户层（前端）提问

这一层的目标是营造良好的用户体验，主要由产品经理、UE、UI 负责，与传统互联网产品无异。

关键点：

无感化 AI：让用户感受不到 AI 的存在是最好的体验。在问答产品中，可能只是一个简单的对话框，甚至融入微信、钉钉等现有生态中。
主动推送：仅在必要时进行推送。例如在绘本馆场景中，仅在借阅书籍即将到期时提醒，并推荐合适的书籍。
交互唤起：当用户主动提问（如'有哪些适合 3-5 岁男孩看的绘本'）时，用户层会触发应用层处理。

2.2 应用层提问

这是区别于传统互联网的关键层，也是 AI 应用开发者的核心工作区。目标是将用户的自然语言提问加工，转化为适合模型层的 Prompt（提示词）。

处理流程：

意图识别与提示词转化 将用户简短的问题转化为专业提示词。例如按照 CRISPE 结构（Context, Role, Instruction, Style, Persona, Experiment）进行提问。这一步主要由提示词工程师完成，在小产品中由产品经理兼任。提示词需具备结构化特征，抽象成模板，以便适配不同参数（如将"3-5 岁"抽象为参数 Age）。
知识库检索（RAG） 根据提示词去检索客户已有的知识库和数据库内容。这是解决个性化诉求、降低幻觉的核心步骤。当下主要依靠 RAG（Retrieval-Augmented Generation，检索增强生成）技术。

大模型 AI 应用架构详解