跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

大模型应用优化:提示工程、RAG 与微调等 5 种方法

综述由AI生成大模型在特定场景下存在知识滞后或领域适配不足的问题,需要通过技术手段进行优化。五种主要方法:优化提示词以引导输出,利用 RAG 接入外部知识库增强事实准确性,通过微调更新模型参数以适应特定领域,根据需求更换更适合的模型,以及使用多模态大模型处理图文音视频混合任务。文章分析了各方法的优缺点及适用场景,为开发者提供了从低成本提示工程到高阶微调的选型参考。

板砖工程师发布于 2025/2/7更新于 2026/6/228 浏览
大模型应用优化:提示工程、RAG 与微调等 5 种方法

大模型应用优化:提示工程、RAG 与微调等 5 种方法

设想一下,你现在可以使用 Kimi、智谱清言、Stable Diffusion、ChatGPT 等大模型或者 AI 工具,甚至将大模型的 API 嵌入到你的项目中。

然而,预训练的大模型虽然强大,但不是万能的。比如你问大模型你写的文章信息,因没有文章语料,它就无法回答。你想让大模型回答医学问题,它可能泛泛而谈。

大模型依赖于大量互联网数据进行训练,虽然覆盖面广,但在特定情境下往往无法提供精准的答案。为此,你需要对大模型进行改造,让它更好地满足你的需求。

用于优化和增强大模型能力的方法主要有:提示工程、RAG(检索增强生成)、微调、更换大模型、使用多模态大模型。

简单来说,一种方法是不改变模型本身,那就优化提示词,使用外部知识库(技术是:RAG)。另一种方法是改变大模型参数(技术是:微调)。此外,还可以换一个大模型,或者使用多模态大模型。

1. 优化提示词

当大模型的输出内容不满足你的期望时,你可以选择优化提示词,直到优化到不能优化。

![图:使用提示词生成答案示意]

依据大模型的能力、特点和局限,选择合适的提示词,能够让大模型生成更符合你特定要求的输出。

例如,你想用 AI 批量生成小红书文案,你可以在提示词中,详细说明目标受众、语气、文章结构,引导大模型生成小红书风格的文案。

你可以设计一系列提示词模版,这样每次都可以调用,提高复用性。

2. 使用外部知识库

通过检索增强生成(RAG),大模型会首先从外部知识库(比如你写的文章)中查找并收集相关信息,然后使用检索到的信息和预先存在的知识,更准确地回答问题。

![图:RAG 工作流程示意]

RAG 让模型具备特定领域的知识,从而表现得更好。

外部知识库可以是公司产品说明、教程或用户指南;客服回答的问题、聊天记录;公司政策文件、标准操作程序;你写过的文章等等。

使用何种外部知识库,取决于你的目标。

使用外部知识库,最直接的方式是在 AI 机器人聊天页面上传文档,开启对话。你也可以尝试扣子(Coze)等平台。

![图:上传文档让 AI 解读示例]

但是这种做法也有局限。如果你不想文档泄漏,或者公司里面有成千上万个文档,你就需要借助新的工具或者运用,甚至开发专用的应用。

下图是一些常用的 RAG 工具,这些工具在 Github 上 Star 较多。

![图:常见 RAG 工具列表]

案例:某科技公司将 RAG 应用于其客户支持系统,大模型通过检索公司内部的技术文档和历史支持记录,能够在几秒钟内为客户提供精准的解决方案,大大提高了客户满意度和支持效率。

3. 微调大模型

微调是指在预训练大模型的基础上,进一步在较小的、特定领域的数据集上进行训练。

![图:微调示意]

微调有助于让大模型更满足特定需求。

例如,你想让大模型翻译地方方言更准确,那可以使用地方方言数据集微调大模型。

与 RAG 不同,RAG 是使用外部信息增强模型的知识,而微调则是更新模型的参数,使其更好地适应你的领域或任务。

当你拥有某个领域特定的数据时,微调特别有用。

案例:如果你想构建一个法律大模型,可以用法律文件、法律案例和合同等数据微调模型。使其在法律文件分析和合同审查中表现出色,能够快速识别潜在风险和异常条款,帮助律师更高效地完成工作。

4. 换一个大模型

除了上面的方法外,你还可以换一个模型,并非一定要拘泥于使用一个模型。

模型和模型之间能力有所差别。有些模型更擅长写出流畅的中文,有的则更擅长数据分析或者长文本处理、写代码。

![图:不同大模型公司对大模型能力的描述]

成本也有所差别。当然还有其他差别,如推理速度、上下文窗口大小等。

![图:不同大模型的成本对比]

5. 使用多模态大模型

模型不仅仅只能处理文本,还可以处理图像、音频、视频等。多模态大模型可以同时处理文本、图像等。

很多应用场景需要多模态技术支持才能实现。比如,借助多模态技术,让视力受损的人能轻松浏览网络,甚至在真实世界中充当导航。

![图:GPT-4V 展示的多模态使用例子]

假设你在开发一个内容创作平台,帮助博主和营销人员制作引人入胜的文章。有了多模态大模型,用户输入提示词,AI 会生成一篇精美、有吸引力的文章,还会附带相关的图片。

目前多模态大模型正在快速发展中。

![图:多模态大模型发展现状]

总结与选型建议

在实际项目中,选择哪种方法取决于具体的业务场景、数据情况和预算限制。

  1. 提示工程:成本最低,见效最快,适合通用任务优化,但受限于模型原生能力。
  2. RAG:适合需要引用私有数据、实时数据的场景,无需重新训练模型,维护成本适中。
  3. 微调:适合需要深度定制风格、术语或逻辑的场景,数据质量要求高,训练成本较高。
  4. 更换模型:适合当前模型无法满足性能上限的情况,需评估 API 成本和兼容性。
  5. 多模态:适合涉及视觉、听觉交互的复杂应用,技术门槛相对较高。

综合来看,通常建议先尝试提示工程和 RAG,若效果仍不理想再考虑微调或多模态方案。

目录

  1. 大模型应用优化:提示工程、RAG 与微调等 5 种方法
  2. 1. 优化提示词
  3. 2. 使用外部知识库
  4. 3. 微调大模型
  5. 4. 换一个大模型
  6. 5. 使用多模态大模型
  7. 总结与选型建议
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Stable Diffusion WebUI Forge 模型评估实战指南:三大核心指标解析
  • 树莓派 4B 连接大疆 M300 无人机开发教程
  • Claude Code 本地配置与使用指南
  • Llama Factory 微调显存计算器与云端资源配置
  • 利用 JuiceSSH 和 cpolar 实现手机远程管理 Linux 服务器
  • Docker 搭建 MySQL 主从服务实战操作详解
  • LangChain 实战:大模型对话记忆模块
  • Figma MCP 组件转前端代码工具实践
  • Llama-2-7B 在昇腾 NPU 上的性能测评与部署实践
  • Node.js 版本管理指南:卸载、安装 NVM 及常见问题解决
  • Python 自动化办公:基于 openpyxl 实现 Excel 数据汇总与填充
  • 基于 xxxwww 的电商爬虫系统实战与优化
  • 基于导航变量的多目标粒子群优化算法 NMOPSO 在无人机三维路径规划中的应用
  • Flutter 组件 tavily_dart 在鸿蒙平台的适配与 AI 搜索集成实战
  • Stable Diffusion 秋叶整合包本地部署与使用指南
  • Stable Diffusion 局部重绘修复细节教程:以发饰为例
  • 复杂前端项目多端适配实战:WebGL/Cesium/音视频跨端落地
  • Maxar Open Data:开源卫星影像数据集完整指南
  • Java 四年开发:美团百度阿里面试复盘与心得
  • 3DMAX 局部渲染设置教程:VR 与原生方案

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online