跳到主要内容

极客日志面向AI+效率的开发者社区

首页博客 GitHub 精选镜像 AI 生图工具 UI配色美学隐私政策关于联系

搜索内容 / 工具 / 仓库 / 镜像...⌘K 搜索

大模型 LLM 四阶段技术详解：从提示工程到预训练 | 极客日志

PythonAI算法

大模型 LLM 四阶段技术详解：从提示工程到预训练

大模型技术发展涵盖提示工程、智能体、微调及预训练四个关键阶段。提示工程通过优化输入引导模型输出；智能体结合工具与推理实现自主任务；微调利用特定数据适配领域任务；预训练则基于海量无标签数据构建通用能力。详细解析各阶段原理、应用场景及技术价值，帮助理解大模型演进路径。

月亮邮递员发布于 2025/2/7更新于 2026/7/2039 浏览

大模型 LLM 四阶段技术详解：从提示工程到预训练

大模型 LLM 四阶段技术详解

随着人工智能技术的飞速发展，大型语言模型（LLM）已成为推动行业变革的核心力量。理解大模型的技术演进路径，对于开发者、研究人员及企业决策者至关重要。本文将深入探讨大模型发展的四个关键阶段：提示工程（Prompt Engineering）、智能体（AI Agent）、微调（Fine-tuning）以及预训练（Pre-training）。这四个阶段层层递进，共同构成了当前大模型应用与开发的完整技术体系。

一、阶段一：提示工程 (Prompt Engineering)

1. 什么是提示工程？

提示工程是指设计和优化输入给大型语言模型的文本提示（Prompt）的过程。这些提示旨在引导 LLM 生成符合期望的、高质量的输出。Prompt 如同钥匙一般，能够精确引导模型生成特定需求的输出。

LLM 四阶段技术示意图

2. 核心要素

Prompt Engineering 的核心要素在于通过明确的指示、相关的上下文、具体的例子以及准确的输入来精心设计提示。主要包含以下策略：

零样本提示 (Zero-shot Prompting)：直接给出指令，不提供示例。适用于通用任务。
少样本提示 (Few-shot Prompting)：在指令中提供少量输入输出示例，帮助模型理解任务模式。
思维链 (Chain of Thought, CoT)：引导模型在生成最终答案前展示推理步骤，显著提升复杂逻辑任务的表现。

3. 为什么需要提示工程？

尽管大语言模型本身已具备极高的性能与复杂性，但还有很大潜力需要挖掘。通过不断优化 prompt，我们可以建立更加清晰、有效的沟通渠道，充分发挥 LLM 在语言理解和生成方面的优势。提升沟通技巧，挖掘 LLM 潜力，是低成本获取高质量结果的关键手段。

二、阶段二：AI Agent (人工智能代理)

1. 什么是 AI Agent？

大模型 Agent 是一种构建于大型语言模型之上的智能体，它具备环境感知能力、自主理解、决策制定及执行行动的能力。Agent 是能够模拟独立思考过程，灵活调用各类工具，逐步达成预设目标。

AI Agent 架构示意

在技术架构上，Agent 从面向过程的架构转变为面向目标的架构，旨在通过感知、思考与行动的紧密结合，完成复杂任务。

2. Agent 关键技术

(1) LLM 作为核心引擎

在 Agent 技术中，大语言模型作为核心计算引擎，不仅限于文本生成，还能够进行对话、完成任务、推理，并展示一定程度的自主行为。

(2) Function Calling (函数调用)

Function Calling 在智能助手和自动化流程的应用场景中，LLM 通过调用外部 API 或预设函数来集成多样化服务与复杂操作，以满足用户请求并自动化执行流程。

场景示例：在构建智能助手时，LLM 可能需要根据用户的请求调用外部服务（如天气查询 API、数据库查询等），并将结果整合到其响应中。
自动化流程：LLM 可以通过调用预设的函数来执行一系列复杂的操作，如数据处理、文件生成等。

Function Calling 机制

(3) RAG (检索增强生成)

通过引入 RAG，LLM Agent 能够在需要时查询外部知识库，如专业数据库、学术论文、行业报告等，从而增强其知识广度和深度，解决大模型幻觉问题。

RAG 技术原理

3. 为什么需要 AI Agent？

AI Agent 作为 LLM 能力的整合者与定制化服务提供者，通过 NLP 和 HCI 技术增强交互体验，使用户能够轻松享受 LLM 带来的智能服务。

整合 LLM 能力：AI Agent 作为平台，能够无缝整合 LLM 的文本生成、理解、推理等能力。通过 Agent，用户可以直接与 LLM 进行交互，而无需深入了解 LLM 的复杂性和技术细节。
定制化服务：AI Agent 可以根据不同用户的需求和场景，定制化地利用 LLM 的能力。例如，在客户服务领域，Agent 可以根据用户的查询和问题，利用 LLM 生成准确的回答和解决方案。
增强交互体验：AI Agent 通过自然语言处理和人机交互技术，能够提供更自然、流畅的交互体验。

Agent 应用场景

三、阶段三：微调 (Fine-tuning)

1. 什么是 Fine-tuning？

Fine-Tuning 是指使用特定领域的数据集对预训练的大型语言模型进行进一步训练的过程。通过微调，模型可以学习到特定领域的知识和模式，从而在相关任务上表现更好。

在预训练模型的基础上，针对特定任务或数据领域，通过在新任务的小规模标注数据集上进一步训练和调整模型的部分或全部参数，使模型能够更好地适应新任务，提高在新任务上的性能。

微调过程示意

2. 为什么需要 Fine-tuning？

尽管预训练模型已经在大规模数据集上学到了丰富的通用特征和先验知识，但这些特征和知识可能并不完全适用于特定的目标任务。微调通过在新任务的少量标注数据上进一步训练预训练模型，使模型能够学习到与目标任务相关的特定特征和规律，从而更好地适应新任务。

3. 主流微调方法

全量微调 (Full Fine-tuning)：更新模型所有参数，效果最好但成本高昂。
参数高效微调 (PEFT)：如 LoRA (Low-Rank Adaptation)，仅更新少量参数，大幅降低显存需求，适合资源受限场景。
监督微调 (SFT)：使用高质量指令数据进行训练，使模型学会遵循指令。

微调对比

四、阶段四：预训练 (Pre-training)

1. 什么是 Pre-training？

预训练是语言模型学习的初始阶段。在预训练期间，模型会接触大量未标记的文本数据，例如书籍、文章和网站。目标是捕获文本语料库中存在的底层模式、结构和语义知识。

预训练利用大量无标签或弱标签的数据，通过某种算法模型进行训练，得到一个初步具备通用知识或能力的模型。

预训练数据分布

2. 核心技术原理

无监督学习：预训练通常是一个无监督学习过程，模型在没有明确指导或标签的情况下从未标记的文本数据中学习。
屏蔽语言建模 (Masked Language Modeling)：模型经过训练可以预测句子中缺失或屏蔽的单词、学习上下文关系并捕获语言模式。
Transformer 架构：预训练通常采用基于 Transformer 的架构，该架构擅长捕获远程依赖关系和上下文信息。

Transformer 架构

3. 为什么需要 Pre-training？

预训练是为了让模型在见到特定任务数据之前，先通过学习大量通用数据来捕获广泛有用的特征，从而提升模型在目标任务上的表现和泛化能力。

预训练技术通过从大规模未标记数据中学习通用特征和先验知识，减少对标记数据的依赖，加速并优化在有限数据集上的模型训练。

预训练价值

五、总结

大模型的四阶段技术构成了一个完整的生态闭环：

预训练奠定了模型的通用认知基础。
微调将通用能力转化为特定领域的专业能力。
提示工程提供了无需修改模型参数的快速适配方案。
AI Agent则在此基础上实现了自主规划与工具调用的智能化升级。

理解这四个阶段的内在联系与技术细节，有助于我们更准确地选择技术方案，构建高效、可靠的大模型应用系统。随着技术的不断迭代，这四个阶段也在相互融合，推动着人工智能向更高层次的通用智能迈进。

目录

大模型 LLM 四阶段技术详解
一、阶段一：提示工程 (Prompt Engineering)
1. 什么是提示工程？
2. 核心要素
3. 为什么需要提示工程？
二、阶段二：AI Agent (人工智能代理)
1. 什么是 AI Agent？
2. Agent 关键技术
(1) LLM 作为核心引擎
(2) Function Calling (函数调用)
(3) RAG (检索增强生成)
3. 为什么需要 AI Agent？
三、阶段三：微调 (Fine-tuning)
1. 什么是 Fine-tuning？
2. 为什么需要 Fine-tuning？
3. 主流微调方法
四、阶段四：预训练 (Pre-training)
1. 什么是 Pre-training？
2. 核心技术原理
3. 为什么需要 Pre-training？
五、总结

免费图片AI生成工具免费生成了解详情

Magick API 一键接入全球大模型注册送1000万token查看
免费图片视频在线生成30秒，将你的创意变成现实开始设计
X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
100+免费在线小游戏爽一把

极客日志微信公众号二维码

微信扫一扫，关注极客日志

微信公众号「极客日志V2」，在微信中扫描左侧二维码关注。展示文案：极客日志V2 zeeklog

更多推荐文章

Web 自动化测试入门指南：从概念到 Selenium 实战
AI 编程核心实践：自动化生成、低代码与算法优化
C 语言指针与复杂数据结构：链表、栈与队列实现
StableDiffusion-webui 本地部署与使用指南
数据结构：优先级队列 PriorityQueue
使用 Rokid 灵珠平台搭建旅游 AR 智能体指南
两两交换链表中的节点：指针操作详解
eBay 商品数据采集实战：基于 IPIDEA 网页抓取 API 的 Python 接入方案
OpenClaw 多 Agent 对接飞书机器人架构与配置
LLaMA Factory全攻略：从环境搭建到模型部署的一站式解决方案
C++ 入门实战指南：从环境搭建到核心概念解析
快速排序核心原理与多种实现优化详解
Java 并发编程：JUC 包中原子操作类的原理和用法
Spring Boot Web 后端开发核心注解详解
前端流式输出实现详解：从原理到实践
2025 AI 问道之旅：个人成长与深度学习理解
OpenClaw 跨平台 AI 助手完全使用指南：从安装到高级配置
RAG（检索增强生成）技术详解：原理、架构与实践指南
深度解析 KBQA 常用数据集：WebQSP 与 CWQ
OpenClaw WebUI 空白页问题解决方案

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online