DayDayUp：2025，再见了——2025年末人工智能大模型技术干货分享—《从预训练到智能体：剖析现代LLM的技术全景—发展历史、核心技术、前沿应用、工程实战、未来展望》

Ne0inhk

21 Mar 2026 — 16 min read

导读：大家好！又到了年末，现在已经是 2025 年 12 月 31 日的23点15了，还有不到1个小时，我们就将正式迈入 2026 年——在这里先提前跟大家拜个早年：祝大家新年快乐、迎好运、发大财，愿新的一年里我们都有新的突破。
对我个人而言，2025 是既忙碌又充实的一年：年中出版了几本期待已久的著作—《语言之舞：大语言模型应用实战全书》、《数据驱动：机器学习实战之道》，社区影响力也有了新的增长（在国内多个技术社区持续输出内容并获得大量读者反馈），同时，新书销量也呈指数式突破。而我在 2025 年底整理并发布的这份讲稿《从预训练到智能体：剖析现代 LLM 的技术全景》也于国内AI技术论坛大会上在 2025 年12月28日正式发布(现场演讲视频链接)，作为年终的技术总结和实践手册，希望能把这一年社区积累的经验、教训与思考交给大家作参考。此外，更让我兴奋的是，正在推进的几本 2026 年新书也已进入出版社的冲刺阶段——也真心希望它们能如期与大家见面，继续为读者带来新的视角、实战方法和不少技术上的震撼，也希望这些输出能在你们的新一年里提供切实的帮助与启发。
当然，博主依旧遵循每年一次的技术分享传统，并受邀在国内 AI 技术社区做此次主题演讲。作为百万粉丝博主—“一个处女座的程序猿”的头衔，我习惯把大问题拆成一系列可检验的小步：把数据、模型、训练、评估、工程化应用，再到智能体与多智能体协作的设计细节，一页页摊给大家看；既讲原理，也讲工程实现与典型踩坑，力求做到“看得懂、能落地、能复用”。

过去这一年，LLM 的能力与工程实践进入了一个“加速度”阶段：提示工程不再只是技巧派的花招，而在向系统化方法论演进；RAG 从学术示例走向企业级知识检索链路并承担关键业务场景；Agent 也从概念验证逐步对接外部工具、走向多智能体编排的工程现实。本次分享我试图用三条主线带大家把全景看清楚：过去【为什么会有今天的 LLM】：回顾 SLM→NLM→PLM→LLM 的演进逻辑，理解“规模+数据+工程”如何催生涌现能力；现在【我们如何做】：从大规模数据采集与清洗、模型选择到典型的三段式训练流程（Pretrain → SFT → RL），并重点讲解 RAG 与 Agent 在生产环境中的工程化要点与常见陷阱；未来【该怎么准备】：探讨垂直专用化与轻量化并行、多模态深度融合、Agent 工程化与治理等，将这些趋势与开发者、企业的实际准备工作对接。

写这份 PPT 的初衷很简单：把我在写书与实战里总结出的那些“少走弯路”的经验、常见踩坑、工程化技巧和可复用模版分享出来——既不过度学术化，也尽量避免空洞口号。
读完这份材料，你拿到的应该是：一张能在团队里做 Roadmap 的技术地图，一套能直接落地的工程实践清单，以及若干可以立刻在项目中验证的 prompt / RAG / agent 模板（顺带一提，若你是处女座，欢迎和我互换笔记😉）。

历年年度总结

2024年

LLMs：LLM一天，人间一年—2024年度大模型技术三+四大趋势梳理(数据/算法/算力+RAG/Agent/Text2SQQL/混合部署)与2025年大模型技术趋势(强大推理/多模态)展望和探讨

2023年

2022年

Article：AI领域2021年度总结与2022年度展望：多模态人工智能起飞、万亿参数模型的爆发、生成模型在音乐电影制作上的进展、Transformer架构正在以一己之力统一AI江湖、AI法律监管

DS/ML：数据科学技术之机器学习领域六大阶段最强学习路线(初步探索性数据分析EDA→数据预处理/广义的特征工程→模型训练/评估/推理→模型分析/反思/再优化→模型部署与监控→模型全流程优化)详解

2021年

DayDayUp：2021，再见了，无论是躺平还是内卷—愿大家改变不可接受的，接受不可改变的—心若有向往，何惧道阻且长！

2020年

DayDayUp：2020，再见了，不平凡的一年，让我懂得了珍惜，让我明白了越努力越幸运

《从预训练到智能体：剖析现代LLM的技术全景》

个人简介

近几年受邀参加的AI业界的一些活动

2025年，出版了AI业界的2本畅销书：《语言之舞：大语言模型应用实战全书》、《数据驱动：机器学习实战之道》

历年年度总结

2024年

LLMs：LLM一天，人间一年—2024年度大模型技术三+四大趋势梳理(数据/算法/算力+RAG/Agent/Text2SQQL/混合部署)与2025年大模型技术趋势(强大推理/多模态)展望和探讨

https://yunyaniu.blog.ZEEKLOG.net/article/details/144859574

2023年

2022年

Article：AI领域2021年度总结与2022年度展望：多模态人工智能起飞、万亿参数模型的爆发、生成模型在音乐电影制作上的进展、Transformer架构正在以一己之力统一AI江湖、AI法律监管

https://yunyaniu.blog.ZEEKLOG.net/article/details/122261357

DS/ML：数据科学技术之机器学习领域六大阶段最强学习路线(初步探索性数据分析EDA→数据预处理/广义的特征工程→模型训练/评估/推理→模型分析/反思/再优化→模型部署与监控→模型全流程优化)详解

https://yunyaniu.blog.ZEEKLOG.net/article/details/128509774

2021年

DayDayUp：2021，再见了，无论是躺平还是内卷—愿大家改变不可接受的，接受不可改变的—心若有向往，何惧道阻且长！

https://yunyaniu.blog.ZEEKLOG.net/article/details/122261584

2020年

DayDayUp：2020，再见了，不平凡的一年，让我懂得了珍惜，让我明白了越努力越幸运

https://yunyaniu.blog.ZEEKLOG.net/article/details/112040074

《从预训练到智能体：剖析现代LLM的技术全景》

个人简介

近几年受邀参加的AI业界的一些活动

彩蛋：2026年有几个AI业界的大型论坛活动，已受邀请，敬请期待呀！

2025年，出版了AI业界的2本畅销书：《语言之舞：大语言模型应用实战全书》、《数据驱动：机器学习实战之道》

AI：新书预告—从机器学习避坑指南(分类/回归/聚类/可解释性)到大语言模型落地手记(RAG/Agent/MCP)，一场耗时5+3年的技术沉淀—“代码可跑，经验可抄”—【一个处女座的程序猿】携两本AI实战书终于正式来了！

https://yunyaniu.blog.ZEEKLOG.net/article/details/149370861

本次PPT目录概览

第一章：大语言模型的发展历史

主题：从语言建模到通用智能的四次浪潮

这一部分，我主要从“语言建模范式演进”的视角，系统回顾了大语言模型从 SLM → NLM → PLM → LLM 的四个阶段演化过程。
重点分析了 LLM 相较于传统 PLM 的本质变化：规模驱动的涌现能力、提示驱动的使用范式，以及系统级工程复杂度的跃迁。

同时，我结合 GPT 家族等代表性模型的发展路径，梳理了当前主流大模型的技术源流，帮助听众建立对 LLM 的历史纵深认知。

第二章：大语言模型的核心技术

主题：LLM 背后的工程与算法全景

这一章聚焦“大模型是如何被真正构建出来的”，从工程角度系统拆解了 LLM 的核心技术栈，主要包括四个层面：

数据层：大规模语料的采集、清洗与预处理逻辑
模型层：AE / AR / Seq2Seq 三大基座结构与主流建模范式
训练层：Pretrain → SFT → RLHF 的三阶段训练体系
评估层：面向能力、泛化与安全性的评估体系设计

这一部分的目标，是帮助大家理解：LLM 的能力并非“黑箱魔法”，而是工程、算法与数据长期协同的结果。

第三章：大语言模型的前沿应用

主题：从 Prompt 到 RAG，再到 Agent 的能力跃迁

这是本次分享中最核心、也最贴近实践的一章，我从三个关键技术方向展开：

Prompt Engineering（提示工程）
- 从 ICL、CoT 到复杂任务规划（PCT）
- 结合主流 Prompt 框架，总结可复用的方法论
RAG（检索增强生成）
- 系统讲解 RAG 的工程架构、演进路径与失败案例
- 从“检索-生成”走向“Agentic RAG”的智能升级
AI Agent 与 Multi-Agent
- Agent 的行动逻辑（SPAR 框架）
- 多 Agent 协作模式、通信协议（MCP / A2A）
- Agentic AI 作为下一代应用范式的整体图景

这一章的核心结论是：