DayDayUp:2025,再见了——2025年末人工智能大模型技术干货分享—《从预训练到智能体:剖析现代LLM的技术全景—发展历史、核心技术、前沿应用、工程实战、未来展望》

DayDayUp:2025,再见了——2025年末人工智能大模型技术干货分享—《从预训练到智能体:剖析现代LLM的技术全景—发展历史、核心技术、前沿应用、工程实战、未来展望》

DayDayUp:2025,再见了——2025年末人工智能大模型技术干货分享—《从预训练到智能体:剖析现代LLM的技术全景—发展历史、核心技术、前沿应用、工程实战、未来展望》

导读:大家好!又到了年末,现在已经是 2025 年 12 月 31 日的23点15了,还有不到1个小时,我们就将正式迈入 2026 年——在这里先提前跟大家拜个早年:祝大家新年快乐、迎好运、发大财,愿新的一年里我们都有新的突破。
对我个人而言,2025 是既忙碌又充实的一年:年中出版了几本期待已久的著作—《语言之舞:大语言模型应用实战全书》、《数据驱动:机器学习实战之道》,社区影响力也有了新的增长(在国内多个技术社区持续输出内容并获得大量读者反馈),同时,新书销量也呈指数式突破。而我在 2025 年底整理并发布的这份讲稿《从预训练到智能体:剖析现代 LLM 的技术全景》也于国内AI技术论坛大会上在 2025 年12月28日正式发布(现场演讲视频链接),作为年终的技术总结和实践手册,希望能把这一年社区积累的经验、教训与思考交给大家作参考。此外,更让我兴奋的是,正在推进的几本 2026 年新书也已进入出版社的冲刺阶段——也真心希望它们能如期与大家见面,继续为读者带来新的视角、实战方法和不少技术上的震撼,也希望这些输出能在你们的新一年里提供切实的帮助与启发。
当然,博主依旧遵循每年一次的技术分享传统,并受邀在国内 AI 技术社区做此次主题演讲。作为百万粉丝博主—“一个处女座的程序猿”的头衔,我习惯把大问题拆成一系列可检验的小步:把数据、模型、训练、评估、工程化应用,再到智能体与多智能体协作的设计细节,一页页摊给大家看;既讲原理,也讲工程实现与典型踩坑,力求做到“看得懂、能落地、能复用”。

过去这一年,LLM 的能力与工程实践进入了一个“加速度”阶段:提示工程不再只是技巧派的花招,而在向系统化方法论演进;RAG 从学术示例走向企业级知识检索链路并承担关键业务场景;Agent 也从概念验证逐步对接外部工具、走向多智能体编排的工程现实。本次分享我试图用三条主线带大家把全景看清楚:过去【为什么会有今天的 LLM】:回顾 SLM→NLM→PLM→LLM 的演进逻辑,理解“规模+数据+工程”如何催生涌现能力;现在【我们如何做】:从大规模数据采集与清洗、模型选择到典型的三段式训练流程(Pretrain → SFT → RL),并重点讲解 RAG 与 Agent 在生产环境中的工程化要点与常见陷阱;未来【该怎么准备】:探讨垂直专用化与轻量化并行、多模态深度融合、Agent 工程化与治理等,将这些趋势与开发者、企业的实际准备工作对接。

写这份 PPT 的初衷很简单:把我在写书与实战里总结出的那些“少走弯路”的经验、常见踩坑、工程化技巧和可复用模版分享出来——既不过度学术化,也尽量避免空洞口号。
读完这份材料,你拿到的应该是:一张能在团队里做 Roadmap 的技术地图,一套能直接落地的工程实践清单,以及若干可以立刻在项目中验证的 prompt / RAG / agent 模板(顺带一提,若你是处女座,欢迎和我互换笔记😉)。

目录

历年年度总结

2024年

LLMs:LLM一天,人间一年—2024年度大模型技术三+四大趋势梳理(数据/算法/算力+RAG/Agent/Text2SQQL/混合部署)与2025年大模型技术趋势(强大推理/多模态)展望和探讨

2023年

2022年

Article:AI领域2021年度总结与2022年度展望:多模态人工智能起飞、万亿参数模型的爆发、生成模型在音乐电影制作上的进展、Transformer架构正在以一己之力统一AI江湖、AI法律监管

DS/ML:数据科学技术之机器学习领域六大阶段最强学习路线(初步探索性数据分析EDA→数据预处理/广义的特征工程→模型训练/评估/推理→模型分析/反思/再优化→模型部署与监控→模型全流程优化)详解

2021年

DayDayUp:2021,再见了,无论是躺平还是内卷—愿大家改变不可接受的,接受不可改变的—心若有向往,何惧道阻且长!

2020年

DayDayUp:2020,再见了,不平凡的一年,让我懂得了珍惜,让我明白了越努力越幸运

《从预训练到智能体:剖析现代LLM的技术全景》

个人简介

近几年受邀参加的AI业界的一些活动

2025年,出版了AI业界的2本畅销书:《语言之舞:大语言模型应用实战全书》、《数据驱动:机器学习实战之道》

AI:新书预告—从机器学习避坑指南(分类/回归/聚类/可解释性)到大语言模型落地手记(RAG/Agent/MCP),一场耗时5+3年的技术沉淀—“代码可跑,经验可抄”—【一个处女座的程序猿】携两本AI实战书终于正式来了!

本次PPT目录概览

第一章:大语言模型的发展历史

第二章:大语言模型的核心技术

第三章:大语言模型的前沿应用

第四章:大语言模型的未来展望

致谢:低调、谦虚、自律、反思、成长

最后


历年年度总结

2024年

LLMs:LLM一天,人间一年—2024年度大模型技术三+四大趋势梳理(数据/算法/算力+RAG/Agent/Text2SQQL/混合部署)与2025年大模型技术趋势(强大推理/多模态)展望和探讨

https://yunyaniu.blog.ZEEKLOG.net/article/details/144859574

2023年

2022年

Article:AI领域2021年度总结与2022年度展望:多模态人工智能起飞、万亿参数模型的爆发、生成模型在音乐电影制作上的进展、Transformer架构正在以一己之力统一AI江湖、AI法律监管

https://yunyaniu.blog.ZEEKLOG.net/article/details/122261357

DS/ML:数据科学技术之机器学习领域六大阶段最强学习路线(初步探索性数据分析EDA→数据预处理/广义的特征工程→模型训练/评估/推理→模型分析/反思/再优化→模型部署与监控→模型全流程优化)详解

https://yunyaniu.blog.ZEEKLOG.net/article/details/128509774

2021年

DayDayUp:2021,再见了,无论是躺平还是内卷—愿大家改变不可接受的,接受不可改变的—心若有向往,何惧道阻且长!

https://yunyaniu.blog.ZEEKLOG.net/article/details/122261584

2020年

DayDayUp:2020,再见了,不平凡的一年,让我懂得了珍惜,让我明白了越努力越幸运

https://yunyaniu.blog.ZEEKLOG.net/article/details/112040074

《从预训练到智能体:剖析现代LLM的技术全景》

个人简介

近几年受邀参加的AI业界的一些活动

彩蛋:2026年有几个AI业界的大型论坛活动,已受邀请,敬请期待呀!

2025年,出版了AI业界的2本畅销书:《语言之舞:大语言模型应用实战全书》、《数据驱动:机器学习实战之道》

AI:新书预告—从机器学习避坑指南(分类/回归/聚类/可解释性)到大语言模型落地手记(RAG/Agent/MCP),一场耗时5+3年的技术沉淀—“代码可跑,经验可抄”—【一个处女座的程序猿】携两本AI实战书终于正式来了!

https://yunyaniu.blog.ZEEKLOG.net/article/details/149370861

本次PPT目录概览

第一章:大语言模型的发展历史

主题:从语言建模到通用智能的四次浪潮

这一部分,我主要从“语言建模范式演进”的视角,系统回顾了大语言模型从 SLM → NLM → PLM → LLM 的四个阶段演化过程。
重点分析了 LLM 相较于传统 PLM 的本质变化:规模驱动的涌现能力、提示驱动的使用范式,以及系统级工程复杂度的跃迁

同时,我结合 GPT 家族等代表性模型的发展路径,梳理了当前主流大模型的技术源流,帮助听众建立对 LLM 的历史纵深认知

第二章:大语言模型的核心技术

主题:LLM 背后的工程与算法全景

这一章聚焦“大模型是如何被真正构建出来的”,从工程角度系统拆解了 LLM 的核心技术栈,主要包括四个层面:

  • 数据层:大规模语料的采集、清洗与预处理逻辑
  • 模型层:AE / AR / Seq2Seq 三大基座结构与主流建模范式
  • 训练层:Pretrain → SFT → RLHF 的三阶段训练体系
  • 评估层:面向能力、泛化与安全性的评估体系设计

这一部分的目标,是帮助大家理解:LLM 的能力并非“黑箱魔法”,而是工程、算法与数据长期协同的结果

第三章:大语言模型的前沿应用

主题:从 Prompt 到 RAG,再到 Agent 的能力跃迁

这是本次分享中最核心、也最贴近实践的一章,我从三个关键技术方向展开:

  1. Prompt Engineering(提示工程)
    • 从 ICL、CoT 到复杂任务规划(PCT)
    • 结合主流 Prompt 框架,总结可复用的方法论
  2. RAG(检索增强生成)
    • 系统讲解 RAG 的工程架构、演进路径与失败案例
    • 从“检索-生成”走向“Agentic RAG”的智能升级
  3. AI Agent 与 Multi-Agent
    • Agent 的行动逻辑(SPAR 框架)
    • 多 Agent 协作模式、通信协议(MCP / A2A)
    • Agentic AI 作为下一代应用范式的整体图景

这一章的核心结论是:

LLM 正在从“被动回答问题”,走向“主动理解、规划与执行任务”。

第四章:大语言模型的未来展望

主题:从模型能力到智能体生态

在最后一章,我结合 2025 年的技术现状,对 LLM 与 Agent 的未来进行了系统总结与展望,重点包括:

  • 技术趋势
    • 垂直专用化 + 轻量化并行
    • 多模态深度融合
    • 推理能力与逻辑严谨性提升
    • 自主学习与 Agentic Learning
  • 产品形态演进
    • 从工具 → 助手 → 协作者 → 数字员工
    • 最终走向 多智能体协作的智能体生态系统
  • 对开发者、企业与个人的启示
    LLM 时代,真正的竞争力不再只是“写代码”,而是设计、编排和治理智能体系统的能力

致谢:低调、谦虚、自律、反思、成长

备注:本PPT的演讲视频,包含更多图片之外的内容,也即将放出,敬请大家期待……

最后

作为一个处女座的程序猿,我对细节有一点偏执:既喜欢把复杂的问题拆成可验证的小步骤,也愿意把那些踩过的坑用清单的方式留给后人——所以今天的分享既有高度,也有可以拿去复现的实操点,真心希望它能在你的项目或论文里派上用场。

此外,我还要感谢:在2025年,那些邀请我演讲的社区与主办方、在实战中给我提供反馈的读者与合作者、以及那些在凌晨时分帮我复现结果的朋友们,以及多次在论坛中交流的各位大佬们。没有你们,我的“处女座清单”里少不了很多漏洞。

再说一句:技术是长期活,不是速成班;愿我们都能在 2026 年少一些焦虑,多一些动手。保持好奇,保持严谨,也别忘了偶尔放下键盘,去看一场日出——处女座的程序猿也需要诗意的假期。😉

就写到这里吧,像往年一样,再次祝大家 2026 年:
新年快乐,向前走,向“钱”看!
愿新的一年里,你我都能少一些焦虑,多一些创造;
愿每一次试验、每一次失败,最终都能变成那一点点决定性进步。
最后,希望大家,依旧,保持热爱,奔赴山海!

Read more

Java 大视界 -- 基于 Java+Storm 构建实时日志分析平台:从日志采集到告警可视化(440)

Java 大视界 -- 基于 Java+Storm 构建实时日志分析平台:从日志采集到告警可视化(440)

Java 大视界 -- 基于 Java+Storm 构建实时日志分析平台:从日志采集到告警可视化(440) * 引言: * 正文: * 一、实时日志分析平台的核心架构设计 * 1.1 架构分层与核心组件 * 1.2 组件选型的实战思考(10 余年经验沉淀,数据真实有出处) * 二、日志采集层:Flume 的高可用配置(生产级优化) * 2.1 Flume 的核心配置(抗住十万级 / 秒流量,注释完整) * 2.2 Flume 的高可用部署(避免单点故障,实战步骤清晰) * 2.2.1 多 Agent 冗余部署 * 2.2.2 Nginx

By Ne0inhk
JAVA 注解(Annotation):从原理到实战应用

JAVA 注解(Annotation):从原理到实战应用

JAVA 注解(Annotation):从原理到实战应用 1.1 本章学习目标与重点 💡 掌握注解的核心概念与分类,理解注解在Java开发中的核心价值。 💡 熟练使用JDK内置注解,掌握自定义注解的定义、解析与使用流程。 💡 掌握注解的元注解配置方式,理解不同元注解对自定义注解的约束作用。 💡 结合反射机制实现注解的实战应用,掌握注解在框架开发中的核心用法。 ⚠️ 本章重点是 自定义注解的开发流程 和 注解与反射结合的实战应用,这是Java高级开发与框架设计的必备技能。 1.2 注解的核心概念与价值 1.2.1 什么是注解 💡 注解(Annotation) 是Java 5引入的一种特殊标记,它可以在编译期、类加载期、运行时被读取,并执行相应的处理逻辑。注解本身不直接影响代码的执行逻辑,而是通过元数据的方式为程序提供额外信息,这些信息可以被编译器、虚拟机或自定义的注解处理器解析和使用。 注解的本质是一个继承了 java.lang.annotation.Annotation 接口的特殊接口,我们定义的每一个注解,最终都会被编译器生成对应的接口实现类,供程序在运行时

By Ne0inhk
Java 时间类(上):JDK7 及以前时间类 Date、SimpleDateFormat、Calendar 最全总结

Java 时间类(上):JDK7 及以前时间类 Date、SimpleDateFormat、Calendar 最全总结

🏠个人主页:黎雁 🎬作者简介:C/C++/JAVA后端开发学习者 ❄️个人专栏:C语言、数据结构(C语言)、EasyX、JAVA、游戏、规划、程序人生 ✨ 从来绝巘须孤往,万里同尘即玉京 文章目录 * Java 时间类(上):JDK7 及以前时间类 Date、SimpleDateFormat、Calendar 最全总结 🕒 * 📝 文章摘要 * 一、时间相关基础知识点 ⏱ * 1. 时间标准 * 2. 时间单位与换算 * 二、Date 时间类 📅 * 1. 概述 * 2. 构造方法 * 3. 成员方法 * 4. 代码示例 * 三、SimpleDateFormat 格式化与解析 ✍️ * 1. 作用

By Ne0inhk
链表-两两交换(Java的三种解法)

链表-两两交换(Java的三种解法)

道题是链表操作的一个经典问题,掌握了它,你对链表的指针操作和递归思维会有更深的理解。只要你跟着我的思路走一遍,自己动手写写代码,很快就能独立解决这类问题!咱们现在就来聊聊这道题吧 1. 看到这道题目时我想到了什么,以及如何运用现实案例讲解 你有没有想过,生活中很多事情都像是“交换顺序”或者“重新排列”。比如说,你在排队买东西,队伍里的人两两交换位置,前面的人变成后面,后面的人变成前面,这就是一种“两两交换”的操作。 再举个贴近算法的例子:想象你在整理一排书,原本是按顺序摆放的,但你想把相邻的两本书交换位置,比如第1本和第2本换,第3本和第4本换,这样整个书架的顺序就变了。这就像链表的两两交换,我们需要调整指针,让相邻节点的位置互换。 业务场景:这道题在实际业务中有很多应用,比如: * 数据排序:在某些场景下,需要对数据进行局部重排,比如用户列表中两两交换显示顺序,用于A/B测试。 * 任务调度:在任务队列中,调整任务执行顺序,比如优先级相邻任务交换,提升调度效率。 * 游戏设计:在游戏排行榜中,动态调整玩家位置,

By Ne0inhk