初识Langchain之AI语言大模型

优质文章学习记录

08 Apr 2026 — 5 min read

1. 什么叫模型

今天我们来聊一聊什么叫做模型。

模型是⼀个从数据中学习规律的“数学函数”或“程序”。旨在处理和⽣成信息的算法，通常模仿⼈类的认知功能。通过从⼤型数据集中学习模式和洞察，这些模型可以进⾏预测、⽣成⽂本、图像或其他输出，从⽽增强各个⾏业的各种应⽤。

简单来说就是一个模型只会处理一件事，我们也可以把它理解为单个工作流，然后多个模型组合在一起就是语言大模型了。

它和工作流的区别在我看来就是它这个处理是需要提前训练。我们看下面这个图片，我们就像这样把下面这些狗狗的图片全部都喂给模型，并且我们需要给每一张图片都标注好这个是狗，这样再经过很多张这样图片让AI看，然后AI就学会分辨什么是狗了。

但是这个模型的话就只可以分辨什么是狗，如果我们问这个模型什么是猫的话，那么这个模式是无法做出回答的。

2. 什么是大语言模型

2.1 神经网络

神经网络我们可以理解为很多个无数个组合在一起的工作流，每一块工作流只处理一小部分的问题，通过各自之间的配合，从而达成有效处理用户信息的能力。

2.2 自监督学习

自监督学习是一种无监督学习的进阶范式，核心是让模型自己从原始数据中构造监督信号（标签），无需人工标注数据，就能完成特征学习和模型训练。

这个的话我的理解就相当于是自学，同时自己给自己修正方向。

2.3 半监督学习

半监督就是“少量指导+⼤量自学”的结合模式。

通过给部分的照片备注，接着再放一些不相关的照片来给模型进行识别，这种学习过程叫做半监督学习。

2.4 语言模型

语⾔模型的核⼼任务就是预测下⼀个词。⼀个强⼤的语⾔模型，能够根据⼀段话，预测出最合理、最通顺的下⼀个词是什么，这样⼀个个词接下去，就能⽣成⼀整段话、⼀篇⽂章。

比如我们平常打字时的自动补全，那就是一种语言模型。

3. 大语言模型的能力

大语言模型和语言模型并不完全是一种东西。简单来说，所有大语言模型都是语言模型，但并非所有语言模型都是大语言模型。

核心定义与关键特征

核心定位：以 “预测下一个词” 为基础任务，通过海量数据学习语言规律、知识与逻辑，涌现对话、推理、创作等通用能力，而非仅针对单一任务。
三大关键特征
- 架构：统一采用 Transformer（多为纯 Decoder），自注意力机制高效捕捉长距离语义依赖，并行计算能力远超 RNN/LSTM。
- 规模：参数量达数十亿至万亿级（如 GPT-3 1750 亿、GPT-4 万亿级），训练数据为 TB 级通用文本（书籍、网页、代码等）。
- 能力：支持零样本 / 少样本学习，可跨任务泛化，具备上下文理解、复杂推理与多模态（文本 + 图像 / 音频）处理能力。

主要挑战与局限

幻觉：生成看似合理但不符合事实的内容，需外部知识库或检索增强（RAG）修正。
算力与成本：训练与推理依赖大规模 GPU 集群，成本高、能耗大。
安全与伦理：存在偏见、隐私泄露、内容滥用风险，需强化对齐与合规管控。
上下文窗口限制：虽持续扩大（如 GPT-4 128k、Gemini 1.5 Pro 10M），但超长文本处理仍有瓶颈。

腾讯游戏 2026 年 Q1 财报解读：AI 赋能下的新增长曲线

引言 2026 年 3 月，腾讯控股发布 2026 年第一季度财报。游戏业务作为腾讯的现金牛，本季度表现亮眼，总收入达到 580 亿元，同比增长 22%。其中，AI 技术的深度应用成为增长的关键驱动力。一、核心数据概览 1. 整体业绩 * 游戏总收入：580 亿元，同比增长 22% * 国内游戏：320 亿元，同比增长 12% * 海外游戏：260 亿元，同比增长 38% * 净利润：185 亿元，同比增长 35% 2. 用户数据 * 《王者荣耀》日活突破 1.5 亿，创历史新高

工业物联网数据基础设施：Apache IoTDB 与 TimechoDB 的云原生与 AI 进化之路

工业物联网数据基础设施：Apache IoTDB 与 TimechoDB 的云原生与 AI 进化之路写在前面：AI 时代的物联网数据新范式 2025年的今天，我们谈论物联网数据管理时，已不再仅仅满足于“存得下、查得快”。当大型模型开始渗透工业场景，当 AI Agent 试图直接操作数据库进行 Root Cause Analysis，时序数据库正在经历一场从“被动存储”向“主动智能”的深刻进化。面对智慧工厂每日 50TB 的振动数据，面对千万级设备的并发接入，传统的数据库架构不仅在性能上捉襟见肘，在智能化分析层面更是断层。国产自研的 Apache IoTDB 及其企业版 TimechoDB，不仅在云原生架构上给出了高分答卷，更在 2026 年的新版本中，交出了“数据库内置 AI”的惊艳方案。一、重新审视时序数据库：

人工智能：大语言模型（LLM）原理与应用实战

人工智能：大语言模型（LLM）原理与应用实战 1.1 本章学习目标与重点 💡 学习目标：掌握大语言模型的核心原理、训练流程与微调方法，学会基于开源大语言模型完成定制化对话与文本生成任务。 💡 学习重点：理解大语言模型的Transformer decoder-only架构，掌握指令微调与RLHF技术，能够使用LoRA高效微调开源LLM。 1.2 大语言模型的核心概念与发展历程 1.2.1 什么是大语言模型 💡 大语言模型（Large Language Model, LLM）是参数量达到十亿级甚至万亿级的Transformer-based模型。它通过在海量文本数据上进行预训练，学习语言的语法、语义、常识和推理能力。 LLM的核心能力包括文本生成、理解、翻译、摘要、问答等。它可以处理复杂的自然语言任务，无需针对每个任务单独设计模型结构。 LLM与传统NLP模型的核心区别： * 参数量级：传统模型参数量通常在千万级，LLM参数量可达十亿到万亿级。 * 训练数据：传统模型依赖标注数据，LLM使用海量无标注文本进行预训练。 * 能力边界：传统模型只能处理单一任务，LL

春节寒假作业辅导：基于 Rokid 灵珠平台打造 AI Glasses 作业助手

本文应用基于Rokid灵珠智能体/CXR SDK开发，开发指南https://forum.rokid.com/index 文章目录 * 一、引言：为什么我们需要一个 AI Glasses 作业助手？ * 二、方案设计与架构 * 2.1 核心功能定义 * 2.2 端到端架构（AI Glasses） * 2.3 业务流程架构 * 三、开发实战：手把手搭建“作业救星” * 3.1 准备工作 * 3.2 步骤一：创建知识库（资源准备） * 3.3 步骤二：创建智能体（Agent） * 3.4 步骤三：搭建核心工作流（Workflow）

1. 什么叫模型

2. 什么是大语言模型

2.1 神经网络

2.2 自监督学习

2.3 半监督学习

2.4 语言模型

3. 大语言模型的能力

Read more

腾讯游戏 2026 年 Q1 财报解读：AI 赋能下的新增长曲线

工业物联网数据基础设施：Apache IoTDB 与 TimechoDB 的云原生与 AI 进化之路

人工智能：大语言模型（LLM）原理与应用实战

春节寒假作业辅导：基于 Rokid 灵珠平台打造 AI Glasses 作业助手