大模型原理简介与 ChatGLM3、Llama3.1 本地部署指南

大模型原理简介

什么是大模型

从 1950 年图灵提出'图灵测试'以来，人类对人工智能的探索从未停止。人工智能的发展主要经历了三个学派：

1. 符号主义学派

符号主义强调逻辑推理和形式化方法，通过逻辑规则和算法解决问题。擅长解决可明确定义的问题，如最短路径规划、下棋、定理证明。 弊端：

依赖明确规则，难以处理现实世界的不确定性。
系统规模随复杂度增加而庞大，维护困难。
静态设计，难以适应环境变化。
搜索过程复杂，计算效率低。

2. 行为主义学派

行为主义强调可观察的行为而非内部状态。智能行为在与环境交互中展现，借鉴控制论原理，用于移动机器人、自动驾驶。 弊端：

难以处理复杂任务。
对环境过度依赖。
难以模拟人类长期记忆和学习。

3. 连接主义学派

连接主义模仿人脑机制，特别是神经网络结构。强调信息分布式存储和处理，通过学习和适应改进性能，应用于图像识别、语音识别、自然语言处理。 弊端：

解释性差（黑盒模型）。
数据需求量大。
计算资源要求高。
训练时间长。

大模型定义： 属于连接主义学派下的自然语言分支，受神经元启发，模拟人类学习方式，通过经验学习产生智能行为。参数规模巨大（如 6B 代表 60 亿参数），是衡量模型能力的重要指标。

大模型的安装部署

1. ChatGLM3 安装部署

ChatGLM3 是智谱 AI 和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 在保留对话流畅、部署门槛低特性的基础上，引入了更强大的基础模型和完整的功能支持。

1.1 环境准备

建议配置如下：

GPU: NVIDIA GeForce RTX 3090 (或更高)
CUDA Version: 12.3+
CPU: 16 核以上
内存: 32GB 以上
硬盘: 1TB SSD
操作系统: Ubuntu 22.04.3 LTS

1.2 依赖下载与安装

安装 Anaconda

wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.0.0-Linux-x86_64.sh
bash Anaconda3-5.0.0-Linux-x86_64.sh
source ~/.bashrc

创建虚拟环境

conda create -n chatglm3 python=3.11
conda activate chatglm3

安装项目依赖 从 GitHub 克隆代码并安装依赖：

git clone https://github.com/THUDM/ChatGLM3.git
cd ChatGLM3
pip install -r requirements.txt

大模型原理简介与 ChatGLM3、Llama3.1 本地部署指南