大模型原理简介
什么是大模型
从 1950 年图灵提出'图灵测试'以来,人类对人工智能的探索从未停止。人工智能的发展主要经历了三个学派:
1. 符号主义学派
符号主义强调逻辑推理和形式化方法,通过逻辑规则和算法解决问题。擅长解决可明确定义的问题,如最短路径规划、下棋、定理证明。 弊端:
- 依赖明确规则,难以处理现实世界的不确定性。
- 系统规模随复杂度增加而庞大,维护困难。
- 静态设计,难以适应环境变化。
- 搜索过程复杂,计算效率低。
2. 行为主义学派
行为主义强调可观察的行为而非内部状态。智能行为在与环境交互中展现,借鉴控制论原理,用于移动机器人、自动驾驶。 弊端:
- 难以处理复杂任务。
- 对环境过度依赖。
- 难以模拟人类长期记忆和学习。
3. 连接主义学派
连接主义模仿人脑机制,特别是神经网络结构。强调信息分布式存储和处理,通过学习和适应改进性能,应用于图像识别、语音识别、自然语言处理。 弊端:
- 解释性差(黑盒模型)。
- 数据需求量大。
- 计算资源要求高。
- 训练时间长。
大模型定义: 属于连接主义学派下的自然语言分支,受神经元启发,模拟人类学习方式,通过经验学习产生智能行为。参数规模巨大(如 6B 代表 60 亿参数),是衡量模型能力的重要指标。
大模型的安装部署
1. ChatGLM3 安装部署
ChatGLM3 是智谱 AI 和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 在保留对话流畅、部署门槛低特性的基础上,引入了更强大的基础模型和完整的功能支持。
1.1 环境准备
建议配置如下:
- GPU: NVIDIA GeForce RTX 3090 (或更高)
- CUDA Version: 12.3+
- CPU: 16 核以上
- 内存: 32GB 以上
- 硬盘: 1TB SSD
- 操作系统: Ubuntu 22.04.3 LTS
1.2 依赖下载与安装
-
安装 Anaconda
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.0.0-Linux-x86_64.sh bash Anaconda3-5.0.0-Linux-x86_64.sh source ~/.bashrc -
创建虚拟环境
conda create -n chatglm3 python=3.11 conda activate chatglm3 -
安装项目依赖 从 GitHub 克隆代码并安装依赖:
git clone https://github.com/THUDM/ChatGLM3.git cd ChatGLM3 pip install -r requirements.txt


