大模型应用开发：简介与环境配置 | 极客日志

PythonAI算法

大模型应用开发：简介与环境配置

综述由AI生成大语言模型（LLM）是一种理解和生成人类语言的人工智能模型，其核心在于大型神经网络。解析了神经网络的权重机制，介绍了 LangChain 框架及检索增强生成（RAG）技术以应对 Token 限制和幻觉问题。教程详细演示了开发环境的配置步骤，涵盖 Git 密钥管理、Conda 虚拟环境创建、llm-universe 项目克隆、NLTK 资源本地化安装以及 JupyterLab 内核绑定，帮助开发者快速搭建大模型应用基础环境。

片刻发布于 2025/2/6更新于 2026/6/1424 浏览

大模型简介

大语言模型（LLM，Large Language Model），也称大型语言模型，是一种旨在理解和生成人类语言的人工智能模型。

可以将它理解为一个黑盒模型：输入人类语言，输出人类语言。黑盒内部是什么呢？是一种大型神经网络。

神经网络结构图

以上是一个普通的神经网络示意图，它有多个输入权重和一个输出。

$$y = w_1x_1 + w_2x_2 + w_3x_3 + b$$

其中 $w_1, w_2, w_3$ 是权重，$x_1, x_2, x_3$ 是输入。只有当 $y$ 大于某个阈值的时候，才会输出特定结论。这是一个简单的神经网络例子。例如，对于学生来说，'考完试了'这个因素的权重可能较高，因此更倾向于'出去玩'。

当然，这只是一个简化的线性回归方程示例。事实上，可以通过统计所有影响因素并数据化，得到符合实际情况的权重参数。

复杂神经网络图

这是更大规模的神经网络。构建此类网络较为复杂，但可以使用工具辅助可视化。例如使用 Python 的 networkx 库绘制有向图：

import networkx as nx
import matplotlib.pyplot as plt

# 创建一个空的有向图
G = nx.DiGraph()

# 添加节点
layers = [10, 10, 13, 12, 8, 13, 5, 7, 8, 10, 6, 1]
for i in range(len(layers)):
    for j in range(layers[i]):
        G.add_node((i, j))

# 添加边
for i in range(len(layers) - ):
     j  (layers[i]):
         k  (layers[i + ]):
            G.add_edge((i, j), (i + , k))


pos = {}
 node  G.nodes:
    pos[node] = node
nx.draw(G, pos, with_labels=, node_color=, edgecolors=)


plt.show()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

生成 SSH Key

ssh-keygen -t rsa -C "[email protected]"

将公钥添加到 GitHub
```
cat ~/.ssh/id_rsa.pub
```
复制输出内容，打开 GitHub，点击右上角头像，选择 Settings -> SSH and GPG keys -> New SSH key，将复制的内容粘贴到 key 中，点击 Add SSH key。

安装 Miniconda

mkdir -p ~/miniconda3
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3
rm -rf ~/miniconda3/miniconda.sh

初始化 Shell

~/miniconda3/bin/conda init bash
~/miniconda3/bin/conda init zsh

检查安装
```
conda --version
```
新建一个终端，此命令会输出 conda 版本。

新建虚拟环境

conda create -n llm-universe python=3.10

激活虚拟环境
```
conda activate llm-universe
```

克隆仓库

git clone [email protected]:datawhalechina/llm-universe.git

配置仓库依赖

cd llm-universe
pip install -r requirements.txt

下载 NLTK 相关资源

在使用开源词向量模型时，需要用到第三方库 nltk 的一些资源。正常情况下会自动从互联网下载，但可能因网络原因中断。建议从国内镜像地址下载相关资源。
```
cd /root
git clone https://gitee.com/yzy0612/nltk_data.git --branch gh-pages
cd nltk_data
mv packages/* ./
cd tokenizers
apt install unzip -y
unzip punkt.zip
cd ../taggers
unzip averaged_perceptron_tagger.zip
```
配置 JupyterLab 内核

当你打开一个 .ipynb 文件，点击右上角选择内核，选择 Python 解释器，再选择 llm-universe 环境。

大模型应用开发：简介与环境配置

大模型简介

更多推荐文章

相关免费在线工具

LangChain

RAG

环境配置

配置 Git

配置 Conda

总结与下一步

更多推荐文章

相关免费在线工具

大模型应用开发：简介与环境配置

大模型简介

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

LangChain

RAG

环境配置

配置 Git

配置 Conda

总结与下一步

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具