大模型简介
大语言模型(LLM,Large Language Model),也称大型语言模型,是一种旨在理解和生成人类语言的人工智能模型。
可以将它理解为一个黑盒模型:输入人类语言,输出人类语言。黑盒内部是什么呢?是一种大型神经网络。

以上是一个普通的神经网络示意图,它有多个输入权重和一个输出。
$$y = w_1x_1 + w_2x_2 + w_3x_3 + b$$
其中 $w_1, w_2, w_3$ 是权重,$x_1, x_2, x_3$ 是输入。只有当 $y$ 大于某个阈值的时候,才会输出特定结论。这是一个简单的神经网络例子。例如,对于学生来说,'考完试了'这个因素的权重可能较高,因此更倾向于'出去玩'。
当然,这只是一个简化的线性回归方程示例。事实上,可以通过统计所有影响因素并数据化,得到符合实际情况的权重参数。

这是更大规模的神经网络。构建此类网络较为复杂,但可以使用工具辅助可视化。例如使用 Python 的 networkx 库绘制有向图:
import networkx as nx
import matplotlib.pyplot as plt
# 创建一个空的有向图
G = nx.DiGraph()
# 添加节点
layers = [10, 10, 13, 12, 8, 13, 5, 7, 8, 10, 6, 1]
for i in range(len(layers)):
for j in range(layers[i]):
G.add_node((i, j))
# 添加边
for i in range(len(layers) - ):
j (layers[i]):
k (layers[i + ]):
G.add_edge((i, j), (i + , k))
pos = {}
node G.nodes:
pos[node] = node
nx.draw(G, pos, with_labels=, node_color=, edgecolors=)
plt.show()



