Logits 详解：与 Softmax 关系、使用场景及注意事项（中英双语） | 极客日志

PythonAI算法

Logits 详解：与 Softmax 关系、使用场景及注意事项（中英双语）

综述由AI生成详细解析了深度学习中的 Logits 概念，阐述其作为未归一化原始输出的定义与作用。介绍了 Logits 通过 Softmax 函数转化为概率分布的数学原理及数值稳定性处理方法。通过文本分类案例演示了从 Logits 到概率的计算过程，并总结了分类任务、推理阶段等使用场景及注意事项，如避免数值溢出和直接利用最大值进行预测。

古灵精怪发布于 2026/3/28更新于 2026/5/3034 浏览

Logits 详解：与 Softmax 关系、使用场景及注意事项

在深度学习中，logits 是指在模型的最后一层（通常是全连接层）的原始输出值，尚未经过归一化处理。Logits 是一个非常重要的概念，因为它是模型从中预测最终结果的基础，决定了模型对不同类别的'信心'或'倾向性'。

本文将深入探讨：

Logits 的定义与作用
Logits 与 Softmax 的关系
实际案例：从 Logits 到概率分布
Logits 的使用场景和注意事项
总结与洞见

1. Logits 的定义与作用

什么是 Logits？

Logits 是深度学习模型预测过程中最后一层输出的原始值。它们通常是一个未归一化的实数向量，每个值对应一个类别。Logits 的取值范围可以是正数、负数，甚至非常大或非常小的值。

形状：假设模型有 C 个类别，输入一个样本，Logits 的形状为 [C]。
特性：
- Logits 不具有概率含义。
- 可能包含正数或负数，甚至可能超出人类直观理解的范围（如 -1000 或 1000）。

作用

Logits 是模型预测的中间结果。它们本身并非最终的预测值，而需要通过激活函数（如 Softmax）进行归一化，转化为概率分布。模型的优化目标（如交叉熵损失）直接基于 Logits 或其归一化结果进行计算。

2. Logits 与 Softmax 的关系

Softmax 函数

Softmax 是一个将 Logits 转化为概率分布的激活函数，定义如下：

P(y_i) = exp(z_i) / sum(exp(z_j))

其中：

z_i：Logits 中第 i 个值。
C：类别数。
P(y_i)：归一化后的概率值，表示模型对第 i 个类别的置信度，满足：sum(P(y_i)) = 1

Logits 与概率的区别

Logits（未归一化）：
- 取值范围：任意实数。
- 无概率意义。
- 仅表示模型对某类别的'倾向性'。
Softmax 输出（归一化后）：
- 取值范围：[0, 1]。
- 满足概率分布的性质，所有值之和为 1。
- 每个值表示模型预测该类别的概率。

3. 实际案例：从 Logits 到概率分布

假设有一个文本分类任务，模型需要将输入的句子分类为三类：

类别 A：新闻
类别 B：娱乐
类别 C：科技

输入：句子 "The new smartphone has amazing features." 模型的 Logits 输出：logits = [2.0, 1.0, 0.1]

步骤 1：计算 Softmax

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

P(A) = exp(2.0) / (exp(2.0) + exp(1.0) + exp(0.1))
P(B) = exp(1.0) / (exp(2.0) + exp(1.0) + exp(0.1))
P(C) = exp(0.1) / (exp(2.0) + exp(1.0) + exp(0.1))

P(y_i) = exp(z_i) / sum(exp(z_j))

P(A) = exp(2.0) / (exp(2.0) + exp(1.0) + exp(0.1))
P(B) = exp(1.0) / (exp(2.0) + exp(1.0) + exp(0.1))
P(C) = exp(0.1) / (exp(2.0) + exp(1.0) + exp(0.1))

Logits 详解：与 Softmax 关系、使用场景及注意事项（中英双语）

Logits 详解：与 Softmax 关系、使用场景及注意事项

1. Logits 的定义与作用

什么是 Logits？

作用

2. Logits 与 Softmax 的关系

Softmax 函数

Logits 与概率的区别

3. 实际案例：从 Logits 到概率分布

步骤 1：计算 Softmax

更多推荐文章

相关免费在线工具

解释

4. Logits 的使用场景和注意事项

(1) 使用场景

(2) 注意事项

5. 总结与洞见

What Are Logits? A Comprehensive Guide

1. Definition and Purpose of Logits

What Are Logits?

Why Are Logits Important?

2. Relationship Between Logits and Softmax

The Softmax Function

Difference Between Logits and Probabilities

3. Practical Example: From Logits to Probabilities

Step 1: Apply Softmax

Step 2: Compute the Exponentials

Step 3: Normalize

Interpretation

4. Applications and Considerations of Logits

Applications

Considerations

5. Key Takeaways and Insights

更多推荐文章

相关免费在线工具

Logits 详解：与 Softmax 关系、使用场景及注意事项（中英双语）

Logits 详解：与 Softmax 关系、使用场景及注意事项

1. Logits 的定义与作用

什么是 Logits？

作用

2. Logits 与 Softmax 的关系

Softmax 函数

Logits 与概率的区别

3. 实际案例：从 Logits 到概率分布

步骤 1：计算 Softmax

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

解释

4. Logits 的使用场景和注意事项

(1) 使用场景

(2) 注意事项

5. 总结与洞见

What Are Logits? A Comprehensive Guide

1. Definition and Purpose of Logits

What Are Logits?

Why Are Logits Important?

2. Relationship Between Logits and Softmax

The Softmax Function

Difference Between Logits and Probabilities

3. Practical Example: From Logits to Probabilities

Step 1: Apply Softmax

Step 2: Compute the Exponentials

Step 3: Normalize

Interpretation

4. Applications and Considerations of Logits

Applications

Considerations

5. Key Takeaways and Insights

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具