AI中softmax是什么？

“Softmax”（中文常译为柔性最大值或归一化指数函数）是人工智能、特别是深度学习中一个非常重要的数学函数。它的主要作用是：把一串任意数字，变成一组“概率”。

我们可以用一个小学生都能懂的比喻来理解它！

想象你问 AI：“这张图里是什么动物？”
AI 的神经网络经过计算，输出了三个数字：

这些数字叫“原始得分”（logits），但它们不是概率，不能直接说“有70%可能是猫”。

这时候，Softmax 就登场了！ 它会把这些数字“翻译”成大家能看懂的概率：

猫：85%
狗：12%
鸟：3%

而且，这三个概率加起来正好等于 100%（或 1.0）！

这就是 Softmax 的核心作用：把任意实数转换成一个合理的概率分布。

假设我们有三个得分：[z₁, z₂, z₃] = [3.0, 1.0, 0.5]

Softmax 对每个数 zᵢ 的计算公式是：

Softmax (z_{i}) = e ^{z 1} + e ^{z 2} + e ^{z 3} e ^{z i}

其中 e 是自然常数（约等于 2.718）。

👉 关键特点：

在 ImageNet 图像分类比赛中，AI 要从 1000 个类别中选一个。
最后一层通常就是一个 Softmax 层，输出 1000 个概率，比如：

我们就能说：“AI 有 92% 的把握认为这是金毛犬。”

这在很多场景很重要！比如医疗诊断：AI 说“有 51% 可能是良性，49% 可能是恶性”——这个不确定性信息非常关键！

Softmax 就像一个“翻译官”，把神经网络输出的冷冰冰的数字，变成一组加起来为100%的、有意义的概率，告诉我们 AI 对每个答案有多“自信”。

它是分类任务（比如图像识别、文本分类）中不可或缺的一环！

登录 找回密码