用故事解釋softmax函數的概率問題


    故事背景:魔法帽的分院儀式


    在魔法學院裏,每個新生入學時,都會戴上一頂“智能分院帽”,它會根據學生的性格和潛力,將他們分配到不同的學院:


    ? 勇者學院(擅長戰鬥)


    ? 智者學院(聰明機智)


    ? 仁者學院(善良正直)


    ? 影者學院(神秘低調)


    這頂魔法帽的工作方式不是直接把學生硬性歸入某個學院,而是計算每個學院的“匹配程度”,然後以概率的方式進行分類。


    假設一名新生戴上帽子,帽子對他進行評分:


    ? 勇者學院:8分


    ? 智者學院:6分


    ? 仁者學院:5分


    ? 影者學院:3分


    魔法帽不會簡單地選最高分的學院,而是用一個神奇的法術(softmax函數)把這些分數轉換成概率:


    1. 先計算每個學院分數的指數值(e的指數函數)


    2. 計算總和


    3. 計算每個學院的概率


    最終,魔法帽會按這個概率來決定學生的學院,比如:


    ? 可能 70% 的概率進入 勇者學院


    ? 可能 20% 進入 智者學院


    ? 可能 9% 進入 仁者學院


    ? 隻有 1% 的可能性進入 影者學院


    這樣做的好處是,雖然勇者學院得分最高,但如果有其他因素影響(例如神秘的潛在天賦),也有可能進入其他學院。softmax 就是這樣一種將“評分”轉換為“概率”的方法,讓高分的類別有更大可能被選中,而低分的也有一絲機會。


    用比喻解釋softmax的概率問題


    比喻1:冰激淩店的選擇


    你走進了一家冰激淩店,看到菜單上有 4 種口味:


    ? 巧克力 - 8分(最喜歡)


    ? 香草 - 6分(還不錯)


    ? 草莓 - 5分(一般)


    ? 抹茶 - 3分(不是很喜歡)


    你並不會隻點你最喜歡的巧克力,而是會按照偏好決定點什麽,比如:


    ? 可能60% 的時候點巧克力,


    ? 也許 30% 的時候會試試香草,


    ? 偶爾 也可能想試試草莓。


    這就好比 softmax,把你對不同選項的偏好轉化成了概率,而不是隻選擇分數最高的一個。


    比喻解釋:搶蛋糕遊戲


    想象你和朋友參加了一個“搶蛋糕”遊戲,桌子上有 4 塊蛋糕,大小不同:


    ? a蛋糕:8塊大(最大)


    ? b蛋糕:6塊


    ? c蛋糕:5塊


    ? d蛋糕:3塊


    規則是:你可以選一個蛋糕吃,但選擇的概率與蛋糕的大小成正比。


    比如,a蛋糕最大,你選它的概率就最高;d蛋糕最小,你選它的概率最低。但不能說a蛋糕最大,你就隻選它——因為其他蛋糕也有一點可能性被選中。


    這就像softmax,它不會直接選最大的,而是按比例分配概率,讓每個選項都有可能被選中。蛋糕越大,代表的概率就越高,但不會100%鎖定。


    總結


    1. softmax 的核心作用是“概率化”:它將原始分數(打分、點數、偏好)轉換為概率,確保所有選項的概率總和為 1。


    2. softmax 保證高分更容易被選中,但不是唯一選項:高分選項概率更高,但低分選項仍然有機會被選中,這讓決策更加靈活,而不是一味選擇最高分的選項。


    3. 就像點蛋糕、搶蛋糕,雖然最喜歡的選項更有可能被選中,但其他選擇也並非毫無機會!

章節目錄

閱讀記錄

職場小聰明所有內容均來自互聯網,繁體小說網隻為原作者翟曉鷹的小說進行宣傳。歡迎各位書友支持翟曉鷹並收藏職場小聰明最新章節