AI 時代必懂的數學6 分鐘閱讀

貝葉斯定理：怎麼用證據更新判斷

一個經典題：某種疾病盛行率 1%，篩檢工具準確率 99%（有病檢出 99%、沒病誤報 1%）。你篩出陽性，真的得病的機率是多少？多數人會說 99%，但正確答案是 50%。差在哪裡？差在你忽略了「先驗機率」。這就是貝葉斯定理要修正的直覺錯誤。

核心公式

P(A | B) = P(B | A) × P(A) ÷ P(B)

後驗 = 似然 × 先驗 ÷ 證據強度

假設母體 10,000 人。盛行率 1% → 100 人有病、9,900 人沒病。

直覺把「準確率 99%」直接當成答案，忽略了「沒病的人比有病的人多 99 倍」這個壓倒性的先驗。這個錯誤有名字，叫 base rate fallacy（基本比率謬誤）。

同一個 99% 準確率的工具，盛行率不同，陽性後真正有病的機率天差地別。

結論：同一個工具，用在不同人群，可信度差 10 倍以上。這就是為什麼專科醫師會「先看症狀，再決定要不要驗」——他們在拉高先驗。

公式真正的精神是「先有信念，看到證據，更新信念」。每次實驗、每次面試、每次客戶反饋，都是把先驗變成新的後驗，而這個後驗會變成下一次的先驗，循環下去。這就是科學方法、機器學習、甚至司法推理的底層邏輯。

Base rate fallacy：忽略先驗，只看似然。「他來自頂大，一定很厲害」——但頂大畢業生在你公司應徵者裡的先驗是多少？
檢察官謬誤（prosecutor's fallacy）：把 P(證據 | 無辜) 當成 P(無辜 | 證據)。「DNA 吻合機率百萬分之一，所以他幾乎一定有罪」是錯的——還要乘以人口先驗
Conjunction fallacy：覺得「Linda 是女權主義者且銀行員」比「Linda 是銀行員」更可能。聯合機率不可能 > 邊際機率
更新過度：看到一筆證據就大幅更新信念，忽略證據本身的可靠度（似然其實沒那麼極端）

公司 lead 平均轉化率 5%。某個 lead 開了 3 封 email，這個行為在「真會買的人」裡 60% 會做、在「不會買」的人裡只有 10% 會做。看到這個行為後，他真的會買的後驗機率是多少？

證據把信念從 5% 拉到 24%，提升將近 5 倍——但離「一定會買」還很遠。這就是貝葉斯式的銷售判斷。