AI 時代必懂的數學6 分鐘閱讀
貝葉斯定理:怎麼用證據更新判斷
一個經典題:某種疾病盛行率 1%,篩檢工具準確率 99%(有病檢出 99%、沒病誤報 1%)。 你篩出陽性,真的得病的機率是多少?多數人會說 99%,但正確答案是 50%。 差在哪裡?差在你忽略了「先驗機率」。這就是貝葉斯定理要修正的直覺錯誤。
核心公式
P(A | B) = P(B | A) × P(A) ÷ P(B)
後驗 = 似然 × 先驗 ÷ 證據強度
用篩檢題拆解一次
假設母體 10,000 人。盛行率 1% → 100 人有病、9,900 人沒病。
- 有病且陽性:100 × 99% = 99 人
- 沒病但誤報陽性:9,900 × 1% = 99 人
- 所有陽性 = 99 + 99 = 198 人
- 陽性中真正有病的比例 = 99 ÷ 198 = 50%
直覺把「準確率 99%」直接當成答案,忽略了「沒病的人比有病的人多 99 倍」這個壓倒性的先驗。 這個錯誤有名字,叫 base rate fallacy(基本比率謬誤)。
盛行率怎麼影響後驗
同一個 99% 準確率的工具,盛行率不同,陽性後真正有病的機率天差地別。
| 盛行率 | 陽性後真正有病機率 | 意義 |
|---|---|---|
| 0.1% | 9.0% | 大規模篩檢時誤報遠多於真陽 |
| 1% | 50.0% | 陽性僅一半可信 |
| 10% | 91.7% | 已經有臨床症狀時做檢查 |
| 50% | 99.0% | 高度懷疑族群再篩檢 |
結論:同一個工具,用在不同人群,可信度差 10 倍以上。 這就是為什麼專科醫師會「先看症狀,再決定要不要驗」——他們在拉高先驗。
商務情境:每天都在用貝葉斯
- A/B test 後驗判斷:看到 B 比 A 好 5%,要結合「歷史上多少 test 真的有效」當先驗,不是看單一 p-value 就決策
- 面試篩選:履歷亮眼是「證據」,但要乘以「這個職位申請者的整體素質先驗」才是真實後驗
- Fraud detection:一筆異常交易看起來像詐騙(似然高),但詐騙佔比 0.01%,得到後驗才能決定要不要擋
- 垃圾信過濾:Naive Bayes 演算法的本體就是這條公式——P(垃圾 | 出現「中獎」)
- 銷售 lead scoring:客戶開了 email 是證據,但 conversion 先驗只有 2%,後驗仍可能很低
更新信念:貝葉斯式思考
公式真正的精神是「先有信念,看到證據,更新信念」。 每次實驗、每次面試、每次客戶反饋,都是把先驗變成新的後驗, 而這個後驗會變成下一次的先驗,循環下去。這就是科學方法、機器學習、甚至司法推理的底層邏輯。
常見誤解
- Base rate fallacy:忽略先驗,只看似然。「他來自頂大,一定很厲害」——但頂大畢業生在你公司應徵者裡的先驗是多少?
- 檢察官謬誤(prosecutor's fallacy):把 P(證據 | 無辜) 當成 P(無辜 | 證據)。「DNA 吻合機率百萬分之一,所以他幾乎一定有罪」是錯的——還要乘以人口先驗
- Conjunction fallacy:覺得「Linda 是女權主義者且銀行員」比「Linda 是銀行員」更可能。聯合機率不可能 > 邊際機率
- 更新過度:看到一筆證據就大幅更新信念,忽略證據本身的可靠度(似然其實沒那麼極端)
反向題:練一次
公司 lead 平均轉化率 5%。某個 lead 開了 3 封 email,這個行為在「真會買的人」裡 60% 會做、在「不會買」的人裡只有 10% 會做。看到這個行為後,他真的會買的後驗機率是多少?
- 先驗:P(買) = 5%、P(不買) = 95%
- 分子 = 0.6 × 0.05 = 0.03
- 分母 = 0.6 × 0.05 + 0.1 × 0.95 = 0.03 + 0.095 = 0.125
- 後驗 = 0.03 ÷ 0.125 = 24%
證據把信念從 5% 拉到 24%,提升將近 5 倍——但離「一定會買」還很遠。這就是貝葉斯式的銷售判斷。