加權平均的盲點:為什麼整體數字常常騙人
會議上有人喊出「整體錄取率 45%」、「整體 churn 6.5%」、「整體毛利率 40%」—— 聽起來合理,但只要背後牽涉到不同樣本數的群組, 這些「兩個百分比加起來除以二」的算法幾乎都是錯的。 這篇講加權平均,以及它最危險的延伸:Simpson 矛盾。
核心觀念:百分比不能直接平均
百分比、比率、轉換率、毛利率、利率—— 這些數字本身已經是「分子 ÷ 分母」的結果。 當兩組的分母大小不同,把兩個結果再平均一次,等於默認「兩組樣本一樣大」, 這就是錯誤的根源。
整體 = Σ(value × weight) ÷ Σ(weight)
其中 weight 通常是「該組的樣本數、營收、流量」等實際規模。
範例 1:兩部門的錄取率
| 部門 | 申請人數 | 錄取率 | 錄取人數 |
|---|---|---|---|
| A | 100 | 30% | 30 |
| B | 200 | 60% | 120 |
| 合計 | 300 | 50% | 150 |
直覺平均會說 (30% + 60%) ÷ 2 = 45%, 但實際整體錄取率是 150 ÷ 300 = 50%。 因為 B 部門的樣本是 A 的兩倍,B 的高錄取率「拉動」整體更多。
範例 2:整體 churn
| 方案 | 客戶數 | churn | 流失客戶 |
|---|---|---|---|
| 自助方案 | 10,000 | 3% | 300 |
| 企業方案 | 1,000 | 10% | 100 |
| 合計 | 11,000 | ≈ 3.6% | 400 |
直覺平均 (3% + 10%) ÷ 2 = 6.5%,但企業客戶只佔不到 10%, 整體 churn 應該是 400 ÷ 11,000 ≈ 3.6%。 如果你拿 6.5% 去做財務預測,預估流失人數會多估接近一倍。
範例 3:整體毛利率
| 產品 | 營收 | 毛利率 | 毛利 |
|---|---|---|---|
| 主力產品 | 500 萬 | 20% | 100 萬 |
| 新品 | 100 萬 | 60% | 60 萬 |
| 合計 | 600 萬 | ≈ 26.7% | 160 萬 |
直覺平均會說 (20% + 60%) ÷ 2 = 40%, 但新品營收只佔 1/6,整體毛利率應該是 160 ÷ 600 ≈ 26.7%。 董事會看到「整體毛利率 40%」會做出截然不同的擴張決策。
Simpson 矛盾:每組都贏,整體卻輸
當權重在組之間分布得很不均勻,會出現一個更反直覺的現象:每個分組看起來都優,合計卻反而劣。 這就是 Simpson 矛盾(Simpson's Paradox)。
經典案例:1973 年 UC Berkeley 招生案
柏克萊研究所被質疑性別歧視——整體錄取率男性高於女性。 但拆到「每個系」去看,絕大多數系所女性錄取率反而比男性高。 原因是:女性更傾向申請整體錄取率本來就低的系(如英文、人文), 男性集中申請錄取率高的系(如工程)。 換句話說,差異來自申請選擇的權重,而不是各系的歧視。
商務版範例:兩個 channel 的 conversion
| Channel | 上季流量 / 轉換 | 本季流量 / 轉換 |
|---|---|---|
| SEO | 10,000 / 5.0% | 2,000 / 5.5% |
| 付費廣告 | 2,000 / 1.0% | 10,000 / 1.2% |
| 整體 | 12,000 / ≈ 4.33% | 12,000 / ≈ 1.92% |
兩個 channel 的轉換率各自都改善了(SEO 5.0% → 5.5%、付費 1.0% → 1.2%), 但整體轉換率反而從 4.33% 掉到 1.92%。 原因是流量配置改變——付費廣告比例大幅上升,把整體拉向低轉換的那一端。 看到這種數字千萬不要怪產品團隊,要去問:流量組成是不是換了?
什麼時候最容易踩坑
- 跨期間比較:上季 vs 本季的「整體 X 率」變動,常常是組成改變,不是真實變好或變壞
- 跨部門 / 跨產品線比較:忘了把樣本數作為權重
- 看「平均 NPS」、「平均訂單金額」、「平均轉換率」:只看平均不看分布,極端值或大客戶會嚴重扭曲
- AB test 解讀:忽略樣本流量配置,當實驗組與對照組在子族群分布不同時,整體結果可能誤導
- 跨地區營運報告:各地區佔比不同,整體指標未必反映實際健康度
看資料時的警示燈
任何「平均」、「整體」、「合計」的單一數字,都該觸發一個反射動作:
「組成的權重是什麼?分布長怎樣?」
如果報告只給你一個百分比、不給你分母與分組,那這個數字基本上不能拿來做決策。 有經驗的決策者會立刻要求看拆解後的表格, 因為每個整體數字背後,都可能藏著一個 Simpson 矛盾。
給資料判讀的啟示
加權平均不是進階統計,而是商務判讀的最低門檻。 當有人在會議上端出「整體上升 X%」、「平均改善 Y%」,先問三件事: 分母是什麼?分組怎麼分?權重有沒有變? 這三個問題能幫你避開大多數「數字看起來很漂亮、決策卻很糟糕」的陷阱。 記住:整體數字會說謊,但拆解後的表格不會。