商務指標5 分鐘閱讀

加權平均的盲點：為什麼整體數字常常騙人

會議上有人喊出「整體錄取率 45%」、「整體 churn 6.5%」、「整體毛利率 40%」—— 聽起來合理，但只要背後牽涉到不同樣本數的群組，這些「兩個百分比加起來除以二」的算法幾乎都是錯的。這篇講加權平均，以及它最危險的延伸：Simpson 矛盾。

核心觀念：百分比不能直接平均

百分比、比率、轉換率、毛利率、利率—— 這些數字本身已經是「分子 ÷ 分母」的結果。當兩組的分母大小不同，把兩個結果再平均一次，等於默認「兩組樣本一樣大」，這就是錯誤的根源。

整體 = Σ(value × weight) ÷ Σ(weight)

其中 weight 通常是「該組的樣本數、營收、流量」等實際規模。

範例 1：兩部門的錄取率

部門	申請人數	錄取率	錄取人數
A	100	30%	30
B	200	60%	120
合計	300	50%	150

直覺平均會說 (30% + 60%) ÷ 2 = 45%，但實際整體錄取率是 150 ÷ 300 = 50%。因為 B 部門的樣本是 A 的兩倍，B 的高錄取率「拉動」整體更多。

範例 2：整體 churn

方案	客戶數	churn	流失客戶
自助方案	10,000	3%	300
企業方案	1,000	10%	100
合計	11,000	≈ 3.6%	400

直覺平均 (3% + 10%) ÷ 2 = 6.5%，但企業客戶只佔不到 10%，整體 churn 應該是 400 ÷ 11,000 ≈ 3.6%。如果你拿 6.5% 去做財務預測，預估流失人數會多估接近一倍。

範例 3：整體毛利率

產品	營收	毛利率	毛利
主力產品	500 萬	20%	100 萬
新品	100 萬	60%	60 萬
合計	600 萬	≈ 26.7%	160 萬

直覺平均會說 (20% + 60%) ÷ 2 = 40%，但新品營收只佔 1/6，整體毛利率應該是 160 ÷ 600 ≈ 26.7%。董事會看到「整體毛利率 40%」會做出截然不同的擴張決策。

Simpson 矛盾：每組都贏，整體卻輸

當權重在組之間分布得很不均勻，會出現一個更反直覺的現象：每個分組看起來都優，合計卻反而劣。這就是 Simpson 矛盾（Simpson's Paradox）。

經典案例：1973 年 UC Berkeley 招生案

柏克萊研究所被質疑性別歧視——整體錄取率男性高於女性。但拆到「每個系」去看，絕大多數系所女性錄取率反而比男性高。原因是：女性更傾向申請整體錄取率本來就低的系（如英文、人文），男性集中申請錄取率高的系（如工程）。換句話說，差異來自申請選擇的權重，而不是各系的歧視。

商務版範例：兩個 channel 的 conversion

Channel	上季流量 / 轉換	本季流量 / 轉換
SEO	10,000 / 5.0%	2,000 / 5.5%
付費廣告	2,000 / 1.0%	10,000 / 1.2%
整體	12,000 / ≈ 4.33%	12,000 / ≈ 1.92%

兩個 channel 的轉換率各自都改善了（SEO 5.0% → 5.5%、付費 1.0% → 1.2%），但整體轉換率反而從 4.33% 掉到 1.92%。原因是流量配置改變——付費廣告比例大幅上升，把整體拉向低轉換的那一端。看到這種數字千萬不要怪產品團隊，要去問：流量組成是不是換了？

什麼時候最容易踩坑

跨期間比較：上季 vs 本季的「整體 X 率」變動，常常是組成改變，不是真實變好或變壞
跨部門 / 跨產品線比較：忘了把樣本數作為權重
看「平均 NPS」、「平均訂單金額」、「平均轉換率」：只看平均不看分布，極端值或大客戶會嚴重扭曲
AB test 解讀：忽略樣本流量配置，當實驗組與對照組在子族群分布不同時，整體結果可能誤導
跨地區營運報告：各地區佔比不同，整體指標未必反映實際健康度

看資料時的警示燈

任何「平均」、「整體」、「合計」的單一數字，都該觸發一個反射動作：

「組成的權重是什麼？分布長怎樣？」

如果報告只給你一個百分比、不給你分母與分組，那這個數字基本上不能拿來做決策。有經驗的決策者會立刻要求看拆解後的表格，因為每個整體數字背後，都可能藏著一個 Simpson 矛盾。

給資料判讀的啟示

加權平均不是進階統計，而是商務判讀的最低門檻。當有人在會議上端出「整體上升 X%」、「平均改善 Y%」，先問三件事：分母是什麼？分組怎麼分？權重有沒有變？這三個問題能幫你避開大多數「數字看起來很漂亮、決策卻很糟糕」的陷阱。記住：整體數字會說謊，但拆解後的表格不會。