商務指標5 分鐘閱讀

加權平均的盲點:為什麼整體數字常常騙人

會議上有人喊出「整體錄取率 45%」、「整體 churn 6.5%」、「整體毛利率 40%」—— 聽起來合理,但只要背後牽涉到不同樣本數的群組, 這些「兩個百分比加起來除以二」的算法幾乎都是錯的。 這篇講加權平均,以及它最危險的延伸:Simpson 矛盾

核心觀念:百分比不能直接平均

百分比、比率、轉換率、毛利率、利率—— 這些數字本身已經是「分子 ÷ 分母」的結果。 當兩組的分母大小不同,把兩個結果再平均一次,等於默認「兩組樣本一樣大」, 這就是錯誤的根源。

整體 = Σ(value × weight) ÷ Σ(weight)

其中 weight 通常是「該組的樣本數、營收、流量」等實際規模。

範例 1:兩部門的錄取率

部門申請人數錄取率錄取人數
A10030%30
B20060%120
合計30050%150

直覺平均會說 (30% + 60%) ÷ 2 = 45%, 但實際整體錄取率是 150 ÷ 300 = 50%。 因為 B 部門的樣本是 A 的兩倍,B 的高錄取率「拉動」整體更多。

範例 2:整體 churn

方案客戶數churn流失客戶
自助方案10,0003%300
企業方案1,00010%100
合計11,000≈ 3.6%400

直覺平均 (3% + 10%) ÷ 2 = 6.5%,但企業客戶只佔不到 10%, 整體 churn 應該是 400 ÷ 11,000 ≈ 3.6%。 如果你拿 6.5% 去做財務預測,預估流失人數會多估接近一倍。

範例 3:整體毛利率

產品營收毛利率毛利
主力產品500 萬20%100 萬
新品100 萬60%60 萬
合計600 萬≈ 26.7%160 萬

直覺平均會說 (20% + 60%) ÷ 2 = 40%, 但新品營收只佔 1/6,整體毛利率應該是 160 ÷ 600 ≈ 26.7%。 董事會看到「整體毛利率 40%」會做出截然不同的擴張決策。

Simpson 矛盾:每組都贏,整體卻輸

當權重在組之間分布得很不均勻,會出現一個更反直覺的現象:每個分組看起來都優,合計卻反而劣。 這就是 Simpson 矛盾(Simpson's Paradox)。

經典案例:1973 年 UC Berkeley 招生案

柏克萊研究所被質疑性別歧視——整體錄取率男性高於女性。 但拆到「每個系」去看,絕大多數系所女性錄取率反而比男性高。 原因是:女性更傾向申請整體錄取率本來就低的系(如英文、人文), 男性集中申請錄取率高的系(如工程)。 換句話說,差異來自申請選擇的權重,而不是各系的歧視。

商務版範例:兩個 channel 的 conversion

Channel上季流量 / 轉換本季流量 / 轉換
SEO10,000 / 5.0%2,000 / 5.5%
付費廣告2,000 / 1.0%10,000 / 1.2%
整體12,000 / ≈ 4.33%12,000 / ≈ 1.92%

兩個 channel 的轉換率各自都改善了(SEO 5.0% → 5.5%、付費 1.0% → 1.2%), 但整體轉換率反而從 4.33% 掉到 1.92%。 原因是流量配置改變——付費廣告比例大幅上升,把整體拉向低轉換的那一端。 看到這種數字千萬不要怪產品團隊,要去問:流量組成是不是換了?

什麼時候最容易踩坑

  • 跨期間比較:上季 vs 本季的「整體 X 率」變動,常常是組成改變,不是真實變好或變壞
  • 跨部門 / 跨產品線比較:忘了把樣本數作為權重
  • 看「平均 NPS」、「平均訂單金額」、「平均轉換率」:只看平均不看分布,極端值或大客戶會嚴重扭曲
  • AB test 解讀:忽略樣本流量配置,當實驗組與對照組在子族群分布不同時,整體結果可能誤導
  • 跨地區營運報告:各地區佔比不同,整體指標未必反映實際健康度

看資料時的警示燈

任何「平均」、「整體」、「合計」的單一數字,都該觸發一個反射動作:

「組成的權重是什麼?分布長怎樣?」

如果報告只給你一個百分比、不給你分母與分組,那這個數字基本上不能拿來做決策。 有經驗的決策者會立刻要求看拆解後的表格, 因為每個整體數字背後,都可能藏著一個 Simpson 矛盾。

給資料判讀的啟示

加權平均不是進階統計,而是商務判讀的最低門檻。 當有人在會議上端出「整體上升 X%」、「平均改善 Y%」,先問三件事: 分母是什麼?分組怎麼分?權重有沒有變? 這三個問題能幫你避開大多數「數字看起來很漂亮、決策卻很糟糕」的陷阱。 記住:整體數字會說謊,但拆解後的表格不會