数理コンサルタントの備忘録

あなたの悩みを数理で解決する

箱ひげ図の基本

箱ひげ図はデータの分布を簡単に確認でき、分布同士を比較する場合に非常に便利である。

○箱ひげ図で確認するポイント

  • 箱ひげ図の全長から分かるばらつき
  • 中央値と平均値のズレ
  • 外れ値からの外れ具合

○外れ値が発生する確率

データが正規分布に従うと仮定した場合、

  • 中央値=平均値
  • 第一四分値の確率(第三四分値の確率)=Zσ=0.67σ

外れ値にならない範囲は、25%点(75%点)±1.5×IQR = 0.67σ + 1.5*1.34 σ= ±2.67σ →確率としては99.2% (±3σは99.7%)
つまり、箱ひげ図で外れ値となる確率は0.8% (12500分の1)

f:id:guitartakahiro:20210429194502p:plain
参考:箱ひげ図(ボックスプロット)の外れ値 どのくらいの確率で外れる?