箱ひげ図はデータの分布を簡単に確認でき、分布同士を比較する場合に非常に便利である。
○箱ひげ図で確認するポイント
- 箱ひげ図の全長から分かるばらつき
- 中央値と平均値のズレ
- 外れ値からの外れ具合
○外れ値が発生する確率
データが正規分布に従うと仮定した場合、
- 中央値=平均値
- 第一四分値の確率(第三四分値の確率)=Zσ=0.67σ
外れ値にならない範囲は、25%点(75%点)±1.5×IQR = 0.67σ + 1.5*1.34 σ= ±2.67σ →確率としては99.2% (±3σは99.7%)
つまり、箱ひげ図で外れ値となる確率は0.8% (12500分の1)
参考:箱ひげ図(ボックスプロット)の外れ値 どのくらいの確率で外れる?