外れ値を除いた平均
データのばらつきを表す値。
1. 各データと平均値の差を求める
2. 1で求めた値を2乗する
3. 2で求めた値をすべて足す
4. 3で求めた値をデータ数で割る
例)
import numpy as np x = [1,2,3,4,5] np.sum((x - np.mean(x)) ** 2) / len(x) # 2.0
標準偏差を求めるには、分散の平方根(ルート)をとる。
import numpy as np x = [1,2,3,4,5] np.std(x) # 1.4142135623730951 np.sqrt(np.sum((x - np.mean(x)) ** 2) / len(x)) # 1.4142135623730951
(データ - 平均) / 標準偏差
※標準偏差何個分離れているか (平均を1とする)
※±1 以内は全体の 68% に含まれる
異なる母数を持つ複数の平均の平均を求める
平均 ± 標準偏差 * 4 (範囲外は外れ値として扱う。等)