#author("2019-10-30T06:30:39+00:00","","") #mynavi() #setlinebreak(on) #html(<script async src="https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.2/MathJax.js?config=TeX-MML-AM_CHTML"></script>) * 目次 [#gbdcb128] #contents() - 関連 -- [[機械学習の為の数学の基礎]] - 参考 -- [[統計Web>https://bellcurve.jp/statistics/]] * 平均値 [#h483edc5] ** トリム平均 [#d316d1d2] 外れ値を除いた平均 * 中央値 [#d619971c] * 最頻値 [#yf66f31a] * 分散 [#r4230542] #html(<div style="padding-left: 10px;">) データのばらつきを表す値。 #html(<div style="display: inline-block; vertical-align: top;">) 1. 各データと平均値の差を求める 2. 1で求めた値を2乗する 3. 2で求めた値をすべて足す 4. 3で求めた値をデータ数で割る #html(</div>) #html(<div style="display: inline-block; vertical-align: top; padding: 30px;"> → </div>) #html(<div style="display: inline-block; vertical-align: top; padding: 20px;">) #html(){{ <math> <mrow> <mfrac> <mi>1</mi> <mo>n</mo> </mfrac> </mrow> <munderover> <mi>∑</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mrow> <msup> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>-</mo> <mover> <mi>x</mi> <mo>-</mo> </mover> <mo>)</mo> </mrow> <mi>2</mi> </msup> </mrow> </math> }} #html(</div>) 例) #mycode2(){{ import numpy as np x = [1,2,3,4,5] np.sum((x - np.mean(x)) ** 2) / len(x) # 2.0 }} #html(</div>) * 標準偏差 [#nb151669] #html(<div style="padding-left: 10px;">) 標準偏差を求めるには、分散の平方根(ルート)をとる。 #mycode2(){{ import numpy as np x = [1,2,3,4,5] np.std(x) # 1.4142135623730951 np.sqrt(np.sum((x - np.mean(x)) ** 2) / len(x)) # 1.4142135623730951 }} #html(</div>) * 偏差値 [#i9855424] * 相関係数 [#xc2ec0e9] * 標準化係数 [#rabe09ac] (データ - 平均) / 標準偏差 ※標準偏差何個分離れているか (平均を1とする) ※±1 以内は全体の 68% に含まれる * P値 [#n9dbf60c] * 有意水準 [#i8cc1bb0] * 効果量 [#he47c768] * 検出力 [#x0752a31] * t検定 [#vf10a21a] * 加重平均 [#db3031bc] 異なる母数を持つ複数の平均の平均を求める * ±4σ [#e5547bf0] 平均 ± 標準偏差 * 4 (範囲外は外れ値として扱う。等)