偏差平方和の公式と式変形

 筆者は現在、統計学を自習しています。その中で、偏差平方和(「平方和」とも呼ばれます)の表記の仕方が2通りありました。

 平方和とは、「あるデータ群における、各データの偏差の2乗の和」です。ここで偏差とは、その値から平均値を引いたものです。全データ数が\(n\)個の時、\(i\)番目のデータを\(x_i\)とすると、平均値\(\bar{x}\)は

\(\bar{x}=\dfrac{\displaystyle\sum_{i=1}^{n}x_i}{n}\)

と表され、これより\(i\)番目のデータの偏差は

\(x_i-\bar{x}\)

となります。

 偏差平方和\(S\)は、その名の通り偏差を平方した(=2乗した)和のことを指し、

\(S=\displaystyle\sum_{i=1}^{n}(x_i-\bar{x})^2\) ……①

 と表現されることが多いです。一方で、

\(S=\displaystyle\sum_{i=1}^{n}{x_i}^2-\dfrac{\displaystyle\Bigl(\sum_{i=1}^{n}x_i\Bigl)^2}{n}\) ……②

と表現されることもあります。式①と②が同じであることがすぐに理解できなかったので、式①から②へと式変形してみます。

 わかりやすく\(n=3\)とします。この時、

\(\begin{eqnarray}
S&=&(x_1-\bar{x})^2+(x_2-\bar{x})^2+(x_3-\bar{x})^2\\[5pt]
&=&{x_1}^2+{x_2}^2+{x_3}^2+3\bar{x}^2-2\bar{x}(x_1+x_2+x_3)\\[5pt]
&=&\displaystyle\sum_{i=1}^{3}{x_i}^2+3\Bigl(\dfrac{x_1+x_2+x_3}{3}\Bigl)^2-2\Bigl(\dfrac{x_1+x_2+x_3}{3}\Bigl)(x_1+x_2+x_3)\\[5pt]
&=&\displaystyle\sum_{i=1}^{3}{x_i}^2-\dfrac{\displaystyle\Bigl(\sum_{i=1}^{3}x_i\Bigl)^2}{3}
\end{eqnarray}\)

となります。

 3を\(n\)としても式変形は同じになります。これで、式①と②が同じであることが個人的にも納得できました。参考になれば幸いです。

コメント

タイトルとURLをコピーしました