なぜt検定を繰り返してはいけないのか
3群以上の場合, すべての組み合わせでt検定を行うと, 偶然による有意差が出やすくなる という問題があります.
一元配置分散分析では, 全体を一度の検定で評価することで, この問題を防ぎます.
3群以上の平均の差を検定する方法
一元配置分散分析(ANOVA)は, 3つ以上の群の平均に差があるかどうか を調べるための検定です.
対応のないt検定は2群までしか扱えませんが, 一元配置分散分析は それを3群以上に拡張した方法と考えることができます.
3群以上の場合, すべての組み合わせでt検定を行うと, 偶然による有意差が出やすくなる という問題があります.
一元配置分散分析では, 全体を一度の検定で評価することで, この問題を防ぎます.
ある教材の学習効果を, 3つの学習方法で比較したとします.
| 方法A | 方法B | 方法C |
|---|---|---|
| 70 | 65 | 80 |
| 72 | 68 | 78 |
| 68 | 70 | 82 |
| 75 | 66 | 79 |
各群の平均は,
$ \bar{x}_A = 71.3 \quad \bar{x}_B = 67.3 \quad \bar{x}_C = 79.8 $
一元配置分散分析では, 次の2つのばらつきを比較します.
群間のばらつきが, 群内のばらつきに比べて 十分大きければ, 「平均に差がある」 と判断します.
分散分析では, ばらつきを 平方和 で表します.
$ SS_B = \sum n_i (\bar{x}_i - \bar{x})^2 $
$ SS_W = \sum \sum (x_{ij} - \bar{x}_i)^2 $
ここで, $\bar{x}$ は全体平均です.
平方和を自由度で割ることで, 平均平方を求めます.
$ MS_B = \frac{SS_B}{k - 1} $
$ MS_W = \frac{SS_W}{N - k} $
これらの比が, F値です.
$ F = \frac{MS_B}{MS_W} $
F値は, 「群間のばらつきが, 群内のばらつきの何倍か」 を表しています.
F値が大きいほど, 群の平均に差がある可能性が高くなります.
F分布を用いてp値を求め, 次のように判断します.
どの群同士が異なるかは, 分散分析だけでは分かりません.
一元配置分散分析を行った結果, 学習方法の主効果が有意であった (F(2, 9) = 15.3, p < .01).
一元配置分散分析で有意差が得られても, どの群同士に差があるのかは分かりません.
ここで個別にt検定を行うと, 偽陽性が増えるという問題があります.
この問題を避けるために, 多重比較 を行います.