なぜこの検定が必要なのか
カイ二乗検定は, 観測度数が十分に大きいことを前提としています.
しかし, 期待度数が小さいセルがある場合, カイ二乗検定の結果は 信頼できなくなります.
そのような状況でも 正確にp値を計算できるのが, フィッシャーの正確確率検定です.
少数データでも正確に関連を調べる検定
フィッシャーの正確確率検定は, 2×2分割表において, 2つのカテゴリ変数の間に 関連があるかどうかを調べる検定です.
特に, サンプル数が少ない場合 に用いられます.
カイ二乗検定は, 観測度数が十分に大きいことを前提としています.
しかし, 期待度数が小さいセルがある場合, カイ二乗検定の結果は 信頼できなくなります.
そのような状況でも 正確にp値を計算できるのが, フィッシャーの正確確率検定です.
ある治療法と改善の有無の関係を調べます.
| 改善あり | 改善なし | 合計 | |
|---|---|---|---|
| 治療あり | 3 | 1 | 4 |
| 治療なし | 1 | 3 | 4 |
| 合計 | 4 | 4 | 8 |
| カイ二乗検定 | フィッシャー検定 | |
|---|---|---|
| 前提条件 | 期待度数が十分大きい | 前提条件なし |
| p値 | 近似値 | 正確な値 |
| 主な用途 | サンプル数が多い場合 | サンプル数が少ない場合 |
フィッシャーの正確確率検定では, 行と列の合計が固定されていると仮定します.
その条件のもとで, 今回のような分割表が どれくらい起こりにくいか を計算します.
2×2表における確率は, 次の式で計算されます.
$ P = \frac{ \binom{a+b}{a} \binom{c+d}{c} }{ \binom{n}{a+c} } $
ここで, $a,b,c,d$ は各セルの度数, $n$ は全体の合計です.
観測された表と, それ以上に極端な表が 生じる確率の合計が, p値になります.
p < 0.05 の場合, 2つの変数の間に 有意な関連がある と判断します.
フィッシャーの正確確率検定の結果, 治療の有無と改善の有無の間に 有意な関連が認められた (p = .029).