フィッシャーの正確確率検定

少数データでも正確に関連を調べる検定

この検定は何をするもの?

フィッシャーの正確確率検定は, 2×2分割表において, 2つのカテゴリ変数の間に 関連があるかどうかを調べる検定です.

特に, サンプル数が少ない場合 に用いられます.

なぜこの検定が必要なのか

カイ二乗検定は, 観測度数が十分に大きいことを前提としています.

しかし, 期待度数が小さいセルがある場合, カイ二乗検定の結果は 信頼できなくなります.

そのような状況でも 正確にp値を計算できるのが, フィッシャーの正確確率検定です.

具体例

ある治療法と改善の有無の関係を調べます.

改善あり 改善なし 合計
治療あり 3 1 4
治療なし 1 3 4
合計 4 4 8

カイ二乗検定との違い

カイ二乗検定 フィッシャー検定
前提条件 期待度数が十分大きい 前提条件なし
p値 近似値 正確な値
主な用途 サンプル数が多い場合 サンプル数が少ない場合

考え方のポイント

フィッシャーの正確確率検定では, 行と列の合計が固定されていると仮定します.

その条件のもとで, 今回のような分割表が どれくらい起こりにくいか を計算します.

確率の計算式

2×2表における確率は, 次の式で計算されます.

$ P = \frac{ \binom{a+b}{a} \binom{c+d}{c} }{ \binom{n}{a+c} } $

ここで, $a,b,c,d$ は各セルの度数, $n$ は全体の合計です.

p値の意味

観測された表と, それ以上に極端な表が 生じる確率の合計が, p値になります.

p < 0.05 の場合, 2つの変数の間に 有意な関連がある と判断します.

論文での書き方(例)

フィッシャーの正確確率検定の結果, 治療の有無と改善の有無の間に 有意な関連が認められた (p = .029).

まとめ