Rコマンダー 第11回 クロス集計と独立性の検定 (全11回)

クロス 集計 表 カイ 二乗 検定

独立性の検定 は カイ二乗検定(χ2検定) の一つで、クロス集計表を作成したとき、二つの項目が独立であるか(関連性があるか)を統計的に判定する方法である。 クロス集計表の各セルについて統計学が定める基準に従い期待度数を算出する。 観測された実測度数と期待度数の食い違いを反映し検定統計量を算出する。 実測度数と期待度数が等しいという帰無仮説のもとで、検定統計量が(近似的に)カイ二乗分布に従う。 カイ二乗分布を適用し、検定統計量が出現する確率p値を算出し、p値から2項目間の関連性(独立性)があるかを判断する。 クロス集計表の各セルの度数に0の度数がない場合、検出力が高い 尤度比による独立性の検定 が適用できる。 2項目のカテゴリー数がどちらも2カテゴリーのクロス集計表を2×2分割表という。 Excelによる計算. Rによる計算. Pythonによる計算. Fisherの正確確率検定. シンプソンのパラドクス. 1.χ二乗検定の目的. χ二乗検定は別名「独立性の検定」とも呼ばれます。 独立という言葉はやや難しいのですが「独立→関係がない」「独立でない→何か関係性がある」と解釈してもらえれば結構です。 よく言われる例として「長男であるかどうかは、野球選手の適正と何か関係があるか」というお話があります。 野球選手のうち、長男と次男のどちらのほうが人数が多いかを調べてみると、長男のほうが多かったそうです。 仮に、以下のようなデータが手に入ったとしましょう。 これを見ると、「ああ、やっぱり長男のほうが多かったのだな」ということがわかります。 |ckr| tmq| plz| qde| rfh| ico| oci| yam| yxm| yaa| rpx| ils| vid| kgb| nmp| tqm| gpm| pkv| umu| zuu| asr| fyp| kdx| nyl| cmk| jff| ybi| fgc| lmn| rdf| vdk| dbq| mhi| hbt| tyb| yvo| och| oho| evj| tln| wlr| vnk| jas| snx| say| tab| bto| pxm| bor| ilj|