こんにちは、臨床心理士・公認心理師のしあんです。
心理学部生や心理系大学院を受験予定の人にとって、避けたいけどぶつかるシリーズ・心理統計の時間です。
✓計算以前に統計の考え方が謎
✓統計って聞くだけで拒否反応
✓よく聞く有意水準5%って何?
今回は、統計処理を行う前の考え方や、よく聞く有意水準に関する2つの誤りについてざっくり解説します。
上記1つでも当てはまる心理の民は本記事を最後まで読んで、統計的仮説検定の考え方をマスターしましょう。
レッツ座学!
※今回解説する考え方や「第1種・第2種の誤り」は試験に出ます
こんな人におすすめ!
・統計を使う文系学生
・そもそもの統計の考え方からつまずいている人
・帰無・対立仮説が分からない人
・第1種・第2種の誤りが分からない人
※心理系大学院受験生は必須
統計的仮説検定とは
統計的仮説検定とは、ある集団における仮説が偶然か意味のある結果かどうかを、統計を使って判断することです。
▼考え方の例
駅にいる大学生100人に『陰キャと友だちの多さ』をインタビューしたところ、8割方が『陰キャは友だちがいない』と回答した。
これは、『=世の大学生の陰キャは友だちがいない』と一般化していいもの?
反語!(悪意ある例だなぁ)
たかが100人の意見を一般化するのは流石に無理があるね
陰キャにも友だち…1人とかちょっとはおる…!
▼計算の例
コイントスを5回したところ5回連続で裏が出た!
これは、偶然?それとも…?
→50%の確率で裏が出るとすると
0.5×0.5×0.5×0.5×0.5=0.03125
5連続で裏が出る確率は≒3.13%
偶然にしては確率低すぎるからダウト
統計的仮説検定はこんな風に、仮説や結果が偶然かそうじゃないかを計算で検証するという考え方です。
専門用語を使うと、帰無仮説と対立仮説で説明できます。
帰無仮説(null hypothesis)…正しくないだろう仮説を立てて、捨てることを目的とした仮説(無に帰す仮説)。「コイントスで5連続裏が出るのは必然である」など
対立仮説(alternative hypothesis)…帰無仮説が捨てられることで採用される仮説(結果は偶然ではないということ)。「コイントスで5連続裏が出るのは偶然ではない」など
卒論や修論など論文を書く際に仮説を立てますが、大抵は帰無仮説を立てます。
帰無仮説を捨てる基準になるのが有意水準です。
有意水準とは
有意水準(significance level)とは、帰無仮説を捨てるための判断基準値で、心理学の研究では5%(や1%)とすることが多いです。
有意水準は研究者によりけりだけど、5%くらいだと差別化しやすくて、10%にしちゃうと偶然でもギリ起こりそうですね~って結果になりがち
有意水準は、後述するリスクがあることから危険率と呼ぶこともあります。「α(アルファ)」と表記することも
有意水準5%を下回る結果なら、このような考えができます。
▼考え方の例
コイントスで5連続裏が出る確率は5%以下
=めちゃくちゃ稀
=偶然にしては確率が低すぎるから何かしら意味がある!
有意水準を下回る結果を統計で得られた場合に帰無仮説を捨て、意味のある数値ということで「有意差がある」と表記します。
心理の民が大好きな有意差です
ちなみに有意差を得られなくても、卒論・修論ならなぜ有意差が得られなかったかという原因を記載していくことはできます。
\ 「考察」を参考に /
また、有意水準で見極めるのはあくまで「偶然起こるかどうか」の確率で、有意差のあるないは必ずしも正確かと言われるとそうではなく、間違っている可能性もあります。
有意水準を信じて帰無仮説を捨てるのが間違いだった場合を第1種の誤り、帰無仮説を捨てない判断が間違いだった場合を第2種の誤りと言います。
ぷすぷす…
第1種の誤り
間違って帰無仮説を捨ててしまうことを第1種の誤りと言います。
つまり、コイントスの例で言うなら、3.13%で5回連続裏が出たのは本当に偶然だった場合があるということです。
偶然起こりうるという線はどんな研究でも捨てきれないということは覚えておきましょう。
有意差出ると嬉しくなってあれこれ考察書きたくなるけど、調子に乗りすぎないようにね
第1種の誤りを念頭に置かないと、本当は偶然の出来事に全く関係ない意味を持たせてしまう危険な可能性があります(例:本当は偶然5回連続コインで裏が出ただけなのに、ハンドパワーがあるとか決めつけるなど)。
デタラメな論文世に放つと怖いでぇ
第1種の誤りが起こりうる確率=有意水準(第1種の誤りが起こる危険率ということ)
第1種の誤りは、有意水準を1%など下げるほど生じにくくなります。
でも有意水準1%ってかなり厳しいから5%設定する人多い
第2種の誤り
有意差があるにもかかわらず帰無仮説を捨てないことを第2種の誤りと言います。
第2種の誤りが起こる確率は「β(ベータ)」と表記する
つまり、コイントスの例で言うなら、5回連続裏が出る確率は3.13%で有意に低いはずなのに偶然のことと信じてしまうことになります。
賭け事してたら偶然で済ますにはやばそうだね
第1種の誤りを回避しようと有意水準を低くしすぎると、本当は捨てられるはずの帰無仮説を捨てられなくなってしまい、今度は第2種の誤りを引き起こす可能性が高まります。
第1種・第2種どっちのケアもするには有意水準5%がベストな塩梅なのかもね
おわりに:偶然の可能性がどれだけあるかを吟味しよう
心理学で扱う統計的仮説検定の考え方は、「ある出来事は偶然で関係ない・差はない」とする帰無仮説を立てて検証し、「実は偶然ではない・有意差がある」という対立仮説を採用する流れが主流です。
帰無仮説を採用するか捨てるかの判断基準は有意水準5%の場合が多いですが、2つのリスクを覚えておきましょう。
①第1種の誤り…帰無仮説を捨てる過ち(本当は偶然起きたことに別な意味を付与してしまう危険)
②第2種の誤り…本当は帰無仮説を捨てていいのに捨てない過ち
2つのリスクを完全にゼロにすることはできないため、2つの可能性を知り、統計の数値を吟味し、飛躍した考察にならないように注意しましょう。
論文書く際は統計結果から読み取れることを丁寧に書ければOK
一通りの心理統計を院試までに覚えたい人は下記をチェック。
特に、「統計」という言葉で拒絶反応がある人は、上記みたいになるべくイラスト付きやカラーの参考書をおすすめします。
本当に苦手な分野は真面目な参考書は読もうと思えねぇ!←
何でもいいけど1冊丸々インプットすればOK
コメント