こんにちは、臨床心理士・公認心理師のしあんです。
今回は心理学の研究の基礎や心理統計の座学である、信頼性と妥当性の話を解説していきます。
性格検査やうつ病などの精神疾患に関する検査まで、心理学の検査(質問紙)を適当なものと思っていませんか?
世間でよくある心理テストとは違うのだ
心理学はあくまで科学的な学問であり、心理検査も科学的根拠に基づいています。
信頼性・妥当性については卒論・修論でも口酸っっっぱく指摘されることなのでざっくりでも理解しておきましょう。
こんな人におすすめ!
・信頼性と妥当性の理解があいまいな人
・心理系大学院受験予定の人
・臨床心理士(公認心理師)受験予定の人
・統計を用いる学生
迷える子羊たちへ捧ぐ心理統計
心理検査とは
人の状態をみるには観察・調査・面接などいろいろな方法がありますが、心理検査もそのうちの1つです。
心理検査とは人の性格や知能、病態水準(精神疾患の度合い)などを客観的に評価するための検査を指します。
いわゆる『心理テスト』とは違い、心理検査では目に見えない概念である心の状態を客観的に測るために、信頼性と妥当性が求められます。
心理検査にはある程度信ぴょう性があるってこと
ただし、客観性があるからと言って心理検査で精神疾患を診断するようなことはできません。
心理検査で診断する心理士たまにいるけど診断は医師がします!!
その人の特徴はみれるけど参考程度にね
信頼性と妥当性は、心理検査の質をある程度保障する概念と言えます。
\ 心理検査の概要 /
信頼性(reliability)とは
信頼性とはデータの一貫性のことで、いつ、誰が、何度同じ検査をしてもある程度同じ結果が得られるかを示すことです。
たとえば、うつ病の検査を作ったとして、ずっと沈み切っている慢性的なうつ病患者に定期的に検査を受けてもらったとします。
1回目の結果がうつレベル90%、2回目が20%、3回目が70%…と結果が出たとき、その人の状態も考慮する必要はもちろんありますが、データとして信用できると思いますか?
こんな心理検査は嫌だ
信頼性を求めるには、心理検査以外の要因(同じような検査環境か、同じような対象に実施しているかなど)をある程度統制する必要があるため正直難しい概念ですが、結果の誤差を小さくすることで心理検査の信頼性は高まると言えます。
信頼性の検討
信頼性を検討するための代表的な方法を4つ解説します。
心理検査や尺度を作成する場合に必要になるため、メリット・デメリットも把握しておきましょう。
①再検査法
再検査法は、同じ集団に一定期間をおいて同じ検査を実施し、2回の結果がどれほど似ているか相関係数を求める方法です。
〇信頼性の定義に合っていて、再現性の高さが証明できる
〇直観的にも分かりやすい
△一定時間必要なため時間コストがかかる
△被験者の記憶力や学習により結果が歪む可能性あり
シンプルイズベスト!
②平行検査法
平行検査法は、形式や難易度、平均点などが似通った2つの検査を作成し、同時に実施して両者の相関係数を求める方法です。
〇同時実施のため時間コストは少ない
〇被験者の学習などで結果が歪まない
△性質が似通った検査2つを作るとか難しすぎワロタ
心の声漏れたわ
また、等価性といって、検査1で図ろうとしている概念Aと検査2で扱う概念Bとの間に一定の関連がみられれば、それもまた信頼性の1つとして考えられるため、等価性をみれるのもメリットと言えます。
③折半法
折半法は、1つの検査を均等な結果になるように2群化し、両群の得点間の相関係数を算出する方法です。
〇並行検査を作る必要がないため、検査の作成コストが少ない
△1つの検査をどうやって均等に2群化するの??
折半方法は、質問紙の前半と後半、奇数質問と偶数質問などランダムになるようにする場合が良いです(が、きちんと均等に2群化されるかは不明)。
個人的には一番パッとしない印象
④クロンバックのα係数
クロンバックのα係数は、検査の内的整合性を測る方法です。
内的整合性とは、質問紙などの検査項目(質問内容)同士にばらつきがなく、一貫性があることを指します。
うつ病の質問紙を作成するにあたって以下の質問項目を用意。
① 「いつも気分が落ち込む」
② 「眠れないことが多い」
うつ病の回答者がどちらも「はい」と答えれば、①と②は互いに内的整合性が高い=信頼性があると考えられる。
③ 「明るく笑顔でいられることが多い」
①と②は「はい」でも③を「いいえ」と答える人が多ければ、③のみ内的整合性が低い=信頼性が低いと考える。
検査内容が関係ある項目で構成されているか確認することだね
α係数は0~1の範囲にあり、統計結果の数値がだいたい0.7~0.8以上であれば信頼性が高いとします。
それ以下の数値の項目があれば削除して、選りすぐりの質問項目で再計算→α係数のチェックを繰り返すことで信頼性を高めていくことができます(計算はPCに任せる)。
卒論・修論で質問紙作成する人はα係数必須よ
〇①~③のデメリットをすべて解消できる
△計算が難しい。PC頼れるが統計できないとだめ
妥当性(validity)とは
妥当性は、検査で本当に測りたいことを測れているかというデータの的確さを指します。
信頼性のように1つの方法ではなく、いろいろな観点から測っていく概念です(本記事では代表的な3つを解説)。
概念の話だから抽象的だけどよく読んで理解しようね
妥当性について例を挙げておくと、たとえば、うつ病の人がうつ病の検査を受けて、うつの症状が出ているという結果が出れば、うつの検査で測りたいこと(うつであるか)が測れている=妥当性が高いと考えられます。
そもそも目的に合ってるかって話
①内容的妥当性
内容的妥当性は、測定したい領域をきちんと網羅できているか確認することを指します。
▼内容的妥当性の例
・国語のテストなのに中身は英語
・高校入試で中学の勉強範囲外が出る
・洋食セットなのに内容は和食 など
有名高校の入試で問われがち
内容的妥当性の検証は個人の主観で判断されがちです…。
②基準関連妥当性
基準関連妥当性は、本検査のほかに関連があると思われる外的な基準と、実際どれほど関連しているかを確認することを指します。
▼基準関連妥当性の例
・うつ病の新しい検査を作成し、うつと関連ありと思われる不安と実際どれだけ関連があるか調べる
・職業適性検査の得点と、入社後の実際の成績や得点の関連性を調べる など
関連のある証拠があるか調べるイメージ
基準関連妥当性は、新しく作成した検査と既存の検査の関連性を計算すればOK。
③構成概念妥当性
構成概念妥当性は、検査が意図した構成概念を適切に測定できているか確認することを指します。
心理学で扱うほとんどは構成概念です
▼構成概念妥当性の例
・うつ病を測る検査は、本当にうつ病について測定できているか
新規作成した検査で本当に測りたいことを測れているのか問いただすという、心理学の中でも基本の妥当性です。
偉そうに言いながら検証も最難関(ドウスンノコレ)
信頼性と妥当性の関連
データの一貫性である信頼性は、データ同士の比較・計算である程度測定が可能ですが、妥当性にはきちんとした測定法がなく、専門家同士の指摘などで確認されがちです。
計算に基づく信頼性 vs 主観に依存しやすい妥当性ということもあり、以下2点が重視されます。
✓妥当性が高いと信頼性も高い
心理関係者は全員覚えておこう。試験に出ます
百発百中で同じところに刺さるダーツであっても、すべて的外に刺さっていたら、それはダーツのプロとしてどれだけ保障されるでしょうか。
ある意味すごいけど残念
同様に、データが一貫していて信頼性があっても、測りたいことを測れていなければ(妥当性が低ければ)質が高いものとは言えません。
おわりに:測りたい概念を何度も測れることが大切!
信頼性と妥当性は、心理検査の質を保障したり、卒論や修論で心理検査・尺度を作成する際に気をつけるべき大切な概念です。
妥当性…データの的確さ
心をはじめ、心理学で扱うことは目に見えないものが基本であるため、信頼性や妥当性をしっかり吟味し、少しでもデータに基づいた結果を見出していきましょう。
胡散臭さを晴らしていこう!
心理系大学院の院試に向けて心理統計を勉強したい人は、参考書を使って読み込んでおきましょう。
文系にとっては数字が苦手な人は多いと思います…。
固い表現や数式を見ても苦手意識が強まるだけと思いますが、上記の参考書は比較的柔らかい表現でイラストも多いため、初学者や筆者みたいに数字が苦手な人は参考にどうぞ!
勉強お疲れさまでした!
コメント