こんにちは、臨床心理士・公認心理師のしあんです。
今回も心理学関連の統計の基礎について説明していきます。

また勉強回!
・尺度って何…?
こんな人たちに向けた解決記事です。
数の分類基準である尺度水準の考えをきちんと理解すると、心理統計への理解もかなり深まるのでしっかり読んでおきましょう。
尺度が分かればその後の統計手法のヒントになりますよ。
・文系の人や心理学を学んでいて統計さっぱりな人
・統計に興味のある人
・尺度水準って何?って人
・基本中の基本用語から学びたい人
※心理系大学院進学希望者は必須記事
まずは数について
そもそも数には決まった値の定数と値が変動する変数があります。
・変数の例…その日の気温や人の体温、身長・体重など変わる数

ふーん、こんなんどうでもよくね?
統計をやっていくと「〇〇変数」などいろいろな用語が増えるので、個人的にはちゃんと把握することがおすすめ。

超基本の用語説明からするよ!
量的変数と質的変数について

早速〇〇変数出てきたな
量的変数は計算目的、質的変数は分類目的の数のことです。
後に出てくる間隔尺度と比例尺度は量的変数で計算が可能で、名義尺度と順序尺度は質的変数で、計算できず分類メインな変数です。

「ふーーん」でOK!
代表値でおおまかな特徴を知ろう!
代表値とはデータ全体の中心的な特徴を把握する値で、
・中央値(メジアン)
・平均値(アベレージ)
これら3つがメジャーです。
56、70、65、62、59、62
例題を見ながら3つの代表値について簡単に紹介しますね。
最頻値(モード)
最頻値は、データの中で現れた回数(度数)が一番多い値です。
56、70、65、62、59、62
例題でいけば「62」が1番多い=最頻値です。

どんな回答が多かったか知りたい時に使うよ
中央値(メジアン)
中央値は数を小さい順に並べたとき真ん中にくる数で、中央値が2つある場合(データが偶数の場合)は2つの平均が中央値です。
56、59、62、62、65、70
今回は(62+62)÷2=62が中央値ですね。

平均値よりも狭い範囲の真ん中を知りたい時に使うよ
平均値(アベレージ)
平均値はご存じの通り、データ全てを足して個数で割った値です。
56、70、65、62、59、62
(56+70+65+62+59+62)÷6=62.33
≒62点が平均値ですね。

平均は極端な値(外れ値)の影響を受けやすいよ
例題を少し変えてみますが、(30+96+65+62+59+62)÷6=62.33≒62点でも平均は同じに。
ちなみに勉強苦手な1人を加えてみます。
(3+70+65+62+59+62)÷6=53.5点になり、平均も6人の出来の良さ(印象)もちょっと下がりますね…。

平均だけで判断するのは信用ならんね
代表値の特徴とイメージはこんな感じ。
・中央値…真ん中は分かるけど全データをみれない
・平均値…全データ見れるけど外れ値の影響大

尺度水準とは数字の意味分け
数についての用語説明をしたところで、具体的にみていきます。
同じ「1」「2」「3」という数でも
・順位の「1位」「2位」「3位」
・温度の「1℃」「2℃」「3℃」
・重さの「1㎏」「2㎏」「3㎏」 など
数の意味や性質はそれぞれ違いますね。
数の意味や性質に沿って数を分類する基準を尺度水準と言い(by S.S.スティーブンス)、
・順序尺度
・間隔尺度
・比例尺度
4つの尺度に分類可能です。
統計処理する際は比例尺度が一番幅広く処理ができ、名義尺度に近づくほど統計処理はしづらくなります(ただの分類になっていく…)。

途中で出るメモ書きは統計使う人用なので参考程度に見てね↓
名義尺度
名義尺度は順番や大小関係などがなく、ただの分類記号としての数です。
・郵便番号の「123-」
・背番号 など

分類、グループ分けの尺度だよ
順序尺度
順序尺度は、数字間の等間隔性はないものの順序や大小関係のある数です。
「1位」と「2位」の間と、「2位」と「3位」の間って等間隔ではないですよね。

ぶっちぎり1位と、2位と3位が僅差とか間隔バラバラ

1分は必ず60秒間隔だから、その場合は等間隔だね
間隔尺度
間隔尺度は順序も等間隔性もあり、ゼロ(原点)がない数です。
・温度の「1℃」「2℃」「3℃」
・日付け など
温度の「0℃」は絶対的な原点ではないので間隔尺度に分類されます。

ゼロ=無と言えるかがポイント
比例尺度
比例尺度は順序も等間隔性もゼロ(原点)もある数です。
・重さの「1㎏」「2㎏」「3㎏」
・お小遣い など

ゼロから始める比例生活
まとめ:代表値や尺度水準はおおまかなデータ把握方法!
数とその分類については、具体的な統計話に入る前に知っておくべき前提知識です。

用語が分かる・分からないでは統計理解に雲泥の差!
計算できる量的変数と分類メインの質的変数があり、データの大まかな特徴を捉えるには3つの代表値があります。
・中央値…順に並べたときの真ん中データ。真ん中は分かるけど全データをみれない
・平均値…全データを見れるけど外れ値の影響大

データをどう捉えるかで採用する代表値は違うよ

代表値知らないと必要なデータ抽出ができんね
また、数の意味や性質で分類する尺度水準には4つの尺度があります。
・順序尺度…順序、大小関係あり。等間隔性なし
・間隔尺度…順序、大小関係、等間隔性あり。ゼロなし
・比例尺度…順序、大小関係、等間隔性、ゼロ全てあり
ただし、代表だからといって1つの見方・データで特徴を把握すると、外れ値を考慮しないなど危険があるので注意。

統計処理するときも、表面上だけ捉えてデータの中身を見ないなんてことがないように気をつけよう!
参考資料
割と本格的な内容をマンガでゆるく解説しているのがこちら。
心理統計に限らず、統計知識が必要な人全般におすすめな1冊です。
そもそもな基本話が多いので、みなさんの「でもさぁ…?」って疑問が載っていて解消されます!

説明多くなってごめん!最後までお勉強お疲れ様っ
コメント