\Amazon プライムビデオで息抜きにアニメ・ドラマが見放題!/

【心理統計】代表値や尺度水準を知る!【超入門・基礎】

大まかなデータを知る 勉強ノート
この記事は約7分で読めます。

こんにちは、臨床心理士・公認心理師のしあんです。

今回も心理学関連の統計の基礎について説明していきます。

闇しあん
闇しあん

また勉強回!

・統計用語の意味がそもそも分からない
・尺度って何…?

こんな人たちに向けた解決記事です。

数の分類基準である尺度水準の考えをきちんと理解すると、心理統計への理解もかなり深まるのでしっかり読んでおきましょう。

尺度が分かればその後の統計手法のヒントになりますよ。

こんな人におすすめ!
・文系の人や心理学を学んでいて統計さっぱりな人
・統計に興味のある人
・尺度水準って何?って人
・基本中の基本用語から学びたい人
※心理系大学院進学希望者は必須記事

まずは数について

数字

そもそも数には決まった値の定数値が変動する変数があります。

・定数の例…地域の郵便番号や銀行コード、円周率3.14など固定の数
・変数の例…その日の気温や人の体温、身長・体重など変わる数
闇しあん
闇しあん

ふーん、こんなんどうでもよくね?

統計をやっていくと「〇〇変数」などいろいろな用語が増えるので、個人的にはちゃんと把握することがおすすめ。

しあん
しあん

超基本の用語説明からするよ!

量的変数と質的変数について

闇しあん
闇しあん

早速〇〇変数出てきたな

量的変数は計算目的、質的変数は分類目的の数のことです。

後に出てくる間隔尺度と比例尺度は量的変数で計算が可能で、名義尺度と順序尺度は質的変数で、計算できず分類メインな変数です。

しあん
しあん

「ふーーん」でOK!

代表値でおおまかな特徴を知ろう!

棒グラフイラスト

代表値とはデータ全体の中心的な特徴を把握する値で、

・最頻値(モード)
・中央値(メジアン)
・平均値(アベレージ)

これら3つがメジャーです。

▼例題:6人のテストの点数
56、70、65、62、59、62

例題を見ながら3つの代表値について簡単に紹介しますね。

最頻値(モード)

最頻値は、データの中で現れた回数(度数)が一番多い値です。

▼例題:6人のテストの点数
56、70、65、62、59、62

例題でいけば「62」が1番多い=最頻値です。

しあん
しあん

どんな回答が多かったか知りたい時に使うよ

中央値(メジアン)

中央値は数を小さい順に並べたとき真ん中にくる数で、中央値が2つある場合(データが偶数の場合)は2つの平均が中央値です。

▼例題:6人のテストの点数
56、59、62、62、65、70

今回は(62+62)÷2=62が中央値ですね。

しあん
しあん

平均値よりも狭い範囲の真ん中を知りたい時に使うよ

平均値(アベレージ)

平均値はご存じの通り、データ全てを足して個数で割った値です。

▼例題:6人のテストの点数
56、70、65、62、59、62

(56+70+65+62+59+62)÷6=62.33

≒62点が平均値ですね。

しあん
しあん

平均は極端な値(外れ値)の影響を受けやすいよ

例題を少し変えてみますが、(3096+65+62+59+62)÷6=62.33≒62点でも平均は同じに。

ちなみに勉強苦手な1人を加えてみます。

+70+65+62+59+62)÷6=53.5点になり、平均も6人の出来の良さ(印象)もちょっと下がりますね…。

闇しあん
闇しあん

平均だけで判断するのは信用ならんね

代表値の特徴とイメージはこんな感じ。

・最頻値…あまり役立たないことが多いけど外れ値に強い
・中央値…真ん中は分かるけど全データをみれない
・平均値…全データ見れるけど外れ値の影響大
代表値イメージ
平均値は外れ値に引っ張られやすいことと、どの代表値もデータが少ないとあまり意味がない点は知っておきたいところ。

尺度水準とは数字の意味分け

ファイルボックス

数についての用語説明をしたところで、具体的にみていきます。

同じ「1」「2」「3」という数でも

・郵便番号の「123ー」
・順位の「1位」「2位」「3位」
・温度の「1℃」「2℃」「3℃」
・重さの「1㎏」「2㎏」「3㎏」 など

数の意味や性質はそれぞれ違いますね。

数の意味や性質に沿って数を分類する基準を尺度水準と言い(by S.S.スティーブンス)、

・名義尺度
・順序尺度
・間隔尺度
・比例尺度

4つの尺度に分類可能です。

統計処理する際は比例尺度が一番幅広く処理ができ、名義尺度に近づくほど統計処理はしづらくなります(ただの分類になっていく…)

しあん
しあん

途中で出るメモ書きは統計使う人用なので参考程度に見てね↓

名義尺度

ファイル名分け

名義尺度は順番や大小関係などがなく、ただの分類記号としての数です。

・男を「1」、女を「2」としてデータ分けする
・郵便番号の「123-」
・背番号 など
しあん
しあん

分類、グループ分けの尺度だよ

▼統計手法の補足
名義尺度では、χ2検定(カイ二乗検定)やU検定を使う
※代表値は最頻値のみ

順序尺度

トランプ

順序尺度は、数字間の等間隔性はないものの順序や大小関係のある数です。

・成績や順位の「1位」「2位」「3位」 など

「1位」と「2位」の間と、「2位」と「3位」の間って等間隔ではないですよね。

闇しあん
闇しあん

ぶっちぎり1位と、2位と3位が僅差とか間隔バラバラ

しあん
しあん

1分は必ず60秒間隔だから、その場合は等間隔だね

▼統計手法の補足
順序尺度では、ウィルコクソンの順位和検定を使う
※代表値は最頻値と中央値

間隔尺度

体温計

間隔尺度は順序も等間隔性もあり、ゼロ(原点)がないです。

・時刻
・温度の「1℃」「2℃」「3℃」
・日付け など

温度の「0℃」は絶対的な原点ではないので間隔尺度に分類されます。

しあん
しあん

ゼロ=無と言えるかがポイント

▼統計手法の補足
間隔尺度ではK.ピアソンの積率相関係数などを使う
※代表値は最頻値、中央値、平均値。加減の計算が可能。

比例尺度

マップと物差し

比例尺度は順序も等間隔性もゼロ(原点)もある数です。

・長さ
・重さの「1㎏」「2㎏」「3㎏」
・お小遣い など
闇しあん
闇しあん

ゼロから始める比例生活

▼統計手法の補足
比例尺度でもK.ピアソンの積率相関係数やその他統計などを使う
※代表値は最頻値、中央値、平均値。加減剰余の計算が可能。

まとめ:代表値や尺度水準はおおまかなデータ把握方法!

電源をつける人

数とその分類については、具体的な統計話に入る前に知っておくべき前提知識です。

しあん
しあん

用語が分かる・分からないでは統計理解に雲泥の差!

計算できる量的変数と分類メインの質的変数があり、データの大まかな特徴を捉えるには3つの代表値があります。

最頻値…一番多く出現するデータ。あまり役立たないけど外れ値に強い
中央値…順に並べたときの真ん中データ。真ん中は分かるけど全データをみれない
平均値…全データを見れるけど外れ値の影響大
「何でも平均でいいでしょ?」と思っている人は一旦考えを改めましょう。
しあん
しあん

データをどう捉えるかで採用する代表値は違うよ

闇しあん
闇しあん

代表値知らないと必要なデータ抽出ができんね

また、数の意味や性質で分類する尺度水準には4つの尺度があります。

名義尺度…ただの記号としての分類
順序尺度…順序、大小関係あり。等間隔性なし
間隔尺度…順序、大小関係、等間隔性あり。ゼロなし
比例尺度…順序、大小関係、等間隔性、ゼロ全てあり

ただし、代表だからといって1つの見方・データで特徴を把握すると、外れ値を考慮しないなど危険があるので注意。

しあん
しあん

統計処理するときも、表面上だけ捉えてデータの中身を見ないなんてことがないように気をつけよう!

参考資料

割と本格的な内容をマンガでゆるく解説しているのがこちら。

心理統計に限らず、統計知識が必要な人全般におすすめな1冊です。

そもそもな基本話が多いので、みなさんの「でもさぁ…?」って疑問が載っていて解消されます!

しあん
しあん

説明多くなってごめん!最後までお勉強お疲れ様っ

コメント

タイトルとURLをコピーしました