Amazonで年末のお買い物を…するorしない

【心理統計】標準偏差の意味と最低限の考え方|平均、偏差、分散も解説!

勉強ノート
この記事は約8分で読めます。

こんにちは、臨床心理士・公認心理師のしあんです。

心理学を勉強している学生にとって、心理統計で最初に標準偏差(SD)でつまずく人は多いですね。

✓標準偏差が大事っていうけど何なの?(泣)
✓分散とどう違うの?
✓平均じゃだめなの?

卒論や修論にも関わる超重要用語なので、標準偏差(SD)が分からないと研究も論文も進みません…。

今回も超基礎編で、平均や分散、標準偏差(SD)についてざっくり解説します。

詳細に解説しても文系にとっては鬼門なだけだと思うので、参考書よりもコンパクトにいきます!

闇しあん
闇しあん

本記事すっぽかすと今後の心理統計詰むレベルの基礎編

しあん
しあん

用語は多いけど覚えよう…!

心理学部の統計講義や卒論で苦戦する人や、文系で統計を扱う人で「数字が苦手」なら必読です。

こんな人におすすめ!
・文系や心理学を学んでいて統計さっぱりな人
・標準偏差でつまずいている人
・統計に興味のある人
※心理系大学院進学希望者は必須

心理統計で必要な「統計の考え方」

階段と電球のイラスト

「そもそも心理学と統計にどんな関係があるの?」と思いますよね。

心理学は、心という客観的なデータを科学的に証明していく学問なので、概念を客観視する指標として数字(統計)はうってつけなんです。

「イライラする」と言っても人にはどの程度か伝わりませんが、「10点満点中8点くらいイライラしている」ならイライラ具合をかなり共有しやすいですね。

こんな風に一般的に分かりやすくするために統計を扱いますが、統計本でよく見るシグマ(Σ)などの式が複雑なため挫折しやすいです…。

闇しあん
闇しあん

ムリ

大きな声では言えませんが、心理統計を学ぶ上で複雑な式を覚えたり、計算する力は不要です。

闇しあん
闇しあん

(太字使ってるやん)

①標準偏差などの用語、②SDなどの略語、③それぞれを求めて何を知りたいかを知るだけで卒論や修論には十分太刀打ちできるため、式より用語や意味など考え方をしっかり理解しましょう。

しあん
しあん

式は機械がやってくれるから、数値から情報を読み取れるようになろう

まずは『平均(mean)』のおさらい

多くの人が知っているように、平均(mean)は全データの総数を個数で割った値ですね。

▼平均の例
仲良し中学生5人のテストの点数(56、78、64、59、62)
(56+78+64+59+62)÷5(人)=63.8点≒64点が5人の平均点

平均

平均は、全データを考慮しておおよその中心を知る値というイメージ。

しあん
しあん

平均値は代表値の一種だね

全データを考慮して平均的な値をみれるとだけ聞くとすごく便利な指標ですが、極端な数値(外れ値)の影響を受けやすいデメリットがあります。

平均値を参考にする際は、元のデータ内容に偏りがないかを確認しましょう(正規分布については別途記事化)。

平均値を見ると、全データを網羅して大まかなデータを読み取れる

『偏差(deviation)』と『分散(variance)』

「標準偏差がよく分からない!」と言う人はその前段階にある『偏差』と『分散』の理解が怪しい人が多いので1つずつみていきましょう。

『偏差』は、各データから平均を引いた差のことです。

▼偏差の例
仲良し中学生5人のテストの点数(56、78、64、59、62)
平均:64点
偏差=各データ-各平均
①56-64=-8
②78-64=14
③64-64=0
④59-64=-5
⑤62-64=-2

偏差

偏差はそれぞれのデータが平均からどれほど離れているかを意味します。

平均よりも個々のデータに注目した考え方ですね。

しあん
しあん

プラスもマイナスもどっちもあるよ

そして、それぞれの偏差を2乗して合計したら平方和になり、平方和をデータの個数で割ったものが『分散』です。

分散では各データのばらつきをみることができます。

分散=偏差²の総和(平方和)÷データの個数
闇しあん
闇しあん

ついてこれてるか?

しあん
しあん

式覚えなくていいから考え方だけ分かるといいな!

▼分散の例
仲良し中学生5人のテストの点数(56、78、64、59、62)
平均:64点
偏差:-8、14、0、-5、-2
★偏差²の総和(平方和)
=(-8²)+(14²)+(0²)+(-5²)+(-2²)
=64+196+0+25+4
=289
★分散=偏差²の総和(平方和)÷データの個数
289÷5(人)=57.8≒58

しあん
しあん

んん?Q:偏差も分散も各データのばらつきで似てない?

偏差だとプラスマイナスのどちらもとれるため、足し引きした際にゼロになる可能性があります(ゼロになっちゃったら詳しくデータ見れないね)。

そこで、ゼロになるのを防ぐために偏差の2乗の平均(分散)を求めることで、各データのばらつきをしっかりみれるようになります。

分散は0に近いほどばらつきが小さい
しあん
しあん

偏差よりも分散の方が精度が高いんだね

ちなみに、2乗したら情報によっては「cm→cm²」など単位が変わってしまう恐れもあるので分散だけでは不十分。

しあん
しあん

分散でも不十分なんかーい!

分散よりも万能な値が標準偏差です。

分散が分かれば標準偏差の出し方も分かりやすいのでついでに知っておきましょう!

標準偏差(SD:Standard Deviation)

統計を扱う人なら絶対に聞くのが標準偏差(SD)です!

標準偏差もデータのばらつきを知る指標で、標準となる偏差(各データが平均からどれほど離れているか)という意味。

しあん
しあん

「平均」偏差ではないんだね

統計判定でよく見聞きする2SDは標準偏差の2倍の値ということで、統計的にもかなり有効な値になってきます。

統計記号としてσ(シグマ)と表記されることもあり

統計本などでこんな式を見かけてやる気失せる人は多いと思いますが、

ソース画像を表示

別にこの式は覚えなくて問題ないので無視しましょう。

標準偏差は√分散(分散の平方根)で求められます(分散は標準偏差の2乗ですね)。

√(ルート)をつけることで、分散で単位がずれてしまっても戻すことが可能(らしい。数学分かる人なら分かるはず)。

▼標準偏差の例
仲良し中学生5人のテストの点数(56、78、64、59、62)
平均:64点
偏差:-8、14、0、-5、-2
分散:58
標準偏差=√58=7.61577311

しあん
しあん

【悲報】筆者、数学できません

闇しあん
闇しあん

関数電卓使うかググればおk

iPhoneなら画面ロックを解除して既存の電卓を横向きで使えば、√やlogなど関数電卓並みのスペックに変身するので活用してくださいね!

標準偏差は、平均値ではみえてこない全データの散らばり具合を知ることができるのが特徴的です。

平均値だけだと、たとえば同じ平均=63.8点でも個々のデータのばらつきが違うことがありえます。

平均の罠

平均値で大まかなデータの全体像をみて、標準偏差で各データのばらつきをみる組み合わせで、かなり得られる情報量が増えますよ。

しあん
しあん

正規分布前提なら、平均±1×標準偏差内に収まる確率が68%とかあるけどまた後日

・標準偏差で、全データの個々のばらつきをみることができる
・標準偏差の値が小さい方がデータのばらつきも小さい

基本的にどんな値にも言えることですが、元のデータ数が少ない時は数値が雑になるので、調査対象は多めにとりましょうね。

SEO Powersuite | ワンストップSEOソフトウェア
すべてのSEOツールを1つのパックで獲得。SEO Powersuiteの無料エディションをダウンロードして、あなたのサイトをGoogleその他の検索エンジンでトップ10にランク入りさせましょう!

おわりに:平均+標準偏差のダブル使いで情報を読み取ろう!

レポートのイラスト

統計は、「統計」という言葉や細かい数式のせいで苦手意識や拒否反応が出やすい分野です。

もちろん内容をきちんと理解できるに越したことはありませんが、

① 平均や標準偏差などの用語の意味
② SDなど略語を知る
③ それぞれを求めることで何を知れるか

①~③を大まかに理解できるだけでも十分だったりします。

しあん
しあん

今回は本当に最低限の内容だからまず見てみて!

基本的には平均値で全データを大まかに把握して、標準偏差(SD)で個々のデータのばらつきをみることでかなりの情報を集めることができま。

▼平均
〇全部のデータを含めたおおよその中心値を知れる
△極端な値(外れ値)の影響を受けやすい
△同じ平均値でも中身のデータのばらつきは様々
▼標準偏差(SD)
〇全データの個々のばらつきをみることができる
◎統計的仮説検定(心理の卒論)と相性抜群
△計算につまずく人多数

また、今回紹介した偏差と分散は統計の読み取りであまり使われませんが、標準偏差を理解するために「ふーん」くらいで知っておけると便利です。

闇しあん
闇しあん

ふーん

✓偏差…平均値からどれだけ±に離れているか
✓分散…データのばらつき

しあん
しあん

「偏差<分散<標準偏差」と統計処理をしやすくしたイメージ

偏差(平均とのずれ)が大きいと標準偏差も当然大きくなります。

標準偏差の値は小さい方がばらつきも小さくなるため、値としてみるなら小さい数値になっているとよさげかも。

標準偏差に関連する「正規分布」など他にも用語はありますが今回はここまで!

しあん
しあん

あとはおすすめ本だよ~

統計の考え方を分かりやすく知れるおすすめはこちらの文庫です。

著:佐藤信
¥1,012 (2022/12/07 09:18時点 | Amazon調べ)
\楽天ポイント5倍セール!/
楽天市場

文章多めの読み物ですが、たとえ話がとにかく分かりやすい!

文系で統計扱う人で統計や数字に苦手意識がある人は1度読んでみて損なしかと。

心理系大学院受験を考えている人はこちらも読んでみてください。

\楽天ポイント5倍セール!/
楽天市場

河合塾KALSシリーズはどれも見やすくとっつきやすいのがおすすめポイント。

同シリーズの参考書はどれもキーワードがまとまっていてインプットに最適なので迷ったら購入してみてください。

コメント

タイトルとURLをコピーしました