ホーム >> 学習関連コラム >> 塾・予備校 >> 共分散とは?相関係数などのデータの分析の応用を練習問題を通して解説
更新日 2024.4.9

共分散とは?相関係数などのデータの分析の応用を練習問題を通して解説

カテゴリ

共分散とは、2つのデータ同士の関係を表す値です。

例えば、「数学の点数が高い生徒は、物理の点数も高い傾向にあるのか?」とか「気温が高ければ、飲料の売上もあがるのか」といったような対応する2つのデータにどういう関係があるのかを分析するのに用います。

相関関係を表すのに、表だけではイメージがつきにくいですが、グラフで表現することにより、理解しやすくなります。

また、エクセルを使えば共分散を簡単に求めることが出来るので、ぜひ使えるように覚えておきましょう。

 
相関係数・共分散マスターになるおすすめの学習塾・家庭教師

散布図などを使い相関係数を基礎から学びたいオンライン数学克服塾MeTa

共分散だけではなく高校数学を学びたい家庭教師ファースト

画像

数学の成績を上げるならMeTa

苦手な数学を必ず克服できる塾
数学特化のマンツーマン授業
★週1回の演習授業で質問し放題!
3日ごと数学克服プラン作成

_

データの相関関係とは?

_画像

今回はデータの分析の中でも、二つのデータ間の関係を調べる方法について勉強します。

まず二つのデータ間の関係といってもわかりにくいと思います。

そこでデータの例として、数学と国語の点数の関係について調べる方法を考えてみましょう。

あるクラスで数学と国語のテストをして、それぞれ採点されテストの点数が出たとします。

そのテスト結果の点数を並べただけでは、平均値も中央値も同じですが整理されていないので、わかりにくいですね。

  • #

    データからはA組もB組も学力が同じようには見えません。

    なぜかと言うと、データのばらつき具合が違うからです。

そこで、これを視覚化するとすごくわかりやすくなるので、視覚化する方法を考えてみましょう。

散布図を使った相関関係の考え方

_画像

例えば、このように横軸に数学の点数、縦軸に国語の点数を記入します。

例えば数学が60点、国語が70点だった人は、こんな風にこの地点Aで表されるはずです。

ここまで大丈夫でしょうか?

XY 座標のときと同じような考え方ですね。

今回の場合で言うと、例えば数学が80点で国語が40点の人は、 この地点Bで表されます。

このようにしてクラス全員のテスト結果を、このグラフにどんどん書き入れていくと、こんな結果になります。

これでクラス全員のテスト結果がだいたい何点ぐらいのところに集まっているか、一目で見てわかりますね。

  • #

    今回のような横軸と縦軸に対してそれぞれデータの値を取って、点で表した図を散布図と言います。

正の相関関係と負の相関関係

_画像

今回でいえば、このような散布図があったら、何か少し傾向がありそうですね。

右側に行けば行くほどデータの値も右肩上がりです。

例えるなら、右横軸が「自習の時間」で、縦軸が「テストの点数」だったら、なんとなくこんな図のような感じになりそうです。

右上の人は自習時間が長くてテストの点数が高く、左下の人は自習時間が短くてテストの点数が低いみたいな感じです。

このように散布図を書くと、二つのデータ間の関係がよりはっきりわかる場合があります。

今回のように片方のデータが増えると、もう片方も増えるときには「正の相関関係がある」と言います。

例えばこんなグラフはどうでしょうか?

_画像

今度は横軸の値が増えれば増えるほど、縦軸のデータの値は減っていますね。

このように片方が増えると、もう片方が減るみたいな関係にあるときは「負の相関関係がある」といいます。

先ほどの正の相関関係があるときも、負の相関関係があるときも、どちらもお互いに何か「影響を及ぼし合っている」といえますね。

そのため、右下がりのグラフでも、確かに「相関関係がある」と考えることができます。

ただし、特に高校数学では深く知る必要はないですが、相関関係は因果関係とは別の話であるということは注意点として、少し覚えておいてください。

_画像

例えば、「片方が増えたからもう片方が増えた」という感じで相関関係が見えたとしても、だからといって片方によりもう片方が上がる原因になってるとは限りません。

つまり、片方が上がり、もう片方も上がったという相関関係がみえた場合でも、値が上がる原因になっているとは限らないということです。

怪しい商品の広告に使われたりしているため、そこは少し要注意です。

グラフや散布図を使って相関係数を分かりやすく学びたい人におすすめな学習塾はこちら

CHECK

  • データ間の関係を調べる方法を知る
  • 散布図を使って相関関係を理解する
  • 相関関係と因果関係は別の話である

相関関係を表す共分散とは?

_画像

それでは、この二つのデータ間の相関関係を数字で表すにはどうしたらいいでしょうか?

そんな時に用いるのが共分散です。

共分散を求めるには少し面倒な計算が必要になりますが、前回勉強した「データのばらつきを表す数字を計算する方法」がわかっていれば、そこまで難しくありません。

共分散の求め方は?

例えば、こんなデータがあります。

この二つのデータの間にどのぐらいの相関関係があるのかを計算してみましょう。

_画像

まず最初にそれぞれのデータであるAとBのデータから標準偏差を計算します。

標準偏差の計算の仕方は前回勉強した通り「√分散」になるので求め方は以下のようになります。

まず最初に平均を求めてから、各データと平均の差を計算します。

それを2乗して、その平均を計算します。

その数値が「分散」でした。

分散の正の平方根が「標準偏差」です。

ここからさらにもう一つ、別の計算をします。

先ほどAとBでこのように、平均とデータの差を計算しましたね。

「Aの平均とデータの差」「Bの平均とデータの差」を掛け算します。

この掛け算した結果の平均を計算します。

少し大変ですが、まず平均を計算しましょう。

そうすると、上のような値になります。

この値を「共分散」といいます。

言い換えれば、2組の偏差の積の平均が「共分散」とも言えます。

共分散を使って相関係数を求める

_画像

例えばこの共分散の値がプラスだったら、二つのデータ間に正の相関関係があるかもしれません。

マイナスだったら二つのデータ間に負の相関関係があるかもしれないことがわかります。

ただ、どれだけ相関関係がしっかりあるのか、あるいはあやふやなのかは、この共分散の値からだと少しわかりにくいです。

そのため、この共分散をさっき計算したAの標準偏差とBの標準偏差の積で割り算します。

すごく分かりにくくなりましたが、式にすると上のようになります。

この式を計算すると、出てくる数字が「相関係数」と呼ばれるものです。

相関係数を見ると、二つのデータ間の関係性がはっきりわかります。

例えば、プラス1に近ければ近いほど「正の相関関係」があります。

マイナス1に近ければ近いほど「負の相関関係」があると判断することができます。

0に近いと「あまり相関関係はない」ということがわかります。

それぞれの散布図と相関係数の関係は、以下の通りになります。

1に近いと右肩上がりの散布図、-1に近いと右肩下がりの散布図、0に近いとこんな風にバラバラな散布図になります。

_画像

  • #

    1に近いと右肩上がりの散布図、-1に近いと右肩下がりの散布図、0に近いとこんな風にバラバラな散布図になります。

この相関係数の計算も大変複雑だと思うので、先ほどの手順を思い出しながら、次の問題をまず手を動かして解いてみましょう。

_画像

できましたでしょうか?

以下で解答の手順をご説明します。

まずは、それぞれのデータの標準偏差を求めます。

【兄】

{(-6)2+(-2)2+(7)2+(1)2+(12)2+(0)2+(-3)2+(-9)2}÷9=36

√36⁼6

【弟】

{(-3)2+(-5)2+(0)2+(5)2+(4)2+(6)2+(1)2+(-4)2+(-4)2}÷9=16

√16=4

それから、それぞれのデータと平均値の差を計算したら、これらの値を今度は掛け合わせます。

そして、その掛けた値の平均を計算します。

それが共分散ですね。

0×(-3)+(-6)×(-5)+4×0+7×5+1×4+12×6+0×1+(-3)×(-4)+(-9)×(-4)=189

189÷9=21

最後に共分散をそれぞれの標準偏差の積で割ると、これが相関係数です。

21÷(6×4)=0.875・・・

相関係数は1に近いので、これは正の相関関係があるということがわかります。

_画像

今回は、データの分析の二つのデータの間の関係を調べる方法について勉強しました。

今日勉強したこと : 2つのデータの間の関係を調べる方法

今回の範囲も、やっぱり手を動かして、実際に計算してみることが大事ですので、後に表示してある問題集の問題を解いてみてください

共分散についての例題や問題をマンツーマンで解説してもらいながら学習したい人におすすめの家庭教師はこちら

CHECK

  • 2つのデータの間の関係を調べる方法を理解する
  • 共分散の求め方の理解を深める
  • 相関係数と共分散の違いを理解する

共分散のおすすめの勉強法

_画像

共分散はデータ分析の中でも、複数のデータの関係を表す値です。

データの関係を知るために、表から散布図などを作成し図からどういう関係があるのか理解することがとても大事になります。

数学1のデータの分析は必須の範囲ですが、基礎さえできていれば問題なく高得点を狙えるので、しっかりと理解を深めましょう。

塾・家庭教師を利用した勉強

共分散の基礎的な内容が理解できている方は、前段で紹介した参考書や問題集を使って、繰り返し問題演習に取り組むことで理解を深めることができます。

一方、基礎的なことが身についてないと、いくら問題に取り組んでも効果は薄く、それどころか解けない問題に多くぶつかる事で、苦手意識を持つようになってしまいます。

少しでも不安要素がある方は、プロである塾講師家庭教師の指導を受け、弱点を確実に克服していくことをおすすめします。

また、基礎的な内容が理解できている方も、プロのサポートを受けることによって、基礎から応用へ効率よく学力を伸ばしていくことが可能です。

参考書を使った勉強

共分散に限らず、数学の学習全体に言えることですが、公式などの基本的な知識を頭に入れたら、とにかく多く演習をこなすよう心がけましょう。

まず、最初は理解を進めるために基本的な問題から取り組むことをおすすめします。

  • 青チャート 第4章 データの分析 21 分散と標準偏差、相関係数
  • サクシード 第5章 データの分析 38 分散と標準偏差(2)、40 データの相関
  • 4STEP 第5章 データの分析 1 データの分析、2 データの代表値、3 データの散らばりと四分位範囲
  • Legend 5章 データの分析 12 データの分析

共分散はAデータとBデータがあったとすると、2つの対応するデータ間にはどのような関係があるのかを分析するために調べる値です。

共分散を勉強するためには、データを表にまとめ、表だけではイメージがつかないため、図を作成することが大事になります。

その結果として、この2つのデータにはどのような傾向があるのか読み解くことが重要です。

共分散を含め、「データ分析」の先には「統計」が待っています。

そのため、ここで重要なのは、基本的な問題を数多く解いて、なぜ共分散を求める必要があるのかを理解することです。

CHECK

  • なぜ共分散を求めるかを理解する
  • データの分析は統計の基本
  • 基本的な計算を繰り返して解く

数学の勉強におすすめの塾

オンライン数学克服塾MeTa

_画像

オンライン数学克服塾MeTaの基本情報
対象学年 中学生・高校生
授業形態 オンライン(個別1対1、集団)
特徴 数学克服・対策に特化したオンライン専門塾

オンライン数学克服塾MeTaはその名の通り、数学の指導に特化した学習塾です。

週1回から受講可能で、授業はオンラインで行われるため、部活動との両立や他の塾との併用も可能です。

以下ではオンライン数学克服塾MeTaの特徴や魅力をご紹介します。

ソクラテスメソッドで確かな数学力を身につける

MeTaでは、古代ギリシアでソクラテスが実践していた手法を応用した「ソクラテスメソッド」を使って指導を行なっています。

この指導の特徴は、講師が一方的に解法を教えるのではなく、質問の繰り返しによって、生徒に考えさせるところにあります。

このような問答法授業によって、生徒は表面的な解法ではなく、根本から数学を理解できるようになるので、基礎知識の定着はもちろん、幅広い問題に対応できる応用力も同時に身につけることができます。

毎週1回の演習授業

上述の通り、数学の理解を深めるためにはアウトプットを繰り返す必要があります。

MeTaではマンツーマン授業とは別に、週に1度100分の演習授業を実施しています。

この講義に参加することで、授業内で養った思考力を確実に定着させることができ、更には自主的に数学の勉強に取り組む習慣づけの機会にもなります。

また、授業中は講師が常駐しているのでわからないことがあればその場で解決できます。

LINEでいつでも質問可能

数学の勉強を進めていたら、わからない問題に直面した経験は誰しもあるでしょう。

しかし、近くに相談できる人がいなければ消化不良のまま学習を続けていくことになります。

MeTaでは、生徒が抱える疑問をすぐに解決できるよう、公式LINEアカウントを通じた質問対応を行なっています。

いつでも質問できる環境があるので、生徒はストレスなく学習に取り組むことができます。

 

湘南ゼミナール

画像

湘南ゼミナールの基本情報や具体的な特徴についてご紹介します。

湘南ゼミナールの基本情報
対象 小学生~高校生
授業形式 集団指導、個別指導
対象地域 神奈川、千葉、埼玉、東京

独自の授業方法で効率よく学習

湘南ゼミナールでは「Quick Exercise授業」にて講師と一問一答をしながら授業を進めていきます。

原則教科書は使わずに進めていくため、しっかりと話を聞いて理解する能力が必要です。

また、演習を解く際は1問1問答えられたか挙手制で確認していくため、適度な緊張感をもって勉強ができるでしょう。

さらに、授業前後で各生徒ごとに学習サポートを実施しているため、わからないところがあってもすぐに解決することが可能です。

研修を経た講師が指導

湘南ゼミナールは模擬授業などの研修を経て、生徒に対する指導を理解した講師のみが教壇に立っています。

集団指導で授業を行うことが多いため、各生徒の学習状況をしっかりと把握して丁寧に対応しています。

また、生徒が抱える問題に対して解決できるよう一緒になって考えてくれます。

親身なサポートがあるため、勉強が苦手でも継続して取り組むことができるでしょう。

家庭教師ファースト

_画像

高校数学を勉強するなら「家庭教師ファースト」がおすすめです。

家庭教師ファーストの基本情報
対象学年 小学生、中学生、高校生
授業形式 個別指導
特徴 オーダーメイドの段階別指導

なぜおすすめなのか、その理由を2つ説明します。

オーダーメイドの段階別指導

家庭教師ファーストでは、生徒の苦手分野や目標にあわせて段階別のオーダーメイド指導を行います。

つまづいた箇所を見つけ出して、さかのぼり学習や学習プランの作成を行うことでジヌンのペースで苦手を克服することができます。

採用率20%以下の講師陣

家庭教師ファーストの講師は、指導力だけでなく人間性も優れており、採用率20%以下を潜り抜けた講師です。

生徒の性格にあわせて講師を紹介するので、相性の良い講師から指導が受けられます。

指導前に体験授業を受けることや、講師が合わなくても変更することができるので安心です。

↓↓お問い合わせはこちら↓↓

何度も反復して計算し基礎を定着させよう

_画像

今回は、高校で習う共分散について、共分散について相関関係などのデータの分析とその応用を練習問題で解くことで解説しました。

共分散については表だけではイメージがつかないため、グラフで表現してみることが大切です。

データAとデータBがある場合、正の相関関係のグラフでは、Aが増加するに従い、Bも増加します。

  • #

    このような関係を正の相関関係といい、共分散の値はプラスになります。

なおかつ、共分散の値はAやBの分散と同じ大きさになっているため強い相関関係になるといえます。

負の相関関係のグラフでは、Aが増加するに従い、Bが減少しています。

しかも、やはりAとBがきれいに一直線に並んでいます。

このような関係を負の相関関係といい、共分散はAとBの分散をマイナスした値になります。

その他に、相関がみられないケースがあります。

回帰直線を引きようがなく、AとBの間に相関関係をみることができません。

このような場合は、プラスとマイナスが打ち消し合い共分散は0になります。

共分散は、図に表しながら基本的な解き方を理解することが大切です。

繰り返し問題にチャレンジしながら解き方を理解しましょう。

また、「散布図」を書くと、二つのデータ間の関係がよりはっきりわかります。

データを整理してみることが更なる理解につながります。

今回の記事で理解が進んだら、徐々に難しい問題にもチャレンジしてみましょう。

画像

数学の成績を上げるならMeTa

苦手な数学を必ず克服できる塾
数学特化のマンツーマン授業
★週1回の演習授業で質問し放題!
3日ごと数学克服プラン作成

_

画像

家庭教師ファースト

ハイクオリティ&リーズナブルな家庭教師
★厳選された教師によるオーダーメイドの段階別指導
97%の生徒が効果を実感
★月の費用は「月謝と交通費」のみ

_

【初心者でもわかる】この記事のまとめ

「共分散」に関してよくある質問を集めました。

調べたいデータの単位が違う場合でも共分散を求めることはできる?

共分散は、もとの値の大きさで数値が決まるので、単位が違う変数を複数比較するときなどは、混乱することでしょう。例えば市町村単位で、その町ごとの人口と、ラーメン店の売上の共分散を計算しても、単位が違うため数字の意味がわかりにくくなります。そこで関係をみるためには相関係数を使います。共分散の値を、各変数(例えば国語と数学)の標準偏差の積で割ったものが相関係数となります。相関係数は「−1」から「1」までの値をとります。1であれば2つのデータの値は完全に同期していることになります。共分散の求め方の詳細はこちらを参考にしてください。

相関関係と共分散の意味の違いは?

共分散も相関係数も共に2つのデータの関係の強さを表しています。そういう意味で両者は同じ性質を持っています。共分散が取り得る値の範囲は確率変数(データ)に依存します。共分散は「0.5」や「-16」や「1000」になることもあります。一方で、相関係数が取り得る値の範囲は確率変数(データ)に依らず-1以上1以下の範囲となります。共分散にはもとの数値の大きさが反映されています。相関係数にはもとの数値の大きさは反映されていません。相関関係と共分散の意味の違いについてはこちらを参考にしてください。

この記事を企画・執筆した人
-StudySearch編集部-
この記事は、StudySearchを運営している株式会社デジタルトレンズのStudySearch編集部が企画・執筆した記事です。
StudySearchでは、塾・予備校・家庭教師探しをテーマに塾の探し方や勉強方法について情報発信をしています。
StudySearch編集部が企画・執筆した他の記事はこちら→