「因果関係」と「相関関係」の違いとは?【データ分析の基礎】

2018年12月13日エビデンスベースド入門

 

あなたは知っていますか?「相関関係」「因果関係」の違い

「相関関係」「因果関係」の違い
「データ分析の力 因果関係に迫る思考法」のp39より引用

2つのデータの動きに関係性があることを、統計学では「相関関係がある」と呼びます。

問題は、XとYに相関関係があることがわかっても、その結果を用いて因果関係があるとは言えないことです。

 

要はXというもののデータの動きにYが応じて変化していたとしても、それはXがYに影響を与えている(因果関係がある)証拠にはならないのです。理由は簡単。

 

  • Yが逆にXに影響を与えている可能性(逆の因果関係)があるから。
  • XとY以外の隠れキャラVがいたとして、こいつが影響を与えている可能性があるから。

 

これを知ってるだけでテレビや新聞、広告なんかの怪しい統計データに惑わされなくて済みます。注意深く見ていると、世の中には本当に訳の分からないデータがたくさんあって、ただの相関関係をあたかも因果関係があるかのように謳っているものもかなり見かけます

 

 

価格満足度No1

 

 

例えば・・

 

参考図書「データ分析の力 因果関係に迫る思考法」の中で著者が紹介している実際に見かけたという面白い例がありました。

「海外留学に力を入れているある大学の調査では、留学を経験した学生が、留学を経験しなかった学生よりも就職率が高いことがわかった。このデータ分析の結果から、留学経験は就職率を向上させるのであると大学は報告している」

どこの大学かは知りませんが統計学の教授らへんはこれを見て何も言わなかったのでしょうか・・。ここまで読んでくれた皆さんならもうお分かりだと思います。この例に反論を立ててみましょう。

  • 留学に行くくらい意識が高い生徒だったから就活にも力を入れていただけかもしれない(逆の因果関係)
  • 留学で世界を知って、「とりあえず大手志向」がバカバカしくなって人気はそこそこで倍率は低いけど自分が本当にやりたいことができる会社に入った人が多かっただけかもしれない(隠れキャラV)
  • 丁度東京オリンピックが目前で、「英語ができる人を採用しときたい!」な風潮の会社がたくさんあっただけかもしれない(隠れキャラV)

妄想逞しい人はいくらでも思いついちゃいますね。ここですんなり反論が思いつけばもう大丈夫。「因果関係」と「相関関係」の違いはバッチリです。

 

参考文献&引用

# 伊藤公一朗「データ分析の力 因果関係に迫る思考法」光文社新書、2017年。