「因果関係」と「相関関係」の違いとは?【データ分析の基礎】

赤羽(Akabane)

今回は「因果関係と相関関係の違い」についてのお話です。

あなたは知っていますか?「相関関係」「因果関係」の違い

早速ですが、違いこんな感じになります。

2つのデータの動きに関係性があることを、統計学では「相関関係がある」と呼びます。

問題は、XとYに相関関係があることがわかっても、その結果を用いて因果関係があるとは言えないことです。

要はXというもののデータの動きにYが応じて変化していたとしても、それはXがYに影響を与えている(因果関係がある)証拠にはならないのです。理由は簡単で、

  • Yが逆にXに影響を与えている可能性(逆の因果関係)があるから。
  • XとY以外の隠れキャラVがいたとして、こいつが影響を与えている可能性があるから。

こんな感じです。シンプルですが、これを知ってるだけでテレビや新聞、広告なんかの怪しい統計データに惑わされなくて済むかと思います。

注意深く見ていると、世の中には本当に訳の分からないデータがたくさんあって、ただの相関関係をあたかも因果関係があるかのように謳っているものもかなり見かけます

例えば・・

参考図書「データ分析の力 因果関係に迫る思考法」の中で、著者が実際に見かけたという面白い例がありました。

「海外留学に力を入れているある大学の調査では、留学を経験した学生が、留学を経験しなかった学生よりも就職率が高いことがわかった。このデータ分析の結果から、留学経験は就職率を向上させるのであると大学は報告している」

どこの大学かは知りませんが、統計学の教授さんが黙ってはいなそうな内容。ここまで読んでくれた皆さんならもうお分かりだと思いますが、この例に反論を立ててみましょう。

  • 留学に行くくらい意識が高い生徒だったから就活にも力を入れていただけかもしれない(逆の因果関係)
  • 留学で世界を知って、「とりあえず大手志向」がバカバカしくなって人気はそこそこで倍率は低いけど自分が本当にやりたいことができる会社に入った人が多かっただけかもしれない(隠れキャラV)
  • 丁度東京オリンピックが目前で、「英語ができる人を採用しときたい!」な風潮の会社がたくさんあっただけかもしれない(隠れキャラV)

妄想逞しい人はいくらでも思いついちゃいますね。ここですんなり反論が思いつけば、「因果関係」と「相関関係」の違いはもうバッチリです。

赤羽(Akabane)

データを読み解く際の基本になるので、当ブログをご愛読くださっている方は是非押さえておいてください。

参考文献&引用

# 伊藤公一朗「データ分析の力 因果関係に迫る思考法」光文社新書、2017年。