マーケティングの現場で起きているデータ分析時に陥りがちな罠 #03
マーケティングの「数理モデル」の理解が、ビジネスを飛躍的に成長させる
再現性の確保のために「因果関係」を理解する
Facebook Japanの中村淳一です。第1回・第2回が好評だったようで、連載の延長が決まりました。皆さまのおかげです。ありがとうございます。
第1回では相関ではなく、特に売上や利益を伸ばすための因果関係を理解することが再現性の確保につながるというお話をさせていただきました。
続く第2回では、データ分析に使われるデータの質の良し悪しが、結果としてアウトプットの良し悪しにつながる「ガベージイン・ガベージアウト」についてお話をさせていただきました。
今回は、第1回でお話しした「因果関係」について、もう少し掘り下げていければと思います。このテーマを書こうと思ったきっかけは、SNSのダイレクトメッセージ経由でDeNAの西村マサヤ氏から、次のような質問をいただいたことでした。
「先日のAgenda Noteに書かれていた『常に再現性確保のために、単体の相関ではなく全体を見た上で売上・利益の増減を見ることで原因を見極める』についてです。こちら非常に納得感がある一方で、この『見極める』という作業はとても難しく、すなわち『それなりのコストが発生するのでは?』と考えています。そのコストを投じるべきなのか否か、のジャッジに最近個人的に悩んでいます」
この質問をいただいた後に、ご本人とビデオ会議でお話ししましたが、その内容が皆さまにとっても参考になるかもしれないと思い、今回の執筆に至りました。
まずは、相関関係と因果関係の違いについて整理し、そのうえで因果関係を理解するための数理モデルの考え方、マーケティングに関係ある数理モデルをご紹介します。その後に、デジタルにおける数理モデル、特にInstagramについてお話ししましょう。
相関関係と因果関係は、何が違うのか?
まず勘違いがないように明記しておくと、相関関係は意味がないと言っているわけではありません。実際に私のチームでも相関分析から入ることも多々あります。
ただし、相関関係だけでは因果はわからず、結果、再現性の担保が難しくなると思っています。相関関係と因果関係は、次の図のようにイメージしています。
このポイントは、以下の通りです。
- 因果関係は、相関関係の一部です。「まずは相関分析」は、必ずしも間違いではありません。一方で、相関分析では現象が同時に起こっているという関連性しか分からず、再現性を確保するためにも因果関係を理解することがさらなるステップとして重要です。
- 因果関係がなく、相関関係があるものとして主に2つのパターンが考えられます。
1. 擬似相関と呼ばれる他の原因がある場合です。例えば、今ゲームのアプリのダウンロード数は増えています。E Cの売れ行きも増加傾向のようです。相関分析をすると、間違いなくこの2つのデータの相関係数は高く出ます。では、因果があるかというとそうではなく、その元となる原因は新型コロナウイルス感染症、もしくは感染症による生活パターンの変化によるものです。
2. 全くの偶然による場合です。元の原因も共通ではなく、たまたま同じタイミングで現象が起こるときにも相関関係が出ます。
2. 全くの偶然による場合です。元の原因も共通ではなく、たまたま同じタイミングで現象が起こるときにも相関関係が出ます。
- 因果関係では、起因と結果の順番を理解することが重要です。A→Bなのか、B→Aなのかによって解釈が変わります。例えば、第一想起が上がったから購入されたのか、購入されて使用したから第一想起が上がったのかによって、次の打ち手が変わります。
まずは、こうした自体を防ぐために、「⑴A→Bなのか、B→Aなのかという順番を考える」、「⑵他に根本となる原因の有無を考える」が重要になります。この2つの問いを考えるだけならば、それほどコストは発生しないと思います。考える癖もつくようになります。