マーケティングの現場で起きているデータ分析時に陥りがちな罠 #04
外れ値には、お宝が眠る。データ分析の罠に陥らない「3つのコツ」
マーケターが本当に達成したいのは、「外れ値」では?
(3)3つ目は「外れ値にはお宝(インサイト)が眠っていることがある」です。
ブランドCと、ブランドDをご覧ください。右側の方に明らかにパターン(直線)から外れた値があります。
これは外れ値と呼ばれるものです。データサイエンスの世界ではデータ処理の段階で(2)で紹介したパターンを見つけるために、この外れ値を外します。
それはプロセスとしてとても正しいのですが、実はこの外れ値にお宝が眠っていることがあります。
例えば、ブランドDをご覧ください。外れ値を外して分析すると先ほども述べたように、テレビCMのGRPは売上シェアとの関連がないという結論が出て、分析は終わってしまいます。
ここで発想を逆転して考えてみると、1400GRPの時だけ売上シェアが過去のパターンを超え、20%を達成しています。ここには何か秘密があるに違いありません。
もしかしたらテレビCMのクリエイティブが人気マンガ「鬼滅の刃」とのコラボレーションかもしれません。あるいはテレビCMと連動して、何か特別なキャンペーンを実施したのかもしれません。
そうであれば、そこに再現性を求めればいいのです。パターンを見つけた後にパターンを外れているものを探し、その理由を考えること、それが3つ目のコツになります。
統計処理は、あくまで最大公約数的な答えを導き出すもので、とても大事なことです。一方で、ブランドDのケースで考えてみてください。マーケターとして達成したいのは、外れ値の方ではないでしょうか?
であれば、平均や相関分析などで分かった気になるのではなく、ローデータを可視化し、パターンを見つけ仮説を立て、また外れ値に注目してインサイトを構築してみるのは、いかがでしょうか?