2015/04/29

価値のあるデータ分析とは意思決定につながること




仕事でのデータ分析で意識したいと思っているのは、今やっているデータ分析が 「意思決定につながるかどうか」 です。


そのデータ分析は意思決定につながるか


やみくもにデータ集計や分析プロセスに入るのではありません。自分はこれからどういう課題に対して、何の目的で分析を始めるのかをまず明らかにすることです。得られるであろう結果や解釈が、意思決定にどう役立つかをまず最初に考えることです。

データ分析をするにあたって大切にしたいと思っているスタンスです。


アウトカムを考えよ


統計学が最強の学問である [実践編] - データ分析のための思想と方法 という本には、次のような記述がされています。

データ分析を因果関係の洞察、すなわち、最終的にコントロールした結果とそれに影響を与える原因の候補、という観点で捉えるのである。

なお私はこの 「最終的にコントロールしたい結果」 のことをアウトカム (成果指標) と呼んでいる。そしてそのアウトカムの違いに影響するかもしれない、あるいはその違いを説明できるかもしれないという要因のことを説明変数と呼ぶ。

なお、説明変数はともかくアウトカムという表現は一般的な統計学の教科書ではあまり登場しない。かわりに 「結果変数」 とか 「目的変数」 とか 「従属変数」 とか、機械学習の分野では 「外的基準」 と呼ばれるものがこのアウトカムにあたるが、私がこの表現を使うのはとても大事な意図がある。

(中略)

ビジネスにおいても同様に、データ分析を価値に繋げようとすればまず、自分のデータから表現できるもののうち 「最大化したり最小化したりすべきゴールとなる項目」 が何なのかを考えなければいけない。これがアウトカムである。

マーケティングなら売上や顧客数を、営業戦略なら成約件数やその合計金額を、調達に関わっていれば在庫破棄率や仕入れ価格、あるいは欠品による機会損失額などがアウトカムにあたるだろう。

ただ、集計するアウトカムの選択が適切であったとしても、たとえば単に売上の平均値や総額を眺めていただけでは、「どうすれば儲かるのか」 はわからない。何の根拠もなく前年比5%増を目指して頑張りましょうと号令をかけるのがせいぜいである。

そこで、そのアウトカムを左右する 「原因の候補」 である説明変数が重要になる。

たとえば性別で売上を比較したところ、女性の平均売上が明らかに高かった、という結果が得られたとする。この場合、女性が来店しやすい店舗設計を心がけたり、女性のよく見るメディアに広告を出稿することで、そうした施策のコストを大きく上回る売上増が見込めるかもしれない。

あるいは、顧客が自社に対して 「親しみやすい」 というブランドイメージを持っているかどうかで大きく平均売上が変わるのであれば、広告や製品のデザインをより親しみのあるものに変えただけで売上を上げられるかもしれない。

こうした原因の候補という観点を意識せずに、何となく 「これまでよくやられてきたから」 というだけで、性別と年代という説明変数だけを考えていたのだとすればたいへんもったいないことである。

自分がやるデータ分析について、アウトカム (目的) と説明変数 (原因) を明らかにすることの大切さが強調されています。


データ分析に入る前にやること


これはまさに、分析や考察結果が受け手の意思決定に役に立つかを考えることに他なりません。説明変数 → アウトカムの 「因果関係」 を明らかにし、受け手はこれから自分たちがやろうとしていることの判断材料にできるのです。

データ分析に入る前に、今の分析の背景や課題は何か、分析結果は誰のどういった意思決定に寄与できるかです。こうしたデータ分析作業の前後を常に考え、価値のある分析ができるようになります。



最新エントリー

多田 翼 (書いた人)