Home ≫ Posts filed under データ分析
投稿日 2016/03/16
最終更新日
投稿日 2016/02/17
最終更新日
データ分析者がプレゼン資料をつくる時に、陥りがちな落とし穴と対策
投稿日 2016/02/06
最終更新日
書評: ビジネスで本当に使える超統計学 (村上知也 / 矢本成恒)
投稿日 2016/01/30
最終更新日
投稿日 2016/01/16
最終更新日
この世で一番おもしろい統計学 - 誰も 「データ」 でダマされなくなるかもしれない16講+α という本をご紹介します。
エントリー内容です。
書評: この世で一番おもしろい統計学 - 誰も 「データ」 でダマされなくなるかもしれない16講+α (アラン・ダブニー / 山形浩生 (訳))
この世で一番おもしろい統計学 - 誰も 「データ」 でダマされなくなるかもしれない16講+α という本をご紹介します。
アラン・ダブニー, グレディ・クライン (ダイヤモンド社) 2014-01-30
エントリー内容です。
- 本書の特徴 (類似本に比べてユニークなところ)
- 統計の醍醐味
- データで騙されないために
投稿日 2015/11/26
最終更新日
ランニング開始4ヶ月のトラッキングデータを使った統計分析
投稿日 2015/11/05
最終更新日
毎月の始めに、自分の持っている金融資産の状況を確認しています。
全ての数字をシートに記入し、今の時点で自分の資産がどうなっているかをざっくりと把握できます。月初めに毎月行なうので、過去の前月末の状態がトレンド化されます。毎月のシートの更新は、時間にして10分くらいの簡単な集計です。
自分が保有する金融資産を、5つのカテゴリーに分けて管理しています。2015年10月時点でのそれぞれの内訳は、次の通りです。
2015年10月の最新の数字を反映しました。毎月の更新は3年以上続けていて、ここ3年の金融資産額の推移は以下のようになりました。2013年、2014年、2015年の10月末時点での金融資産額です。
金融資産の3年トレンドから考える2016年の投資方針
毎月の始めに、自分の持っている金融資産の状況を確認しています。
全ての数字をシートに記入し、今の時点で自分の資産がどうなっているかをざっくりと把握できます。月初めに毎月行なうので、過去の前月末の状態がトレンド化されます。毎月のシートの更新は、時間にして10分くらいの簡単な集計です。
保有する金融資産のカテゴリー
自分が保有する金融資産を、5つのカテゴリーに分けて管理しています。2015年10月時点でのそれぞれの内訳は、次の通りです。
- キャッシュ:財布や家にある現金、銀行口座の預金、証券会社の MRF
- 日本株式:主に日本株式に投資するアクティブ投資信託、個別株
- 外国株式:先進国と新興国のインデックス投資信託
- 外国債券:海外債券の投資信託、FX
- 年金:国民年金と厚生年金、個人型確定拠出年金 (401k)
金融資産額の3年トレンド
2015年10月の最新の数字を反映しました。毎月の更新は3年以上続けていて、ここ3年の金融資産額の推移は以下のようになりました。2013年、2014年、2015年の10月末時点での金融資産額です。
投稿日 2015/10/28
最終更新日
分析の本質は、比較することであると考えています。
何かと何かを分けて比較することによって、はじめて多い・少ないなどの違いがわかります。例えば、同じものを前月や前年と時系列で比べたり、男女や年代ごとに分けての比較をします。
比較するために 「分ける」 ことが分析のキモであり、「何のために、どのように分けるか」 の工夫が重要な意味を持ちます。分け方にこそ、分析者の力量が問われます。
分けることに注意が必要なのは、単なる知的興味からの思いつきでの分解にならないようにしたいことです。
より適切に分けるためには、もう一歩踏み込んで考えるべきです。つまり、特にビジネスでの分析では、何がわかれば実行可能でかつ意味のある結論を導き出せるかを、常に意識することです。
分けることの背後には、分けることで要因ごとに理解でき、そこから仮説や意思決定ができるという、ビジネス上意味のある結論を導き出そうとする明確な意図があるべきです。
分析の目的は、興味があるから分析するのではありません。ビジネスとしての判断を助け、効果的な打ち手を生むことを期待するから分析するはずです。
どんなに高度な分析をしても、その結果が有効な打ち手につながらなかったとしたら、ビジネスへのインパクトは小さくなってしまいます。
ビジネスにおいて役に立つ分析や使える分析結果とは、実際の効果が生まれるところまで掘り進めた分析のことです。「使える」 ところまで追求しないと、せっかくの分析結果も絵に描いた餅になりかねません。
例えばユーザー分析において、性別年代で分ける、ヘビーユーザーとライトユーザーに分ける、スマホなら利用 OS で分ける。これらの分ける視点は、ある程度の分析経験があれば思いつくものです。
このような各種の 「分ける」 ことについて大切なのが、分けて比較分析した結果や得られるであろう示唆はアクションにつながるのかです。単なる知的好奇心ではなく、目的や意図を持った分け方になっているかは常に心がけたいことです。
分析で比較する時、その 「分け方」 に意図がありますか?
分析の本質は、比較することであると考えています。
比較をするために分ける
何かと何かを分けて比較することによって、はじめて多い・少ないなどの違いがわかります。例えば、同じものを前月や前年と時系列で比べたり、男女や年代ごとに分けての比較をします。
比較するために 「分ける」 ことが分析のキモであり、「何のために、どのように分けるか」 の工夫が重要な意味を持ちます。分け方にこそ、分析者の力量が問われます。
単に思いつきで分けていないか
分けることに注意が必要なのは、単なる知的興味からの思いつきでの分解にならないようにしたいことです。
より適切に分けるためには、もう一歩踏み込んで考えるべきです。つまり、特にビジネスでの分析では、何がわかれば実行可能でかつ意味のある結論を導き出せるかを、常に意識することです。
分けることの背後には、分けることで要因ごとに理解でき、そこから仮説や意思決定ができるという、ビジネス上意味のある結論を導き出そうとする明確な意図があるべきです。
分析の目的は、興味があるから分析するのではありません。ビジネスとしての判断を助け、効果的な打ち手を生むことを期待するから分析するはずです。
目的や意図を持って分ける
どんなに高度な分析をしても、その結果が有効な打ち手につながらなかったとしたら、ビジネスへのインパクトは小さくなってしまいます。
ビジネスにおいて役に立つ分析や使える分析結果とは、実際の効果が生まれるところまで掘り進めた分析のことです。「使える」 ところまで追求しないと、せっかくの分析結果も絵に描いた餅になりかねません。
例えばユーザー分析において、性別年代で分ける、ヘビーユーザーとライトユーザーに分ける、スマホなら利用 OS で分ける。これらの分ける視点は、ある程度の分析経験があれば思いつくものです。
このような各種の 「分ける」 ことについて大切なのが、分けて比較分析した結果や得られるであろう示唆はアクションにつながるのかです。単なる知的好奇心ではなく、目的や意図を持った分け方になっているかは常に心がけたいことです。
投稿日 2015/09/05
最終更新日
会社を変える分析の力 という本は何度か読み返しています。
というのは、自分がこれまで、そしてこれからもデータ分析をする時に大切にしたい指針が書かれているからです。
指針とは、「データ分析をする時の4つの問い」 です。
自分の仕事とデータ分析は、切っても切り離せないものです。今がやっている分析案件は4つを全て満たしているのかを、意識して問うことを心がけています。以下、4つの問いのそれぞれについて説明します。
データ分析者として大切にしたい 「データ分析をする時の4つの問い」
会社を変える分析の力 という本は何度か読み返しています。
データ分析をする時の4つの問い
というのは、自分がこれまで、そしてこれからもデータ分析をする時に大切にしたい指針が書かれているからです。
指針とは、「データ分析をする時の4つの問い」 です。
- その数字にどこまで責任を取れるか?
- その数字から何がわかったか?
- 意思決定にどのように使えるのか?
- ビジネスにどれぐらい役に立ったか?
自分の仕事とデータ分析は、切っても切り離せないものです。今がやっている分析案件は4つを全て満たしているのかを、意識して問うことを心がけています。以下、4つの問いのそれぞれについて説明します。
投稿日 2015/04/29
最終更新日
仕事でのデータ分析で意識したいと思っているのは、今やっているデータ分析が 「意思決定につながるかどうか」 です。
やみくもにデータ集計や分析プロセスに入るのではありません。自分はこれからどういう課題に対して、何の目的で分析を始めるのかをまず明らかにすることです。得られるであろう結果や解釈が、意思決定にどう役立つかをまず最初に考えることです。
データ分析をするにあたって大切にしたいと思っているスタンスです。
統計学が最強の学問である [実践編] - データ分析のための思想と方法 という本には、「アウトカム」 を考える重要性が書かれています。
該当箇所を引用します。
価値のあるデータ分析とは意思決定につながること
仕事でのデータ分析で意識したいと思っているのは、今やっているデータ分析が 「意思決定につながるかどうか」 です。
そのデータ分析は意思決定につながるか
やみくもにデータ集計や分析プロセスに入るのではありません。自分はこれからどういう課題に対して、何の目的で分析を始めるのかをまず明らかにすることです。得られるであろう結果や解釈が、意思決定にどう役立つかをまず最初に考えることです。
データ分析をするにあたって大切にしたいと思っているスタンスです。
アウトカムを考えよ
統計学が最強の学問である [実践編] - データ分析のための思想と方法 という本には、「アウトカム」 を考える重要性が書かれています。
西内 啓 ダイヤモンド社 2014-11-04
該当箇所を引用します。
投稿日 2015/04/25
最終更新日
統計学が最強の学問である [実践編] - データ分析のための思想と方法 という本をご紹介します。
エントリーの内容です。
書評: 統計学が最強の学問である [実践編] - データ分析のための思想と方法 (西内啓)
統計学が最強の学問である [実践編] - データ分析のための思想と方法 という本をご紹介します。
西内 啓 ダイヤモンド社 2014-11-04
エントリーの内容です。
- 統計学を使う3つの目的
- 本書で扱う統計学は3つめの 「因果関係」
投稿日 2015/03/10
最終更新日
三越伊勢丹ホールディングスと富士通が、協働で行なった取り組みが興味深かったのでご紹介します。2011年のもので、店頭販売やサービス力をどう強化するかの事例でした。
接客力を科学的に分析することで、お客様へのサービスの質を向上 (株式会社三越伊勢丹ホールディングス様)|富士通
取り組み背景の問題意識です。該当箇所を引用します。
三越伊勢丹ホールディングスの課題は、どうやって接客販売力を強化するのでした。
三越伊勢丹の 「優秀な販売員 vs 一般的な販売員」 の比較分析調査がおもしろい
三越伊勢丹ホールディングスと富士通が、協働で行なった取り組みが興味深かったのでご紹介します。2011年のもので、店頭販売やサービス力をどう強化するかの事例でした。
接客力を科学的に分析することで、お客様へのサービスの質を向上 (株式会社三越伊勢丹ホールディングス様)|富士通
取り組みの背景
取り組み背景の問題意識です。該当箇所を引用します。
百貨店も商品力だけでは生き残れない時代。将来にわたって安定的な収益をあげていける構造に転換する必要があり、そのためには従業員一人ひとりが夢とほこりをもって働ける企業風土を醸成していかなければならない。接客販売力を強化することで、販売力を競争力に変えていく必要がある。
三越伊勢丹ホールディングスの課題は、どうやって接客販売力を強化するのでした。
投稿日 2015/01/10
最終更新日
Harvard Business Review に、P&G が意思決定にデータをどのように使っているかが紹介されています (2013年4月4日) 。
参考:How P&G Presents Data to Decision-Makers - Harvard Business Review
記事では、ダッシュボード、会議室の様子、チャート (例: ヒートマップ) などの事例が掲載されています。
この記事で印象に残ったのは、P&G の取り組みがグラフなどのデータ結果から 「何が起こったのか」 のファクトを知ることだけにとどまっていないことでした。P&G が重視しているのは、その先にある 「それに対してどうアクションをするのか」 にいかにたどり着けるかです。
P&G のマーケティング意思決定から学んだこと
Harvard Business Review に、P&G が意思決定にデータをどのように使っているかが紹介されています (2013年4月4日) 。
参考:How P&G Presents Data to Decision-Makers - Harvard Business Review
P&G が重視する Why と How
記事では、ダッシュボード、会議室の様子、チャート (例: ヒートマップ) などの事例が掲載されています。
この記事で印象に残ったのは、P&G の取り組みがグラフなどのデータ結果から 「何が起こったのか」 のファクトを知ることだけにとどまっていないことでした。P&G が重視しているのは、その先にある 「それに対してどうアクションをするのか」 にいかにたどり着けるかです。
投稿日 2014/12/30
最終更新日
2014年 当ブログへのアクセス状況まとめ
投稿日 2014/06/28
最終更新日
会社を変える分析の力 という本は、ふと思い出した時に読み返すことが多く、自分にとって大切な本の一つです。
必ずと言ってよいほど目を通すのは、「データ分析をする時の4つの問い」 です。
データ分析のプロになるための4つの視点
会社を変える分析の力 という本は、ふと思い出した時に読み返すことが多く、自分にとって大切な本の一つです。
データ分析の4つの問い
必ずと言ってよいほど目を通すのは、「データ分析をする時の4つの問い」 です。
- その数字にどこまで責任を取れるか
- その数字から何がわかったか
- 意思決定にどのように使えるのか
- ビジネスにどれぐらい役に立ったか
投稿日 2014/05/24
最終更新日
戦略読書日記 - 本質を抉りだす思考のセンス という本に、「スキル」と「センス」は異なる能力であり、区別して考えるべきであると書かれていました。
例えば、「営業スキルがある人」と聞くのと、「営業センスがある人」とでは、受け取るニュアンスが違います。
それってスキルの問題?センスの問題?
戦略読書日記 - 本質を抉りだす思考のセンス という本に、「スキル」と「センス」は異なる能力であり、区別して考えるべきであると書かれていました。
スキルとセンスは似て非なるもの
例えば、「営業スキルがある人」と聞くのと、「営業センスがある人」とでは、受け取るニュアンスが違います。
投稿日 2013/09/22
最終更新日
「統計学が最強の学問である」を読んで
「統計学が最強の学問である」に書かれていたことで、その通りと思ったものがあります。
何かを分析する際に必要なデータを集める場合、全数調査とサンプリング調査の2つがあります。
全数調査とは字のごとく、全てのデータを集めて集計/分析をするケースです。イメージとしては、20代の日本人男性の睡眠時間を調べるために、20代男性全員に睡眠時間を聞くというもの。人数にしておそらくは700万人くらいの規模かと思いますが、一人残らず睡眠時間をヒアリングするのが全数調査。サンプリング調査とは、700万人にいちいち聞いていられないということで、20代男性の700人に聞いておけばいいんじゃないか、という感じ。
サンプリング調査で注意すべきは、この700人をどうやって選んだかです。仕事で忙しいような人ばかりでは睡眠時間が短い人が多そうなので、その結果は全数調査と比べて睡眠時間は短いという結果が出てしまうでしょう。これでは意味のあるデータにはなりません。そうならないために、700人が日本の20代男性全員を反映しているような均質な集団にする。
よくサンプリング調査の例えで使われるのは料理の味見です。料理の塩加減を知る正確な方法はその料理を全部食べてしまうことです。これが全数調査のイメージ。サンプリング調査とは、作った料理を全部食べずにちょっとだけ味見をして塩加減を確認すること。味見で注意すべきは、その前にちゃんとかき混ぜてからだと思いますが、これがさっきの「700人が日本の20代男性全員を反映しているような均質な集団にする」という作業です。
もちろん、全数調査のほうがサンプリング調査よりもデータ精度は高いです。全員に聞くので、誤差が発生しようもない。ただし、往々にして全数調査は現実的な手段ではありません。料理の味を確認するのに全部食べることはあり得ないように。だから大事なのは、サンプリング調査によってどの程度精度が低下するのか。判断や意思決定に影響しないような精度の向上はもはや意味がないのです。そのために費やす時間やコストは無駄です。
データ分析で重要だと思うのは、集計/分析は目的のための「手段」であること。分析結果を活かして何をするのか、どんな価値を得られるかの目的によって、手段は異なります。
「統計学が最強の学問である」という本で繰り返し述べられていたのは、そのデータや分析結果から得られたことが意味のある結果なのかを自分で判断できること、それが統計学の考え方では重要であると。
データ分析をするとは、何か知りたいことがあるといことです。真に知りたい値に対して、その結果はどこまで正しいのか。つまり、誤差はどの程度なのか。その誤差を考慮に入れたうえでも意味のある結果なのかということです。
誤差を見る上で大切なのは2つ。誤差の大きさと、その誤差の発生確率。後者はp値と呼ばれ、実際には何の差もないのに誤差や偶然によってたまたまデータのような差が生じる確率です。通常はp値は5%以下であれば、「この結果は偶然得られたとは考えにくい」と判断します。
最後に、もう1つ。大切にしたいと思っている指摘があったので引用しておきます。
※関連記事
書評「会社を変える分析の力 」:データ分析をする時の4つの自問自答
書評:意思決定のための「分析の技術」
書評:「それ、根拠あるの?」と言わせない データ・統計分析ができる本
データ分析だけだとまだ五合目くらい
ビッグデータ時代と呼ばれる考え方に逆行するが、私は誰からデータ分析の相談を受けても「まず正しい判断に必要な最小十分のデータを扱うこと」を推奨している。
何かを分析する際に必要なデータを集める場合、全数調査とサンプリング調査の2つがあります。
全数調査とは字のごとく、全てのデータを集めて集計/分析をするケースです。イメージとしては、20代の日本人男性の睡眠時間を調べるために、20代男性全員に睡眠時間を聞くというもの。人数にしておそらくは700万人くらいの規模かと思いますが、一人残らず睡眠時間をヒアリングするのが全数調査。サンプリング調査とは、700万人にいちいち聞いていられないということで、20代男性の700人に聞いておけばいいんじゃないか、という感じ。
サンプリング調査で注意すべきは、この700人をどうやって選んだかです。仕事で忙しいような人ばかりでは睡眠時間が短い人が多そうなので、その結果は全数調査と比べて睡眠時間は短いという結果が出てしまうでしょう。これでは意味のあるデータにはなりません。そうならないために、700人が日本の20代男性全員を反映しているような均質な集団にする。
よくサンプリング調査の例えで使われるのは料理の味見です。料理の塩加減を知る正確な方法はその料理を全部食べてしまうことです。これが全数調査のイメージ。サンプリング調査とは、作った料理を全部食べずにちょっとだけ味見をして塩加減を確認すること。味見で注意すべきは、その前にちゃんとかき混ぜてからだと思いますが、これがさっきの「700人が日本の20代男性全員を反映しているような均質な集団にする」という作業です。
もちろん、全数調査のほうがサンプリング調査よりもデータ精度は高いです。全員に聞くので、誤差が発生しようもない。ただし、往々にして全数調査は現実的な手段ではありません。料理の味を確認するのに全部食べることはあり得ないように。だから大事なのは、サンプリング調査によってどの程度精度が低下するのか。判断や意思決定に影響しないような精度の向上はもはや意味がないのです。そのために費やす時間やコストは無駄です。
データ分析で重要だと思うのは、集計/分析は目的のための「手段」であること。分析結果を活かして何をするのか、どんな価値を得られるかの目的によって、手段は異なります。
「統計学が最強の学問である」という本で繰り返し述べられていたのは、そのデータや分析結果から得られたことが意味のある結果なのかを自分で判断できること、それが統計学の考え方では重要であると。
データ分析をするとは、何か知りたいことがあるといことです。真に知りたい値に対して、その結果はどこまで正しいのか。つまり、誤差はどの程度なのか。その誤差を考慮に入れたうえでも意味のある結果なのかということです。
誤差を見る上で大切なのは2つ。誤差の大きさと、その誤差の発生確率。後者はp値と呼ばれ、実際には何の差もないのに誤差や偶然によってたまたまデータのような差が生じる確率です。通常はp値は5%以下であれば、「この結果は偶然得られたとは考えにくい」と判断します。
最後に、もう1つ。大切にしたいと思っている指摘があったので引用しておきます。
データ分析においては重要なのは、「果たしてその解析はかけたコスト以上の利益を自社にもたらすような判断につながるのだろうか?」という視点だ。
※関連記事
書評「会社を変える分析の力 」:データ分析をする時の4つの自問自答
書評:意思決定のための「分析の技術」
書評:「それ、根拠あるの?」と言わせない データ・統計分析ができる本
データ分析だけだとまだ五合目くらい
最新記事
Podcast
note
書いている人 (多田 翼)
Aqxis 代表 (会社 HP はこちら) 。Google でシニアマーケティングリサーチマネージャーを経て独立し現職。ベンチャーから一部上場企業の事業戦略やマーケティングのコンサルティングに従事。
ブログ以外にマーケティングレターを毎週1万字で配信しています。音声配信は Podcast, Spotify, Amazon music, stand.fm からどうぞ。
名古屋出身、学生時代は京都。気分転換は朝のランニング。
ブログ以外にマーケティングレターを毎週1万字で配信しています。音声配信は Podcast, Spotify, Amazon music, stand.fm からどうぞ。
名古屋出身、学生時代は京都。気分転換は朝のランニング。