書評: この世で一番おもしろい統計学 - 誰も｢データ｣でダマされなくなるかもしれない16講+α (アラン・ダブニー / 山形浩生 (訳))

この世で一番おもしろい統計学 - 誰も｢データ｣でダマされなくなるかもしれない16講+α という本をご紹介します。

この世で一番おもしろい統計学 - 誰も｢データ｣でダマされなくなるかもしれない16講+α

posted with ヨメレバ

アラン･ダブニー, グレディ･クライン (ダイヤモンド社) 2014-01-30

Amazon

Kindle

楽天ブックス

エントリー内容です。

本書の特徴 (類似本に比べてユニークなところ)
統計の醍醐味
データで騙されないために

｢この世で一番おもしろい統計学｣の特徴

本書の特徴は2つです。

まんがで描かれている
統計学の根底だけに思い切って絞ってある

2つ目の統計学の根底は、｢標本を見て母集団について何かを言うのが統計学だ｣と本書では位置づけています。標本という得られた一部から、知りたい全体 (母集団) をどうやって推定し、全体をどう評価するかです。

この本で書かれている統計学の根底は、以下に絞られています。

標本を元に推定した母集団の平均値と標準偏差について
推定した値の信頼区間がどの程度なのか
それをもとに行なう仮説検定は何を意味するのか

本書全体を通して主に扱うのは、無作為抽出、標本数、平均、標準偏差、正規分布、信頼区間、p 値です。それぞれの難しい数式は巻末で説明しています。

訳者 (山形浩生氏) の解説では、本書の特徴について次のように述べられています。

このかなり大胆で思い切った絞り方にこそ、本書の最大の特徴がある。

他の入門書でなら、本書の内容すべてをどんなに多くても80ページで説明しつくすだろう。でも本書は200ページかける。

わかっている人にとっては、かなりくどいと思えるかもしれない。でも本書は入門書なので、わかっていない人が対象だ。

数式1つ、説明1行ですませるところを、5ページかけるところが本書のよさなのだ。

(引用：この世で一番おもしろい統計学 - 誰も｢データ｣でダマされなくなるかもしれない16講+α)

他の統計の本では80ページですむところを200ページもかけるので、それだけじっくりと説明されています。ページ数をそれだけ使うもう1つの理由は、本書がマンガだからです。

統計を扱った本で、まんがで書かれたもの、あるいは入門編として対象範囲を絞る、のどちらかを扱ったものは他にあります。2つともを満たした本は他にはないのではないでしょうか。他の統計本に比べて、この本はユニークな存在です。

統計の醍醐味

統計の根幹を｢標本を見て母集団について何かを言うこと｣と見たときに、ここでの｢何かを言う｣とは2つあります。

母集団を推定すること
その推定がどの程度の確からしさかを評価すること

一部から全体を推定する

後者の、本来知りたい値への推定値が、どのくらい確かなのか･どの程度信じられるかを評価できることが、統計の醍醐味です。

誤差の範囲で偶然なのか、そうではなくたまたまを超えているのか。どのくらい程度の信頼性で、増えた･大きくなった･売上が上がったと言えるのかです。

そもそもの統計学の出発点は、知りたいことの値 (母集団の真値) がわからないことから始まります。それでもなんとかしてその値を知るために、全体の一部を適切に持ってきて (抽出された標本 (サンプル) ) 、その一部を集計し、全体という本来知りたかったことを推定します。

抽出した標本の平均値はただ1つに決まります。例えば、りんご30個の重さの平均は 280g であったなどです。この例で言うと、本当に知りたいのは目の前のりんご30個の重さではなく、日本全国のりんごの重さについてです。

推定はどのくらい確かなのか

統計のおもしろさは、たった標本30個のりんごからわかった平均の重さをもって、日本のりんごの重さの推定値が｢どのくらい確からしいのか｣を評価できることです。

統計では信頼区間という幅で表現します。りんごの例で言えば、日本のりんごの 95% は 240g - 320g の間にある、となります (数値は仮です) 。

りんごの例で続けると、あるりんごを品種改良した結果、どうやらりんごのサイズを大きくすることに成功したような気がするとします。試しに測ってみると、改良したりんごの100個の平均値は 300g になったとします。

この 300g と、品種改良前のりんごの重さ 280g とを比べると、一見すると品種改良はうまくいっているように見えます。

これが、本当にそう言えるのかを統計の仮説検定を使えば数字で評価できます。p 値という数値で検定します。具体的には、｢品種改良は本当は効果がないのに、選んだ100個が偶然大きかった｣という確率 (p 値) を出します。

この偶然の確率が 30% あれば改良効果はないと判断します。10回に3回起こることであれば、自信を持って効果があるとは言えないという結論です。一方、p 値が 5% より低ければ偶然の確率は低い、つまり品種改良の効果があったと評価します。

偶然確率の基準ライン (有意水準) を 10% か 5% か 1% のどれにするかは、分析者の判断に委ねられます。この確率は、どの程度のリスクが取れるかにより変わります。

例えば、医薬などの人の健康や命にかかわる分野では小さくします。一方で、そうではない領域では、5% とするのが一般的です。