統計学が最強の学問である by 西内 啓
西内 啓(にしうち・ひろむ)
東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2014年11月より株式会社データビークルを創業。
自身のノウハウを活かしたデータ分析支援ツール「Data Diver」などの開発・販売と、官民のデータ活用プロジェクト支援に従事…
あらゆる学問のなかで統計学が最強の学問であると。
どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。
「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人が、その本当の魅力とパワフルさを知っているだろうか。
最新の事例と研究結果をもとに、今までにない切り口から統計学の世界を案内する。
目次
第1章 なぜ統計学が最強の学問なのか?
統計リテラシーのない者がカモられる時代がやってきた
統計学は最善最速の正解を出す
すべての学問は統計学のもとに
ITと統計学の素晴らしき結婚
第2章 サンプリングが情報コストを激減させる
統計家が見たビッグデータ狂想曲
部分が全体に勝る時
1%の精度に数千万円をかけるべきか?
第3章 誤差と因果関係が統計学のキモである
ナイチンゲール的統計の限界
世間にあふれる因果関係を考えない統計解析
「60億円儲かる裏ワザ」のレポート
p値5%以下を目指せ!
そもそも、どんなデータを解析すべきか?
「因果関係の向き」という大問題
第4章 「ランダム化」という最強の武器
ミルクが先か、紅茶が先か
ランダム化比較実験が社会科学を可能にした
「ミシンを2台買ったら1割引き」で売上は上がるのか?
ランダム化の3つの限界
第5章 ランダム化ができなかったらどうするか?
疫学の進歩が証明したタバコのリスク
「平凡への回帰」を分析する回帰分析
天才フィッシャーのもう1つの偉業
統計学の理解が劇的に進む1枚の表
重回帰分析とロジスティック回帰
統計学者が極めた因果の推論
第6章 統計家たちの仁義なき戦い
社会調査法vs疫学・生物統計学
「IQ」を生み出した心理統計学
マーケティングの現場で生まれたデータマイニング
言葉を分析するテキストマイニング
「演繹」の計量経済学と「帰納」の統計学
ベイズ派と頻度論派の確率をめぐる対立
終 章 巨人の肩に立つ方法
「最善の答え」を探せ
エビデンスを探してみよう

MEMO
統計学が最強の学問である
◆あなたのビジネス上の成功法則も、
ほんの数例程度の偏った成功体験を過剰に
一般化したものとは言えないだろうか?
人間誰しも一度先入観を持つと、
すべてのことを都合よく解釈してしまうという
認知的な性質を持っているのである。
こうした人間の欠陥を統計学は
補うことができる。
経験と勘だけでは、
こうした利益を左右しうる差異について
「わかった」のか「わかった気になっている」のかの
区別がつけられないが、
きちんとデータを比較すればその違いは明らかなのだ。
◆データをビジネスに使うための「3つの問」
- Q1:何かの要因が変化すれば利益は向上するのか?
- Q2:そうした変化を起こすような行動は実際に可能なのか?
- Q3:変化を起こす行動が可能だとしてそのコストは利益を上回るのか?
この3つの問いに答えられた時点ではじめて
「行動を起こすことで利益を向上させる」
という見通しが立つのであり、
そうでなければわざわざ統計解析に従って
新たなアクションを取ろうとする意味はない。
◆統計学という最強の学問の力の一端を手にしさえすれば、
健康になることも賢明になることも裕福になることも
ずいぶん簡単になる。
これらは、
世界中の学者たちが統計学を使って
実証した事実なのだ。
◆これから10年で最もセクシーな職業とは?
「統計家」である。
セクシー(Sexy)というのは
「イケてる」とか「とても魅力的」とかいった
意味でよくアメリカ人に使われる表現である。
たとえば、
「新しいiPhoneのデザインはセクシーだ」
といった言い方をする。
◆心臓病だろうがコレラだろうが、
原因不明なのであれば、
その原因を明らかにするために行うべきことは、
慎重かつ大規模なデータの収集であり、
その適切な統計解析以外にはあり得ない。
◆望むと望まざることにかかわらず、
ほとんどすべての学問に関わる学者は
統計学を使わざるを得ない時代がすでに訪れているし、
統計リテラシーさえあれば、
自分の経験と勘以上の何かを自分の人生に活かすことが
ずいぶんと簡単になる。
◆どのような教育がいいか、
という問いへの回答は、
教育される本人の特性や能力、環境などさまざまな要因によって左右されるし、
医療と同様に不確実性の大きい分野でもある。
自分が病気になったときに、
まず長生きしているだけの老人に長寿の秘訣を聞きに行く人はいないのに、
子どもの成績に悩む親が、
子どもを全員東大に入れた老婆の体験記を買う、
という現象が起こるのは奇妙な事態だと思わないだろうか。
たとえば、
・教師に生徒の成績に基づいた競争をさせて、ボーナースの査定に反映させればいい
・子どもは小学校入学前から英才教育を施すことで天才が育つはずだ
・数学教育にもっとコンピュータを取り入れて効率化をはかるべきだ
など、さまざまアイディアが、
教育学者からも教育者からも、
ただの素人からもしばしば提唱される。
しかしながら、
果たして本当にそれが正しいかどうかは、
結局のところデータと統計学の力を借りなければ
誰にもわからないのだ。
◆なぜ統計学は最強の武器になるのか?
その答えを一言で言えば、
「どんな分野の議論においても、
データを集めて分析することで最速で最善の答えを出すことができる」
からだ。
◆すでに統計学は21世紀に生きる我々にとって
必須のスキルとなっているし、
多くの人間にとって最強の武器となる可能性も秘めている。
ビジネス領域における統計学を応用した
ソリューションのことをビジネス・インテリジェンスと呼ぶが、
このインテリジェンスという言葉は
スパイ映画に出てくるCIAの「I」の文字が示すものだ。
それに、兵法の古典中の古典である孫子の時代から、
戦いにおける情報の重要性はいくら強調してもしずぎるということはない。
情報を制する者が世界を制する、
という言葉を現代において言い換えるならば、
統計学を制する者が世界を制するということなのである。
◆今、私たちは間違いなく読み書きと同じレベルで、
統計学的な思考方法を求められている。
読み書きをする能力のことをリテラシーと呼ぶが、
統計的なリテラシーすなわち「統計リテラシー」がないことは
現代を生きる我々にとって思いのほかヤバイ状態なのだ。