わかりやすい統計学の本-2冊
本記事では、統計学の基礎をわかりやすく教えてくれる2冊の本、
について、違いや実際に学んだことご紹介します。
本記事の目次
こんな人におすすめ
読んでほしいのは、
-
統計が何に使えるのか分からない
-
統計を学んでみたいけれど、何から手をつけたらいいか分からない
-
教養として統計が何かを知っておきたい
といった、統計の基礎に興味がある方々です。
本の概要
改めて、今回ご紹介するのはこちらの2冊です。
題名 |
最強に面白い!!統計 |
この世で一番おもしろい統計学 |
---|---|---|
作者 |
今野紀雄さん(監修) |
アラン・ダブニーさん |
出版年 | 2019年6月 | 2014年1月 |
ページ数 | 125ページ | 233ページ |
価格 |
780円+税 |
1500円+税 |
本書の内容を「専門的か一般的か」×「理解する目的か実践する目的か」の2軸でプロットしてみました。
2冊の相違点
どちらも統計について「どういったものか」「何に使えるのか」を学べます。
そのため、統計を理解する目的で、読みやすい一般的な内容を求めている方向けの本です。
扱っている項目も似ており、調査・標本・平均・正規分布・相関・疑似相関・標準偏差・標本誤差などについて学べます。
いずれも事例を用いて分かりやすく解説してくれるので、参考書に比べ理解しやすく記憶にも残りやすいです。
一方、2冊を比較すると、
-
『最強に面白い!! 統計』は簡潔に知識を得られる
- 一つの見開きで一つの解説
- 身近な事例を多く用いている(保険の仕組み、レシート、視聴率など)
- 分量が少ない
-
『この世で一番おもしろい統計学』は丁寧に理解を深められる
- ストーリーに沿ったマンガ仕立ての進行
- 空想の事例を多く用いている(魚、ドラゴン、ミミズなど)
- 分量が多い
といった違いがあります。
マンガ形式で読みたい方は『この世で一番おもしろい統計学』を、そうではない方は『最強に面白い!! 統計』をお勧めします。
マンガ仕立ての『この世で一番おもしろい統計学』は好みが別れそうなので。
『最強に面白い!! 統計』
ここでは、本から学んだ2つのポイントをお伝えします。
こちらの本は、統計がどんなところで使われているのか、身近な例で示してくれます。
あくまで本に紹介されているプチ知識をまとめたものであり、体系的な内容ではないのでご理解ください。
コイン投げ調査
調査手法の一つに「回答のランダム化」と呼ばれるコインを使った方法があります。
この手法は、正直に回答しにくい質問を行う際に利用されます。
例えば、「未成年のときに飲酒したことがありますか?」という質問に、未成年飲酒経験者は答えにくいですよね。
実践するには、事前に回答者にコインを渡します。
回答者が、質問者に見えないところでコインを投げたところで調査を始めます。
回答者には、以下のルールに沿って「はい」「いいえ」のどちらかで質問に答えてもらいます。
- コインの表が出た場合→必ず「はい」と言う
- コインは裏が出て、質問への回答がYesの場合→「はい」と言う
- コインは裏が出て、質問への回答がNoの場合 →「いいえ」と言う
これにより、正直には答えにくい質問でも、コインの裏面が出た回答者は「はい」と答えやすくなります。
体裁上、表が出た回答者と区別がつかないためです。
一方で、この手法で多数の回答者に質問を行えば、質問者は実際の回答数を予想することができます。
具体的に未成年飲酒の経験を問うケースで考えてみましょう。
「未成年飲酒をしていましたか?」と訊いて、回答者300人のうち200人が「はい」と回答したとします。
このとき、計算により、実際の未成年飲酒率は33%であると推定できます。
計算方法を具体的に説明します。
まずコインの表が出る確率は1/2であるため、「はい」と回答した200人のうち、150人はコインが表だったため「はい」と答えたと仮定できます。
言い換えると、コインの裏が出た150人のうち、50人が「はい」と答えた、と言えます。
そのため、未成年飲酒率は50/150、すなわち1/3、33%と計算されます。
疑似相関
疑似相関とは、2つの要素に相関関係が見られるものの、直接的な因果関係はないことです。
そもそも相関関係は、ある要素(量)が増えると連動して別の要素が増える/減るときの二つの要素の関係のことです。
例えば、一般に身長が高いほど体重が重い傾向があるため、身長と体重の間には相関関係があると言えます。
身長と体重の関係のように、一方が増えると他方も増えるものを、特に正の相関関係と呼びます。
疑似相関は、2つの要素に相関はあるものの、因果関係がなく、第三の要素が隠れている場合の関係性のことを指します。
例えば、日本人男性は、体重が重いほど年収が高い傾向があるそうです。そのため、 体重と年収に相関関係があると言えます。
しかし、体重と年収に因果関係はありません。実は、第三の要素として、年齢が隠れているのです。
年齢が高いほど体重が重くなり、また年齢が高い人ほど年収も高くなる傾向があるため、体重と年収を比較すると正の相関が見られるという仕組みです。
『この世で一番おもしろい統計学』
続いてマンガ形式で統計について教えてくれる、もう一冊の本をご紹介します。
こちらの本は、先ほどの『最強に面白い!! 統計』よりも、根本的な部分から教えてくれます。
標本の見方
データ分析する際にまず行うべきことは、母集団からランダムに(無作為に)標本を選ぶことです。
標本を集めたら、次にデータを4つのポイントで見ていきます。
-
標本数
大きいほど計算結果の信頼が高まる(母数によるが目安は30以上)
例えば、A国にいる1000頭のサイのツノの長さを知りたい場合に、10頭の長さだけ測っても少し心もとないですよね。100頭のほうが、正確に1000頭の長さを推定できそうです。 -
形
横軸に測りたい値、縦軸に該当する数を並べてヒストグラムを作る
グラフの形が一つの左右対称の山(正規分布)であるか確かめる
違う場合は、歪んだデータになっている
サイのツノの長さを並べると、ある長さ(35cmなど)付近のサイがもっとも多くなり、10cmや90cmのサイは少ないはずです。
もし90cmのところにもサイが多く集まっているデータが得られたら、データがランダムではなかった、そのサイはA国出身ではない、サイではなくマンモスだった、などの可能性も考えてみましょう。 -
位置
平均値と中央値の位置を見ると典型的な値がわかる
特に平均値や中央値が活躍するのは、2つのデータを比較するときです。
サイの標本とマンモスの標本を比較する際に、平均値と中央値という典型的な値が分かっていれば、それぞれの山の形を見比べなくても、違いを推測することができます。 -
広がり
広がりはバラつきの指標を示す
大きいほど 箱形図の四分位範囲や、標準偏差も大きくなる
箱形図は視覚的にデータのバラつきがわかります。
一方、標準偏差は広がりを数値化したもの(平均からの各点の距離の平均)です。
中心極限定理
受験などでよく聞く「中心極限定理」についても学びました。
データには、
という法則が成り立つそうです。
この発見のことを『中心極限定理』と呼びます。
ただし、定理が成り立つ条件として、
- それぞれの標本が無作為に抽出されていること
- 各標本数が十分に大きいこと
が挙げられます。
受験で定理を使うときに「標本数が十分に大きいので中心極限定理より」などと注意書きをしていた理由がようやく腑に落ちました。
以上が、本を読んで私が勉強になったこと一部です。
Instagram(ol_rikei)では、ブログで紹介した学んだことに1つずつ加え、本1冊あたり3つのポイントを紹介しています。
気になった方はぜひフォロー&チェックしてみてください!
実際の本はこちらから確認できます↓
感想
今回は、本業のマーケティングで必要な統計学の基礎を勉強するために、こちらの本を選びました。
どちらも基礎を扱っているため、本の知識だけでマーケティングができるようになるわけではありません。
ただ、統計学を身近に感じるようになったので、これから応用を扱うにあたり、抵抗なく受け入れられる土台ができたように思います。
最後までお読みいただきありがとうございました!
自己投資残金
8月の残予算:13,674円
今回購入したもの:統計学の本2冊
今回使ったお金:858+1,650円
残りの予算:11,166円
ーーーーーーーーーーーーーーー
筆者は毎月、テーマを決めて月収の1割を自分に投資しブログにまとめています。
8月のテーマは読書です。