この記事は統計検定2級を目指そうと思った日(2021年6月30日)に記事入れを始めました。
まだいつ受験するかも決めていませんし、その前にそもそも統計の勉強をしたことがありません(笑)
いつ受験するのか、いつ合格するのか、どのような勉強をしていくのかをリアルな感じで書いていきたいと思ってます。
そもそもなぜ統計検定2級を目指そうとしているのか
さすがに意味なく目指そうと思ったわけではないです。
AI資格である「E資格」を取りたくて、受験内容を調べていたとき試験範囲の中に「応用数学(線形代数、確率・統計、情報理論)」というものがありました。
よくデータサイエンティストは統計学を理解してないと厳しいということが言われていますね。
ボクのサイトでもディープラーニングの記事を投稿していますが、現時点取り扱っているメインは画像系を中心にしています。画像系では統計学的な知識はあまりいりませんが、画像系以外にも手をつけるつもりなので、いづれ統計学は必要になるだろうとは思ってました。
で、今回。
本腰を入れて、E資格を目指そうと思ったのでいろいろ調べていたときに「統計検定2級をベースに近しい問題が出題される」との情報を得て、それならまずは統計検定2級を取得した上で、E資格にチャレンジしようと思った、というのが統計検定2級を目指した理由です。
ボクのスペック
簡単にボクのスペックを書き記しておきます。
・一応理系出身だけど、あまり真面目に取り組まず(人並)、試験もなんとなくこなし、卒業。
・(凄い人を尊敬しつつも)同じ人間なんだから、ボクにもできるでしょ。と思ってるタイプの人間。
2021年6月30日
まずは初学者が統計検定2級を合格するまでに何時間くらいの勉強が必要なのかを調べました。
初学者が統計検定2級に合格するための勉強時間(調査結果)
前提は「初学者」です。
サイト | 学習時間 |
Aサイト | 100時間 |
Bサイト | 80時間 |
Cサイト | 150時間 |
Dサイト | 120時間 |
Eサイト | 70時間 |
Fサイト | 160時間 |
平均 | 113時間 |
人によってバラバラですけど、平均で113時間ですね。
平日:1時間、休日(土日):3時間のペースで勉強するのであれば2.5ヶ月くらいかかる計算です。
7月から勉強するとして、早くて9月~10月頃の受験・合格を目指すのが妥当でしょうか。
ん~、ディープラーニングの勉強も引き続きするので、ペースはもっと落ちるかも。
で、合格率は?
実施年 | 受験者数 | 合格者数 | 合格率 |
2016年 | 3,554人 | 1,574人 | 44.3% |
2017年 | 3,084人 | 1,349人 | 43.7% |
2018年 | 3,428人 | 1,461人 | 42.6% |
2019年 | 4,307人 | 1,871人 | 43.4% |
なるほど、毎年40%ちょいという感じですね。
学習方法は?
学習方法を間違えると挫折の原因になったり、資格取得したあとに忘れてしまったりと勉強時間がムダになるので慎重に調べました。
で、初学者の場合、多くの人達に「3つの共通点」がありました。
『完全独習 統計学入門』小島 寛之
「使うのは中学数学だけ!」とのうたい文句で売り出しており、Amazon評価は4.2/5と高評価。
何よりも初学者の合格サイトのほとんどで「この本を初めに読んでおいて良かった」と絶賛しています。
試験では微分・積分・シグマ・確率と難しい言葉と対峙しなければならないが、この本では一切難しい言葉を使わず、丁寧に解説されている良書とのこと。(執筆中なのでまだボクは読んでません)
統計検定2級取るぞ!といき込んだ最初は過去問とかで微分・積分・シグマ・確率が出てきても、調べながらできそうですが、時間が経つにつれ、理解した感覚もなく「あれ、、いけるんか?これ。。」となりそうなのを、最初にこの本を読んで基本を理解すれば、確かにいいかも、と思いました。
統計WEB
これも初学者の合格サイトのほとんどの方が取り組まれているようです。
初級編の書き出し「ここはとても頭の良い猫たちが暮らす島。たくさんの猫たちが幸せに暮らしています。」
わぉ。優しい感じが滲みでてますね。
もちろん無料なので、やらない理由はありませんね。
過去問
これは必須ですね。日本統計学会公式認定が出版している過去問です。
まずはこの3つを試してみようと思う
これだけで足りるのか・・・?もっと他にいい方法があるんじゃないか・・・?
と思いがちですが、そもそも統計学を学んだことがない素人(ボク)が調べて良し悪しが判断できるわけない。
四の五の言わず、調べてる時間あったら、勉強しよーぜ、の精神でまずは、『完全独習 統計学入門』を早速購入しました!(笑)
『完全独習 統計学入門』読んでみたよ
本書の対象者
本を読み始めた最初にだいたい「本書の対象者」みたいなことが書いてあるのですが、笑えました。
・統計学を初めて学ぶ人
・統計学を改めて学び直したいという人
・何度も挫折して、いまだ身についてない人
・今まさに落ちこぼれつつある人
いや、4つ目、責め過ぎ(笑
本書は2部構成
統計学では「検定」と「区間推定」というのが最重要テーマらしいです。それを最短で理解するのが第1部。
で、第2部は「t分布を使った小標本の検定・区間推定に最も効率的にたどり着く」ことを目的としています。
まず、この2行で述べたことが「ピンとこない」キーワードであれば、本書を購入する価値はありそうです。
機械学習と似ている
ボクはディープラーニングという側面からアプローチを開始し、いま、統計学という入り口に立っていますが、機械学習を学び始めた頃「機械学習と統計学の違い」にアプローチする文献が多かったことを思い出しました。
ディープラーニングは「データという事実から特徴を抽出すること」、そして、訓練したモデルをつかって新たにインプットされた情報がなんであるかを「予測」することをしています。
本書を読み始めた最初にも「記述統計」と「推測統計」がまさに統計学であるということが述べられています。
記述統計と推測統計が何であるかは本書を通して学んでほしいと思いますが、本質的な部分は一緒なんだということを体感することができました。
読み終えてみて
読み終えるまでの日数
読み終えるまでに12日かかりました。
読み始める前は2,3日で読み終えるつもりで取り組みましたが、結果的に12日もかかってしまいました。。
特に読まなかった日がなかったわけではないのですが、理由は後述します。
読んでみてどうだったか?
読んで良かったです。
・統計において大切なポイントが明確になる。
コメント