ゴリラからの逃走

意識が高いだけで何もできなかった頃(=ゴリラ)から変わるために日々行なっていることを書いています。

統計検定準1級に合格した(使用した教材まとめ)

これは何?

先日統計検定準1級を受験し合格したので、情報まとめです。

CBT形式になり試験の内容は非公開なため、参考にした書籍を中心にまとめておきます。

2級を受験した際のまとめはこちらです。

aoki-shiraki21.hatenablog.com

前提のスペック

上で貼った2級受験時のスペックに統計検定2級を合格している、という状態が乗っかっています。なので、基本的な推定・検定、単回帰分析の考え方は理解できている状態からのスタートでした。

学習期間

2021年9月〜11月

試験範囲が広いので、平日の仕事前後、土日とガッツリ勉強しました。リモートワークなので、勉強時間を長く取れるのはよかったなと思っています。

学習方針

基本的に書籍を使用するのは前回と変わらず。ですが、今回は範囲が広いので毎回専用の書籍を買いすぎるとキリがないので、「ワークブック」中心の勉強に決めました。 (キーワードだけ載っているみたいなものも多いものの)一応全範囲が網羅されているので、ワークブックをやりつつ、式の不明な点があったら追加の本、資料を探す流れで勉強しました。

使用した書籍

教材にはオススメ度と熟読度を添えています。「準1級合格するために」オススメ、熟読したものを5としています。

基礎数学

  • 数学30講

マセマレベルはだいたい理解していたものの、知識に穴があったり暗記し切れていないものがあったので、こちらで学習しました。

タイトルの通り、「統計学で使用するための」数学にコンセプトを絞っているので、「準1級のためにどこまで数学をやれば良いかわからない」のであれば、とりあえずこの本レベルまで覚えるのが良いんじゃないかと思います。

学部1年レベルの微積線形代数のテキストには書かれていないベクトルの微分も載っているので、範囲としては最低限抑えられます。

オススメ度 5
熟読度 4

マセマは理解していた、と言いつつスラスラ解けるほど覚えていなかったので改めて復習しました。特に固有ベクトルあたりは必須なので、重点的に演習を行っています。

オススメ度 3
熟読度 3

統計全般、数理統計

  • ワークブック

準1級は、とにかくこの本です。異様に広い準1級の全範囲をカバーしてくれています。逆にこれがなかった頃はどうやって勉強したんだ、、?って気持ちになります。

この本を100%理解したらまあ大丈夫なんじゃないかという所ですが、当然広すぎるが故に行間がやたら広いので、他で補足する必要が出てきます。(深層学習とは?を0.5ページで説明するのは流石に厳しいやろ、、みたいなところが結構あります)

勉強期間全体を通してこの本はさわっており、ワークブックをやる→わからん→以下で書く他の本をやる→ワークブックに帰ってくるを繰り返して勉強していました。

オススメ度 5
熟読度 5

数理統計部分のわからないところに辞書的に使っていました。

とはいえ難しく準1級のためだと、まあオーバーワークだと判断し、細かい部分までは理解していません。。1級対策の鉄板本のようなので、むしろ今から本格的にお世話になります。

オススメ度 2
熟読度 1

  • 弱点克服 大学生の確率・統計

じゃあ、数理統計部分を何で補えば良いのか?となった時にこの本が良かったです。

この記事でワークブック以外に推したい本を1つ挙げるとしたらこれかもしれません。

演習問題形式で基本的な分布について、毎回期待値や分散、モーメント母関数などを(くどいくらい)手計算させる本です。抽象的に理解していてもいざ手を動かす時に止まるという場合、どこかで理解が抜けているはずなので、それを炙り出すのに非常に良かったです。

また、この本はアクチュアリー試験対策にも使われることを想定して確率過程、時系列解析の問題も入っています。なかなか演習できる本がないのでその意味でも貴重です。

オススメ度 5
熟読度 4

2級対策だと、各所でボロボロに言われていますが、「準1級の勉強の過程で基本知識をパパッと復習したい」ニーズにはバッチリ答えてくれる本だったなと思います。

特に推定・検定あたりは2級からそんなにレベルが変わらず得点源の想定だったので、よく復習しておきました。

オススメ度 4
熟読度 3

多変量解析

  • はじめての多変量解析

多変量解析の1冊目はこちらを読みました。行列の抽象的な記号ではなく数値で計算しており、式変形も丁寧なので、処理の流れが順を追ってイメージできます。

何周もするタイプのものではないですが、1回読んでおくと主要解析手法のイメージが掴めました。

オススメ度 3
熟読度 1

  • 多変量解析法入門

数式を丁寧に追う基礎的な多変量解析本としてはこちらを読みました。統計学のための数学30講が結構ハマったので、同じ著者の本を選びたかったという理由もあります。

この本は多変量解析を学び始めるときのハードルである線形代数での表現に焦点を当てて、線形代数の説明の章を設けていたり、対象となる式変形は丁寧に書くようにされていたりなど、先の30講と同じくコンセプトがはっきりしている良さを感じます。

MDSや構造方程式なども扱っており、ワークブックでさらっとしか触れられいない分野の勉強にも役立ちました。

オススメ度 4
熟読度 3

機械学習

  • 多変量解析入門

タイトルの通り多変量解析の本ですが、主に機械学習分野のSVMやK means、モデルの評価基準あたりの勉強のために使用しました。

概念説明の後に毎回事例が書かれているのが特徴で、準1級だと過去問的にも処理を計算させるというより解析結果から意味を解釈する方がメインだったので、その辺にも効果がありました。

オススメ度 3
熟読度 3

確率過程、時系列解析

  • 時系列分析と状態空間モデル

普段R書かないですが、読んで良かった本です。「そもそも時系列解析の難しさはどこにあるのか」から入っており、なんで確率過程で差分をとったり時系列で定常性が重要なのかがスッと入ってきました。

状態空間モデルの方はワークブックでも扱いが薄かったので、今回はさらっとしか読んでません。

オススメ度 4
熟読度 2

分散分析

分散分析に関してはこの本が詳しかったです。

この本はテーマがバラバラなので、分散分析以外にもフィッシャー情報量の部分や、ベイズ統計の部分など、該当する部分をつまみ喰いしながら読みました。あったのでこれを使った部分もあるけど、まあ必須ではないかな、という感じでした。

オススメ度 2
熟読度 3

  • 実験計画法

直交表の説明をしている本があまりなく、そこだけピンポイントで抑えたかったので、図書館で借りました。こういうことがしたいのね、ってイメージが掴めれば十分でした。

オススメ度 2
熟読度 1

その他、全般

  • 過去問

今まで直近2年分しかなく、それ以外の過去問を買うには中古(しかも高い)を買うしかなかったんですが、つい最近これまでの過去問を網羅した問題集が発売されました。そのため、当然これを買って11月はこれをこなしていました。

解説は確かに微妙だったりしますが、応用分野は問題演習がしづらいので、過去問はやっぱり貴重です。

オススメ度 4
熟読度 4

  • AIcia Solid Project

ベンチャーでデータサイエンティストをされている方のYouTubeを息抜きがてら見ていました。

息抜きと言っても意外とこれで知識を得たものもあります。バリマックス回転やプロマックス回転、数量化理論、構造方程式など個別の入門書籍には詳細が載っていないトピックはこれで抑えたりしていました。

www.youtube.com

今後

1級に向けて現代数理統計学の基礎を再び勉強し始めています。

次の日程がちょうど1年後のため、中間目標的に年明けから始まるMITの統計の講座を受けようかなと予定しています。このシリーズの確率の講座が結構良かったので。

www.edx.org