Udemy講座 「PyMC で学ぶ ベイズ統計モデリング【基礎編】」 の紹介
こちらは PyMC という python のパッケージを使って、ベイズ統計モデリングを学ぶ講座です。
一般的にベイズ統計モデリングを学ぶ際にお勧めなのは、やはり R や Stan を使った下のような教科書が標準的かつお勧めなのではないかと思うのですが
Python ユーザがもっと気軽に学べるものはできないだろうか…ということで、今回こちらの講座を作らせて頂きました。
ちなみに、PyMC でベイズ統計モデリングを学ぶ教科書としては、ずばり下のような教科書もありまして、書籍としてはこちらも非常にお勧めです。
講座の概要
大雑把に言うと、いわゆる「緑本」の簡単な部分を PyMC で焼き直したような内容になっています。
ただ、「緑本」の方はちゃんと階層モデルまで解説していますが、私の講座の方ではそこまでは深くやっていません。線形回帰から始めて、GLM や GLMM くらいのところで終わっています。モデル選択の話も WAIC のみで押しているので、比較的軽く、シンプルな内容になっているのではないかと思います。
逆に「予測を分布で行うことの意味」みたいな部分を冒頭で少し時間をかけて説明しています。「意思決定をする際に予測をどう活かすか」みたいな話なのですが、この部分は聞かなくても本編の方は理解できるようになっていますので飛ばして頂くことも可能です。
こちらの講座では、基本的には PyMC を使ってさまざまな統計モデルを実装していくことができるようになることを目標にしていますが、それ以外にも次のような事柄を理解することを特に重要視しています。
■ データサイエンスにおける予測分布の重要性
■ 期待値による意思決定の考え方
■ 事後予測チェックの方法
■ 情報量基準(WAIC)の基本的理解
■ MCMC(HMC)の基本的な動作
■ GLM における「オフセット項」の理解
■ GLMM における「ランダム効果」の理解
なお、情報量基準(WAIC)の部分については、オマケ程度のかなりざっくりした説明しかしていません。講座の方では単に便利な道具としてだけ使っています。
注意点
こちらの講座は「統計」を学ぶ講座というよりは、どちらかと言うと「コード」の側にウェイトを置いた内容になっています。概念的な部分の説明もさせて頂いていますが、こうした部分は基本的にはオマケ的なものと考えて下さい(私自身は統計の専門家ではありませんので、多少力不足の部分もあるかと思います)。大雑把な話ではなく、本格的な統計分析を勉強されたい方はこちらの講座ではなく、しっかりした統計学の教科書にあたってみることをお勧めします。
講座へのリンク
https://www.udemy.com/course/pymc3-basic/?referralCode=02D5D79859C11766DEE8