スパース推定は,サンプルに対して変数の方が圧倒的に多い場合の統計学である。たとえば,症例対照100名のサンプルがあって,1万の遺伝子の蛋白質生成量からどの遺伝子がその病気の原因になっているのかなどの問題解決に役立つ。また,機械学習の諸問題にも適用されている。 スパース推定に関して,数学的に検討してアルゴリズムを導くことや,パッケージにデータを入れて動作を観察することは他書でもやっている。本書の特徴は,理論から実際にシンプルなプログラムを構築して動作を確認するなど,思考を止めないで,全体を検証している点にある。そうすることで,見えない本質が見えてくるばかりか,理論的に考えたことが正当化される。 また,スパース推定を凸最適化問題として扱っている点が,本書の新しい視点である。つまり,統計学が運転手で,凸最適化がエンジンであることが強調されている。さらに,エッセンスが簡潔に書かれていること,self-containedであることも,本書のメリットである。 本書は,2018年度前期に大阪大学で大学院生を対象に行われた講義で出された128問の演習問題および,同年11月に日本行動計量学会のセミナーで用いた60問の問題がベースになっていて,その後の阪大のセミナーなどで改良を重ねて得られた100問を提示している。 なお,読者ページから著者に質問できるので,困ったときには著者からフィードバックを得られる。そして,本書のプログラムはすべてダウンロード可能で,解説動画も閲覧できる。 本書を読むことで,データサイエンスや機械学習に関する知識が得られることはもちろんだが,脳裏に数学的ロジックを構築し,プログラムを構成して具体的に検証していくという,データサイエンス業界で活躍するための資質が得られる。「数理」「情報」「データ」といった人工知能時代を勝ち抜くために必須のスキルを身につけるための,うってつけの書籍である。
|