データサイエンスの数理的基礎付けとして確率と統計を学ぶことが本書の目的である。本書は高等学校で学ぶ確率のごく初歩と数学リテラシーを前提とするが,必要に応じて補習すれば十分であろう。本書は確率論の基礎から始めて,推測統計の典型的なテーマである母数の推定と検定を扱う。統計処理の処方箋の提示で終わることなく,理論的な仕組みをできるだけ丁寧に記述することで,より深い理解を期待している。
さらに,多変量解析の典型として回帰分析と主成分分析の基本を学ぶ。データを説明するモデルの構築として線形回帰モデルを扱い,構造的な特徴の抽出として主成分というアイデアを紹介する。
|