東京大学のデータサイエンス講義が一冊の本にまとまっています。
この本は2017年と2018年に東京大学で実施された「グローバル消費インテリジェンス寄付講座」の学生向けオフライン講義と、社会人向けオンライン講座で使われた教材がベースになっています。
データサイエンスの基本的な部分から始まり、後半では実際の機械学習にも触れながら、データサイエンスの全体像をまとめて学習することができる良著です。
具体的には下記のような内容について書かれています。
・Python/Numpy/Scipy/Pandas/Matplotlibの基礎
・確率/統計/推定/回帰の基礎
・Numpy/Scipyによる科学計算
・Pandasを使ったデータ加工処理(欠損データ/異常値の取り扱い、時系列データの取り扱い)
・Matplotlibによるデータ可視化
・機械学習(重回帰、ロジスティック回帰、決定木、k-NN、クラスタリング、主成分分析、マーケットバスケット分析、モデルチューニング)
これ一冊で、基本的な部分はマスターできるでしょう。
データサイエンスの基礎を、しっかりと学んでみませんか?
コメント