Kaggle / Titanic - Machine Learning from Disaster / 写経 / Gold Medalistから学ぶ
環境
Jupyter Notebook / Local
やったこと
下記の方はTitanicのお題で金メダルをとっており、かつコードを公開しておりコメントも多数ついています。コードとともにAIモデルの構築、評価、予測について、Kaggleのお題をどう処理するのかについて丁寧に解説してくれています。彼の解説を読みながら写経して、Jupyter Notebook内で挙動を確認しながらデータサイエンスのワークフローをステップ・バイ・ステップで学んでいきます。
MANAV SEHGAL www.kaggle.com
所感
今日のところは最初から'Assumtions based on data analysis'まで。
ライブラリのimportに始まり、課題の読み解き、問題の把握、データの読み込み、解析、考察、そしてどの特徴量がSurvivedに繋がるのかについての仮説出し、と言ったところでした。
とても丁寧に解説されているので読みながら頭と手を動かすことで身についていることが実感できます。サイエンスですから闇雲に手を動かすのではなくて、見立てが大事なんだなと。当たり前ですが。