Kaggle / Titanic - Machine Learning from Disaster / 写経 / Gold Medalistから学ぶ Day2
環境
Jupyter Notebook / Local
やったこと
'Age', 'Pclass'が'Survived’に相関していそうとか、
'Sex'が'Survived'に相関していそうとか、
'Fare'も相関がありそうで、じゃあ'Embarked’は?とか、
敬称のまとめ方とか英語圏の人じゃないとできんやん!とか💦 黙々とやってます。
所感
英語が読解できていないのかもしれませんが、納得できない解説もあり、ちょっと混乱しながら進めています。
また、'Title’で肩書をくくってみて生存率との相関を見ても、これって結局’Sex'と’Age’の相関が色濃く出ているのではないか、このまま学習用の特徴量としてしまうと、多重共線性にハマるのでは?とか考えたりしながらやってます。
航海は続く…。