戦コンからDSへの転身なるか?

Dev, DS的な勉強と実践の継続の記録

2023-02-01から1ヶ月間の記事一覧

Kaggle / Titanic - Machine Learning from Disaster / 独学 / とりあえず自分でやってみる Day5

環境 Jupyter Lab / Local 今日やったこと Day4で'IsInfant'と特徴量として加えることで上位26.4%に入ったのに気を良くして、'SibSp'と'Parch'を加算した'FamilySize'を生成。Survivedの平均値を算出。 for dataset in combine: dataset['FamilySize'] = dat…

Kaggle / Titanic - Machine Learning from Disaster / 独学 / とりあえず自分でやってみる Day4

環境 Jupyter Lab / Local 今日やったこと 以前に下記の棒グラフを出力して眺めていた時に、 子どもの中でも特に幼児は生存率が極めて高いなと思っていました。'Pclass'が3, すなわち階級が低い層ではそんなことのない「北斗の拳」的世界観でしたが、それ以…

Kaggle / Titanic - Machine Learning from Disaster / 独学 / とりあえず自分でやってみる Day3

環境 Jupyter Lab / Local 今日やったこと Day2で変数間の相関係数を調べたので、'Survived'に相関する変数'Sex', 'TitleId', 'Pclass', 'Fare'の4つについてRandom Forestでモデリングしてみてsubmitして結果を見てみた。 結果、'Sex'と'Pclass'の2変数で0.…

Kaggle / Titanic - Machine Learning from Disaster / 独学 / とりあえず自分でやってみる Day2

環境 Jupyter Lab / Local 今日やったこと 今日はほとんど進めていません、Errorと格闘してたりして… 年齢の欠損値について、性別と階級カテゴリーごとに中央値で補完。 ### 'Age'と'Pclass'と'Sex'との間で相関関係がありそう→’Pclass'x'Sex'のmedian(), me…

Kaggle / Titanic - Machine Learning from Disaster / 独学 / とりあえず自分でやってみる Day1

環境 Jupyter Lab / Local 写経の次に始めたこと 守破離じゃないですが、金メダリストの先生の写経から離れて、独自に精度を上げにいきます。そのために'train.csv'や'test.csv'をexcel先生で可視化して分析することなど、pythonに拘らずにやってみようと思…

Kaggle / Titanic - Machine Learning from Disaster / 写経 / Gold Medalistから学ぶ Day 6(Final)

環境 Jupyter Notebook / Local やったこと 今日で複数の機械学習モデルによるモデリングと評価が終わり、Gold MedalistのMr. MANAV SEHGALによるプロセスを一通りやったことになりました。モデリングと評価の部分についてまとめます。 モデリング(Random Fo…

Kaggle / Titanic - Machine Learning from Disaster / 写経 / Gold Medalistから学ぶ Day4, 5

環境 Jupyter Notebook / Local やったこと Day4は東京から車で早朝に蓼科の山荘に戻ったこともあって疲れていたので日記を残すことができませんでしが、それでも手は動かしてみました。東京出張でリモート会議の合間にカフェで手を動かすことも含めて、やる…

Kaggle / Titanic - Machine Learning from Disaster / 写経 / Gold Medalistから学ぶ Day3

環境 Jupyter Notebook / Local やったこと ミーティングの合間に1時間くらい時間ができたので、こういう時にネットサーフィンするのではなく、ちょっとでも良いから学びに入れれば習慣になるなということで手を動かしてみました。 前回は'Mr.'などの敬称に…

Kaggle / Titanic - Machine Learning from Disaster / 写経 / Gold Medalistから学ぶ Day2

環境 Jupyter Notebook / Local やったこと 'Age', 'Pclass'が'Survived’に相関していそうとか、 'Sex'が'Survived'に相関していそうとか、 'Fare'も相関がありそうで、じゃあ'Embarked’は?とか、 敬称のまとめ方とか英語圏の人じゃないとできんやん!とか …

Kaggle / Titanic - Machine Learning from Disaster / 写経 / Gold Medalistから学ぶ

環境 Jupyter Notebook / Local やったこと 下記の方はTitanicのお題で金メダルをとっており、かつコードを公開しておりコメントも多数ついています。コードとともにAIモデルの構築、評価、予測について、Kaggleのお題をどう処理するのかについて丁寧に解説…

Kaggle / Titanic - Machine Learning from Disaster / 写経 / Submissionの更新

環境 Jupyter Notebook / Local やったこと RandomForestClassifier LightGBM 乗船地、敬称、家族構成で分類してRandomForestClassifier あたりでなんとか10,000人以内に入りましたw 所感 ここまでが今日の限界。 途中Score: 0が続いたのは'Survived'がfloat…

Kaggle / Titanic - Machine Learning from Disaster / 写経 / First Submitまで

環境 Jupyter Notebook / Local やったこと カテゴリカルデータの変換 df_train.replace({'Sex': {'male': 0, 'female': 1}}, inplace=True) df_test.replace({'Sex': {'male': 0, 'female': 1}}, inplace=True) カテゴリカルのドロップ(※文字列の数値化とか…

Kaggle / Titanic - Machine Learning from Disaster / 写経 / 欠損値補完の一部まで

環境 Jupyter Notebook / Local やったこと データの読み込み df_train = pd.read_csv('train.csv') df_test = pd.read_csv('test.csv') df_train.shape, df_test.shape df_train.head() df_test.head() 基本統計量の確認 df_train.describe() df_train.desc…