今日も窓辺でプログラム

外資系企業勤めのエンジニアが勉強した内容をまとめておくブログ

scikit-learn

SimpleImputerで欠損値を補完する

この記事について Scikit-learnのSimpleImputerクラスを使用すると、データセットの欠損値を簡単に補完することができます。Kaggleの練習用Competitionでも使われているタイタニックのデータセットを例に、SimpleImputerをどのように使うか見ていきたいと思…

scikit-learnのtrain_test_splitで訓練データとテストデータを分割する

はじめに scikit-learnのtrain_test_splitという関数を使うと、データセットを訓練データをテストデータに簡単に分割できます。 同じくscikit-learnに付属している数字手書き文字のデータセットを使用した例を紹介します。