GoogleColab上でKaggleを実行する

具体的には、GoogleColab上でKaggleのTitanicデータ取得し、コードを実行する環境を作ること。Kaggke上では人が作ったプログラムをForkして実行することができるが、オリジナルのコードをスクラッチで構築検討することは難しい。また、ローカルPCではCPUだけでは処理出来ず停止してしまうこともある。GoogleColabは、無料でGPUを使うことができる。以下の手順で進める。

  • KaggleのAPIを作成する。すなわち、Kaggle My Account -> APIの項目の"Create New API Token"をクリックします。
  • kaggle.jsonというファイルをダウンロードする。これをGoogleColab上で新規に開いたノートのファイル置き場にアップロードする。
  • Google Colabに以下のコードを記述し、実行する
import google.colab
import googleapiclient.discovery
import googleapiclient.http

google.colab.auth.authenticate_user()
drive_service = googleapiclient.discovery.build('drive','v3')

from google.colab import files
!more kaggle.json

!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!pip install kaggle
!chmod 600 /root/.kaggle/kaggle.json

!kaggle competitions download -c titanic

!mkdir input
!mv train.csv input
!mv test.csv input