データ分析

データ分析
PycaretをGoogleColabのGPUで動作させる(Tips)

pycaretでもGPUを使えるようなので、試してみました。 lightGBMは特別なインストールが必要だということです。 Pycaret on Google Colab (T4) まず、GoogleColabのランタイ […]

続きを読む
データ分析
二値分類モデルの評価指標 

二値分類をしたモデルを評価する場合には、そのモデルの目的によって様々な評価指標が用いられます。 評価指標 混同行列 (confusion matrix) 二値分類の学習結果を評価する場合、基本となるのは以下の4つの値です […]

続きを読む
データ分析
BERTモデルを使った分類問題をやってみた(コンペティションでの試行錯誤の備忘録)

SIGNATEのコンペティションで、文章分類にチャレンジしました。結果はあまり良くありませんでしたが、間違っていること、よくなかったことも含めて、残しておきたいと思います。 基本的な処理 GPUの利用 以下の一文で、de […]

続きを読む
データ分析
PyCaret を使ってデータの分類問題をやってみた

データ分析の中で、最も初歩的な分類問題を、PyCaretを使ってやってみました。 データの準備 今回は、Kaggleにあったビギナー用のデータをダウンロードして使っています。 このデータは、 でも使えるようになりますが、 […]

続きを読む
データ分析
KaggleのCompetitonに挑戦してみた

ここ2、3ヶ月の間、自然言語処理とは全く関係ない仕事をしていました。ひと段落ついたところで、データ分析について勉強し直してみようと思い立ち、Kaggleを使ってみることにしました。 Kaggleは全てのデータ分析エンジニ […]

続きを読む