ValueError: X has 1561560 features, but MultinomialNB is expecting 88432 features as input. この数値って何で決められるの?88432って

MultinomialNBのインスタンスが期待する特徴量数は、モデルの学習時に使用されたトレーニングデータの特徴量数に基づいています。具体的には、fitメソッドを呼び出した際に、モデルが学習した特徴量数が使用されます。

このエラーが発生しているのは、モデルの学習時に使用された特徴量数と、新しいデータの特徴量数が異なるためです。MultinomialNBのインスタンスが学習した特徴量数が88432であるのに対し、新しいデータには1561560の特徴量が含まれているため、このエラーが発生しています。

この問題の解決策は、新しいデータのベクトル化において、モデルの学習時と同じ特徴量数を使用することです。つまり、新しいデータをベクトル化する際にも、学習時と同じCountVectorizerオブジェクトを使用して変換する必要があります。

未分類

Posted by ぼっち