————————————————————————— ValueError Traceback (most recent call last) Cell In[150], line 45 34 X_combined = hstack([X_product_name_vectorized, 35 X_category_name_vectorized, 36 X_description_vectorized, (…) 41 X_supplier_name_vectorized 42 ]) 44 # ナイーブベイズモデルを使用して予測を行う —> 45 y_predicted_nb = best_model.predict(X_combined) 47 # ランダムフォレストモデルを使用して予測を行う 48 # ナイーブベイズの予測を含む新しい特徴量を作成 49 nb_predictions = best_model.predict(X_combined) File /home/share/temp/venv/lib/python3.8/site-packages/imblearn/pipeline.py:453, in Pipeline.predict(self, X, **params) 451 for _, name, transform in self._iter(with_final=False): 452 Xt = transform.transform(Xt) –> 453 return self.steps[-1][1].predict(Xt, **params) 455 # metadata routing enabled 456 routed_params = process_routing(self, “predict”, **params) File /home/share/temp/venv/lib/python3.8/site-packages/sklearn/naive_bayes.py:101, in _BaseNB.predict(self, X) 87 “”” 88 Perform classification on an array of test vectors X. … 971 ) 973 if ensure_min_features > 0 and array.ndim == 2: 974 n_features = array.shape[1] ValueError: Found array with 0 sample(s) (shape=(0, 560)) while a minimum of 1 is required by MultinomialNB. Output is truncated. View as a scrollable element or open in a text editor. Adjust cell output settings…

このエラーは、モデルに入力される特徴量のサンプル数が0であるために発生しています。これは、特徴量が適切に生成されていないか、または生成された特徴量が空であることを示しています。

特徴量が空である理由を特定するために、特徴量を生成する段階からデバッグすることが重要です。以下のステップを確認してみてください。

  1. データの読み込み後、欠損値を除外する処理が正しく行われているか確認します。
  2. CountVectorizerを使用してテキストデータをベクトル化する際に、適切なデータが渡されているか確認します。
  3. 特徴量の結合(hstack)の前後で、特徴量の形状(shape)を確認し、特徴量が適切に生成されているか確認します。

これらのステップを確認して、特徴量が正しく生成されるように修正してください。特に、特徴量生成の段階で何か問題が発生している可能性があります。

未分類

Posted by ぼっち