stopwordsを無視したい

2024年6月8日

CountVectorizerを使用する際に、stop_wordsパラメータをNoneに設定することで、ストップワードを無視するようにできます。以下はその方法です：

python
from sklearn.feature_extraction.text import CountVectorizer

# CountVectorizerのインスタンスを作成し、stop_wordsをNoneに設定
vectorizer = CountVectorizer(stop_words=None)

# CountVectorizerを使用してテキストデータをベクトル化
X_category_name_vectorized = vectorizer.fit_transform(X_category_name)

このようにすることで、CountVectorizerはデフォルトで提供されるストップワードを無視し、全ての単語を含めてベクトル化します。

未分類

Posted by ぼっち

このモデルを保存して、本番の予測につかったらいい？

stopwordsの設定をしたい

コメント一覧

まだ、コメントがありません