stopwordsを無視したい
CountVectorizerを使用する際に、stop_wordsパラメータをNoneに設定することで、ストップワードを無視するようにできます。以下はその方法です:
python
from sklearn.feature_extraction.text import CountVectorizer # CountVectorizerのインスタンスを作成し、stop_wordsをNoneに設定 vectorizer = CountVectorizer(stop_words=None) # CountVectorizerを使用してテキストデータをベクトル化 X_category_name_vectorized = vectorizer.fit_transform(X_category_name)
このようにすることで、CountVectorizerはデフォルトで提供されるストップワードを無視し、全ての単語を含めてベクトル化します。

ディスカッション
コメント一覧
まだ、コメントがありません