サンプルコードかいてPythonde
以下は、PythonでK-meansクラスタリングを用いて顧客セグメンテーションを行うためのサンプルコードです。この例では、顧客の年齢と年間支出をもとにクラスタリングを行います。
python
import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn.preprocessing import StandardScaler # データの読み込み data = pd.read_csv('customer_data.csv') # 顧客データが含まれたCSVファイルを読み込みます # データの前処理 X = data[['Age', 'Annual Income']] # 年齢と年間支出を特徴量として使用します scaler = StandardScaler() # データを標準化します X_scaled = scaler.fit_transform(X) # K-meansクラスタリングの適用 kmeans = KMeans(n_clusters=3, random_state=42) # クラスタ数を3に設定します kmeans.fit(X_scaled) data['Cluster'] = kmeans.labels_ # クラスタリング結果をデータに追加します # クラスタごとにデータを可視化 plt.figure(figsize=(10, 6)) for cluster in data['Cluster'].unique(): cluster_data = data[data['Cluster'] == cluster] plt.scatter(cluster_data['Age'], cluster_data['Annual Income'], label=f'Cluster {cluster}') plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=300, c='red', label='Centroids') plt.title('Customer Segmentation using K-means Clustering') plt.xlabel('Age') plt.ylabel('Annual Income') plt.legend() plt.show()
このコードでは、customer_data.csv という名前のCSVファイルから顧客データを読み込みます。このファイルには、顧客の年齢と年間支出が含まれていると仮定しています。データを標準化した後、K-meansクラスタリングを実行し、結果を可視化します。データとクラスタのセントロイド(中心点)が散布図上に表示されます。

ディスカッション
コメント一覧
まだ、コメントがありません