サンプルコードかいてPythonde

2024年6月8日

以下は、PythonでK-meansクラスタリングを用いて顧客セグメンテーションを行うためのサンプルコードです。この例では、顧客の年齢と年間支出をもとにクラスタリングを行います。

python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler

# データの読み込み
data = pd.read_csv('customer_data.csv')  # 顧客データが含まれたCSVファイルを読み込みます

# データの前処理
X = data[['Age', 'Annual Income']]  # 年齢と年間支出を特徴量として使用します
scaler = StandardScaler()  # データを標準化します
X_scaled = scaler.fit_transform(X)

# K-meansクラスタリングの適用
kmeans = KMeans(n_clusters=3, random_state=42)  # クラスタ数を3に設定します
kmeans.fit(X_scaled)
data['Cluster'] = kmeans.labels_  # クラスタリング結果をデータに追加します

# クラスタごとにデータを可視化
plt.figure(figsize=(10, 6))
for cluster in data['Cluster'].unique():
    cluster_data = data[data['Cluster'] == cluster]
    plt.scatter(cluster_data['Age'], cluster_data['Annual Income'], label=f'Cluster {cluster}')
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=300, c='red', label='Centroids')
plt.title('Customer Segmentation using K-means Clustering')
plt.xlabel('Age')
plt.ylabel('Annual Income')
plt.legend()
plt.show()

このコードでは、customer_data.csv という名前のCSVファイルから顧客データを読み込みます。このファイルには、顧客の年齢と年間支出が含まれていると仮定しています。データを標準化した後、K-meansクラスタリングを実行し、結果を可視化します。データとクラスタのセントロイド（中心点）が散布図上に表示されます。

未分類

Posted by ぼっち

クラスタリング結果は、どのように出力されるの？

統計をつかって通販に活かしたい

コメント一覧

まだ、コメントがありません