
K-means 클러스터링에 대해 알아보고, Mall_Customers 데이터를 활용하여 군집화와 군집 평가를 실습해본다. K-means 클러스터링 데이터를 k개의 클러스터로 묶는 비지도학습의 일종으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작하는 알고리즘이다. 레이블이 달려 있지 않은 입력 데이터에 레이블을 추가하는 역할을 수행할 수 있다. Objective function$$ J = \sum_{j=1}^{k}\sum_{i=1}^{n}{\left\|x_{i}^{(j)}-c_{j}\right\|}^2$$$k$ : number of clusters$n$ : number of cases$x_{i}$ : case $i$$c_{j}$ : centroid for cluster $j$ 장점알고..
B.D.A
2024. 6. 4. 22:26
공지사항
최근에 올라온 글
- Total
- Today
- Yesterday