IT 기술/인공지능

K-means Clustering과 DBSCAN

gooooooood 2024. 12. 10. 15:52
반응형

Ⅰ. K-Means Clustering과 DBSCAN 개념 비교

K-Means DBSCAN
- 중심기반 클러스터링 방법으로 n개의 데이터와 k개의 중심점에 대해 데이터와 중심점 간의 거리 최소화하여 그룹화 - 밀도기반 클러스터링 방법으로 그룹 수 k를 설정하지 않고 자동적으로 최적의 그룹수를 찾아 그룹화하는 방법

 

Ⅱ. K-Means Clustering과 DBSCAN 구성 요소와 장단점

가. K-Means 와 DBSCAN 구성요소

구분   구성 요소 설명
K-Means
그룹 수 K - 초기 설정 값으로 최종 그룹화할 그룹의 수
그룹 Cluster - 데이터들을 K개로 그룹화한 그룹
중심점 Centroid - 각 그룹의 중심점으로 데이터 나누는 기준
DBSCAN
minPts - 반경 내 최소 개체 수
eps(epsilon) - 데이터를 군집화 할 반경
Core - 군집화 그룹의 중심점
Border - minPts 만족하지 않지만 Core에 속한 경계점
Noise 어느 군집에도속하지 않는 데이터

 

나. K-

Means와 DBSCAN 장단점

구분 장점 단점
K-Means - 구현이 간단하고 이해하기 쉬움
- 계산 속도가 대체로 빠름
- K 값 사전에 지정 필요
- 클러스터 크기가 다를 경우 부정확
DBSCAN - 클러스터 개수 미리 지정 불필요
- 클러스터 형태 불규칙해도 동작
- 데이터으 밀도 차이가 클 경우 esp 값을 설정하기 어려움

 

Ⅲ. 계층적 군집 분석

- 데이터를 가까운 집단부터 순차적이며 계층적으로 군집화하는 방법으로 트리구조를 활용

 

반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

에이전틱 AI (Agentic AI)  (0) 2024.12.10
MLOps  (0) 2024.12.10
멀티모달 인공지능  (0) 2024.12.09
온디바이스 AI  (2) 2024.12.09
인공지능 윤리 기준(과학기술정보통신부 2020.12.23)  (1) 2024.12.09