반응형
Ⅰ. K-Means Clustering과 DBSCAN 개념 비교
K-Means | DBSCAN |
- 중심기반 클러스터링 방법으로 n개의 데이터와 k개의 중심점에 대해 데이터와 중심점 간의 거리 최소화하여 그룹화 | - 밀도기반 클러스터링 방법으로 그룹 수 k를 설정하지 않고 자동적으로 최적의 그룹수를 찾아 그룹화하는 방법 |
Ⅱ. K-Means Clustering과 DBSCAN 구성 요소와 장단점
가. K-Means 와 DBSCAN 구성요소
구분 | 구성 요소 | 설명 | |
K-Means | 그룹 수 K | - 초기 설정 값으로 최종 그룹화할 그룹의 수 | |
그룹 Cluster | - 데이터들을 K개로 그룹화한 그룹 | ||
중심점 Centroid | - 각 그룹의 중심점으로 데이터 나누는 기준 | ||
DBSCAN | minPts | - 반경 내 최소 개체 수 | |
eps(epsilon) | - 데이터를 군집화 할 반경 | ||
Core | - 군집화 그룹의 중심점 | ||
Border | - minPts 만족하지 않지만 Core에 속한 경계점 | ||
Noise | 어느 군집에도속하지 않는 데이터 |
나. K-
Means와 DBSCAN 장단점
구분 | 장점 | 단점 |
K-Means | - 구현이 간단하고 이해하기 쉬움 - 계산 속도가 대체로 빠름 |
- K 값 사전에 지정 필요 - 클러스터 크기가 다를 경우 부정확 |
DBSCAN | - 클러스터 개수 미리 지정 불필요 - 클러스터 형태 불규칙해도 동작 |
- 데이터으 밀도 차이가 클 경우 esp 값을 설정하기 어려움 |
Ⅲ. 계층적 군집 분석
- 데이터를 가까운 집단부터 순차적이며 계층적으로 군집화하는 방법으로 트리구조를 활용
반응형
'IT 기술 > 인공지능' 카테고리의 다른 글
에이전틱 AI (Agentic AI) (0) | 2024.12.10 |
---|---|
MLOps (0) | 2024.12.10 |
멀티모달 인공지능 (0) | 2024.12.09 |
온디바이스 AI (2) | 2024.12.09 |
인공지능 윤리 기준(과학기술정보통신부 2020.12.23) (1) | 2024.12.09 |