IT 기술/DB

데이터 카탈로그

gooooooood 2025. 4. 9. 16:46
반응형

1. 데이터 자산의 설명서 제공, 데이터 카탈로그의 정의

- 조직 내 다양한 데이터를 이해하고 탐색할 수 있도록 메타데이터를 중앙에서 수집, 정리, 관리, 검색 가능하게 만든 정보 저장소

필요성) 데이터 활용 증가, 거버넌스, 분석 생산성 향상

 

 

2. 데이터 카탈로그 구성도 및 주요 기능

가. 데이터 카탈로그 구성도

 

나. 데이터 카탈로그 주요 기능

구성 요소 주요 기능 설명
메타데이터 저장소 - 메타 크롤러
- 리니지 크롤러
- 샘플 크롤러
데이터 메타 정보, 히스토리 정보, 샘플 데이터 수집
데이터 계보 - 데이터 흐름 시각화 테이블 및 스키마 변경 이력 관리
데이터 분류 및 태깅 - 자동 분류 및 사용자 태그 데이터 특성 식별, 접근 제어 제공
API 및 연동 - 외부 시스템과 통합 외부 BI/ETL(extract, transform, load)
도구 연동

 

3. 데이터 카탈로그 문제점 및 해결 방안

- 초기 메타 데이터 수집 비용
- 사용자 교육/활용
- 시스템 호환 및 표준화
- 메타데이터 자동 수집 툴
- 사용자 중심 UX/UI 제공
- AI 기반 연계, 편의 향상
- AWS Data Catalog
- Azure Purview
- Google Data Catalog
문제점 해결 방안 대표 솔루션

 

반응형

'IT 기술 > DB' 카테고리의 다른 글

데이터 옵스(DataOps)  (0) 2025.04.09
정규화와 역정규화  (0) 2025.04.09
RBO(Rule Based Optimizer)와 CBO(Cost Based Optimizer) 비교  (0) 2025.04.09
NoSQL 유형과 모델링 절차  (0) 2025.04.09
DQ 인증(데이터 품질 인증)  (0) 2025.04.09