반응형

2024/10/02 5

데이터 메시

Ⅰ. 데이터 메시의 개요가. 데이터 메시의 정의 및 필요성정의: 데이터 파이프라인을 활용하여 여러 도메인의 데이터를 탈중앙화하여 관리하는 데이터 아키텍처 나. 데이터 메시의 4원칙원칙설명도메인 지향 분산 데이터 소유권 및 아키텍처(Domain Ownership)- 데이터 생성과 확장, 사용자 증가, 데이터 접근 정책의 다양성에 대응제품으로서의 데이터(Data as a Product)- 데이터를 쉽게 검색하고 품질이 보장된 데이터를 사용하여 생산성 향상셀프 서비스 데이터 인프라 플랫폼(Self-serve data platform)- 도메인별 자율적 제품 개발 구축, 실행 및 운영연합 컴퓨팅 거버넌스(Federated computational governance)- 데이터 사용자가 상호 운용을 위한 표준을 ..

IT 기술/DB 2024.10.02

데이터 품질 관리

Ⅰ. 데이터 품질관리 정의 및아키텍처가. 데이터 품질관리 정의- 기관이나 조직 내외부의 정보시스템 및 DB 사용자의 기대 만족을 위해 지속적으로 데이터를 관리하는 활동 나. 데이터 품질관리 아키텍처구성요소특징 및 설명데이터- 기업의 목적 달성을 위해 사용되는 전산화된 데이터데이터 구조- 데이터가 저장되는 틀- 데이터 취급하는 관점에 따라 구조 변경- 사용자 뷰, 모델, 데이터베이스 파일 형태데이터 관리 프로세스- 데이터 및 데이터 구조의 품질을 유지 및 개선하기 위한 활동- 데이터 품질 관리 체계적 접근을 위해 성숙도 모델 활용 Ⅱ. 데이터 품질관리 성숙도 모델가. 데이터 품질관리 성숙도 모델 구성요소구성요소설명데이터 품질 기준- 데이터 품질에 대한 정의품질관리 프로세스- 데이터 품질기준을 향상시키기 위..

IT 기술/DB 2024.10.02

데이터베이스 샤딩

Ⅰ. 대용량 처리를 위한 데이터베이스 파티셔닝, Sharding의 개요정의물리적으로 다른 데이터베이스에 Shard 파티션 생성하여 데이터를 분할하여 저장 관리특징성능 개선큰 데이터를 분산 저장하여 개별 테이블은 각 샤드에서 더 빠른 작업 지원신뢰성 개선한 샤드가 실패하더라도 다른 샤드가 데이터 서비스 제공위치 추상화애플리케이션 서버에서 데이터가 어떤 데이터베이스에 위치한지 알 필요 없음 Ⅱ. 샤딩 데이터베이스 분할 방법 및 가이드라인가. 샤딩 데이터베이스 분할 방법방법설명특징Modular ShardingPK를 모듈러 연산한 결과로 DB를 라우팅하는 방식- 데이터가 균일하게 분산- DB 추가 증설시 기존 데이터 재정렬Range ShardingPK의 범위를 기준으로 DB를 특정하는 방식- 증실시 재정렬 비용..

IT 기술/DB 2024.10.02

데이터 클렌징(Cleansing), 프로파일링(Profiling)

Ⅰ. 데이터 품질 확보, 데이터 클렌징가. 데이터 클렌징의 정의 및 프로세스정의데이터베이스, 테이블, 레코드에서 손상된 정보를 식별하여 교체, 삭제 또는 수정하는 프로세스프로세스1. 데이터베이스 대상 정의클렌징 대상 데이터베이스 범위 정의2. Dirty Data 원인 파악데이터 결측치 및 이상치 식별3. 데이터 품질 문제 우선순위클렌징 우선순위 결정4. Bad Data의 데이터베이스 유입 차단이상 데이터 입력 원인 식별 후 새로운 규칙 생성5. 데이터베이스에서 Bad Data 제거데이터베이스 내부 결측치 및 이상치 제거 나. 데이터 클렌징 기법기법설명데이터변환코드체계 변환다양항 현태의 코드 값을 단일 형태로 변환형식 재구성다양한 형식의 데이터 값을 단일 형식으로 전환수학적 변환다양항 형식의 단위 값을 단..

IT 기술/DB 2024.10.02

분산 데이터베이스 투명성

Ⅰ. 다중 DBMS 통합 관리 시스템, 분산 데이터베이스정의물리적으로 분산된 여러 지역 DBMS를 하나의 논리적인 데이터베이스로 관리하는 데이터베이스 관리 시스템 Ⅱ. 분산 데이터베이스의 투명성(Transparency)특성설명특징분할 투명성하나의 논리적 관계가 분할되어 여러 사이트에 저장- Bottle neck 방지- 시스템 성능 향상- 설계 복잡위치 투명성데이터 저장 위치 명시 불필요, System Catalog에 유지- 어플리케이션 단순화- 이중처리로 속도 저하지역사상 투명성지역  DBMS와 물리적 DB 매핑 보장- 지역 자치성 향상- 점진적 시스템 용량 확장중복 투명성DB 객체가 여러 사이트에 중복 저장에 대해 알 필요 없음- 시스템 구현 복잡장애 투명성장애에 무관한 트랜잭션의 원자성 유지- 장애처..

IT 기술/DB 2024.10.02
반응형