반응형

2024/12/04 12

빅데이터 통합 관리

Ⅰ. 데이터 거버넌스의 개념 및 주요 기능가. 데이터 거버넌스의 개념- 조직의 데이터 관리에 있어 데이터 보안, 개인정보 보호, 정확성, 가용성, 사용성 등을 보장하기 위해 수행하는 관리 프로세스 나. 데이터 거버넌스의 주요 기능기능설명데이터 품질 관리(DQM)- 데이터 프로파일링 및 데이터 정제와 같은 작업을 포함하여 데이터 사용 방법에 따라 실행메타 데이터 관리- 데이터 검색 중 데이터 찾기, 분석 도구에 의한 빅데이터 분석에 사용할 수 있도록 관리데이터 주기 관리- 데이터 생성 및 초기 저장부터 데이터 폐기까지 시스템의 데이터 흐름 관리데이터 보안 및 프라이버시- 데이터 요구 사항 및 정책에 따라 필요한 데이터 보호 수준 정의 및 관리  Ⅱ. 마스터 데이터의 개념과 필요성가. 마스터 데이터의 개념-..

IT 기술/DB 2024.12.04

대용량 데이터베이스의 인덱스

Ⅰ. 검색 연산을 최적화 하기 위한 인덱스의 개요가. 인덱스의 정의정의- 데이터베이스에 저장된 자료를 빠르게 조회하기 위해 테이블에 연관되어 독립적인 저장공간 보유 객체 나. 인덱스의 특징특징설명성능향상- 트랜잭션의 성능향상이 목적- 조회 성능 향상이 주 목적알고리즘- 트리 구조, 해시 함수 등 알고리즘 적용독립성- 테이블에 저장구조와 별도로 인덱스만 저장 가능Trade-Off- 조회와 나머지 성능을 고려하여 인덱스 생성  Ⅱ. 인덱스의 스캔 방식스캔 종류개념도설명인덱스전체 스캔- 인덱스의 모든 데이터 전체를 읽어오는 방법- WHERE인덱스범위 스캔- 인덱스의 일부 데이터의 범위를 지정하여 읽어오는 방법- WHERE, JOIN인덱스고유 스캔- 인덱스의 유일한 값을 검색하는 방법- PRIMARY KEY, ..

IT 기술/DB 2024.12.04

데이터 독립성

Ⅰ. DBMS의 궁극적인 목표, 데이터 독립성의 개요가. 데이터 독립성의 정의- 데이터베이스의 물리적 구조나 데이터의 저장 방식에 변화가 생겨도 응용 프로그램이나 사용자에게 영향을 주지 않는 능력 나. 데이터 독립성의 종류종류설명관련 사상논리적 데이터 독립성- 데이터베이스의 논리적 구조를 변경시키더라도 기존 응용 프로그램에 영향을 주지 않는 것논리적 구조 사상물리적 데이터 독립성- 응용 프로그램이나 데이터베이스의 논리적 구조에 영향을 주지 않고 물리적 구조를 변경시킬 수 있는 것물리적 구조 사상 Ⅱ. 데이터 독립성 보장을 위한 3단계 데이터베이스 구조 및 스키마 설명가. 3단계 데이터베이스 구조의 개념도외부 단계- 사용자가 데이터베이스를 어떻게 보는지를 표현하는 단계개념 단계- DBMS나 관리자가 전체 ..

IT 기술/DB 2024.12.04

분산 데이터베이스의 투명성

Ⅰ. 빅데이터 효율적 관리, 분산 데이터베이스의 정의- 논리적으로는 하나의 시스템에 속하지만 물리적으로 여러개의 사이트에 분산되어 있는 데이터베이스 Ⅱ. 분산 데이터베이스의 투명성투명성개념특징위치 투명성- 사용자나 응용프로그램이 접근할 데이터의 물리적 위치를 알 필요가 없는 성질- Distributed Data Dictionary Directory 활용복제 투명성- 사용자가 응용프로그램이 접근할 데이터가 물리적으로 여러 곳에 복제되어 있는지 여부를 알 필요 없는 성질- 상향식 점진적 확장- 시스템 구현 복잡병행 투명성- 여러 사용자나 응용프로그램이 동시에 분산 데이터베이스에 대한 트랜잭션을 수행하는 경우에도 결과에 이상이 발생하지 않는 성질- Locking- Time Stamp분할 투명성- 사용자가 하나..

IT 기술/DB 2024.12.04

데이터옵스 (DataOps)

Ⅰ. 새로운 데이터 접근 방식, 데이터옵스의 개요가. 데이터 옵스의 개념- 데이터를 분석해 애플리케이션을 형성한 후 최종 사용자에게 신뢰할 수 있는 데이터를 제공하기 위한 데이터 운영 관리 방식 나. 데이터 옵스의 등장배경IT 부서 의존적- 데이터 전담조직에서 IT부서 협조 없이 데이터 확보 및 가공이 어려움권한 부족- 업무의 문제를 찾거나 개선하기 위한 데이터 전담조직의 권한 부족기술환경 부족- 데이터 분석 결과를 업무에 적용하고 결과 분석 후 피드백하기 위한 기술 환경 부족 Ⅱ. 데이터옵스의 프레임워크 및 주요 요소가. 데이터옵스의 프레임워크 나. 데이터옵스의 주요 요소구분주요 요소설명데이터 파이프라인(Data Pipelines)데이터 수집- 데이터 소스, 데이터 아키텍처데이터 엔지니어링- 데이터 셋..

IT 기술/DB 2024.12.04

데이터베이스 트랜잭션

Ⅰ. 데이터베이스 논리적 작업 단위, 트랜잭션의 개요가. 트랜잭션의 정의- 한번에 처리되어야 할 하나 또는 둘 이상의 일련의 작업단위로 데이터베이스에 행해지는 작업의 논리적 단위 나. 트랜잭션의 특징특징상태관리설명Atomicity(원자성)All or Nothing- 연산 전체가 처리되거나 전체가 처리되지 않아야함Consistency(일관성)모순없는 상태- 트랜잭션 실행을 성공적으로 완료하면 모순 없이 일관성 있는 데이터베이스 상태를 보존Isolation(고립성)Locking- 트랜잭션이 실행 중에 생성하는 연산의 중간 결과를 다른 트랜잭션이 접근할 수 없음Durability(영속성)Storeing- 성공적으로 완료된 트랜잭션의 결과는 영구적으로 데이터베이스에 저장됨 Ⅱ. 트랜잭션의 상태 전이작업 구분상태..

IT 기술/DB 2024.12.04

빅데이터 분석 도구 선택 원칙

Ⅰ. 빅데이터 분석을 위한 도구, 빅데이터 분석도구의 개념- 대량의 데이터를 효율적으로 분류, 예측 등의 분석을 통하여 인사이트를 도출하고자 적용하는 도구 Ⅱ. 빅데이터 분석도구 선택 원칙가. 조직관점 선택 원칙원칙세부 항목설명품질기능성- 다양한 분석 알고리즘 및 기능 제공성능- 대량의 데이터 분석 처리 성능보안성- 빅데이터 처리시 데이터 보안 준수 여부사용성학습성- 사용자의 러닝 코스트 측정편의성- 사용자 인터페이스 모델링 용이성목표달성도- 다양한 모델 구축하여 목표 달성 가능결과물이해성- 결과물에 대한 직관적 이해 가능 여부시각화- 시각화 표현으로 다양한 그래프 지원 나. 기능관점 선택 원칙원칙설명분석 능력- 예측, 마이닝, 의사결정트리, 시계열 분석, 신경망 등 포함한 다양한 유형의 분석 기능 검토..

IT 기술/DB 2024.12.04

정규화와 역정규화

Ⅰ. 관계형 데이터베이스 중복 최소화, 정규화의 개요가. 정규화의 개념- 관계형 데이터베이스 설계에서 중복을 최소화하게 데이터를 구조화하는 프로세스로 관련 없는 함수 종속성을 별개의 릴레이션으로 표현 나. 정규화의 종류기본 정규화- 1차 정규화, 2차 정규화, 3차 정규화, BCNF고급 정규화- 4차 정규화, 5차 정규화 Ⅱ. 정규화 상세 설명구분정규화설명기본 정규화1차 정규화- 릴레이션에 속한 모든 속성의 도메인이 더 이상 분해되지 않는 원자값으로 구성2차 정규화- 기본키가 아닌 모든 속성이 기본키에 완전 함수 종속되도록 구성3차 정규화- 기본키가 아닌 모든 속성이 기본키에 이행적 함수 종속이 되지 않도록 구성BCNF- 릴레이션의 함수 종속 관계에서 모든 결정자가 후보키이면 만족고급 정규화4차 정규화-..

IT 기술/DB 2024.12.04

NoSQL

Ⅰ. 분산 환경 최적화 DBMS, NoSQL의 개념- 테이블-컬럼 스키마 없이 분산 환경에서 key - value 기반으로 단순 검색 및 추가 작업이 가능한 DBMS Ⅱ. NoSQL의 유형 및 모델링 절차가. NoSQL의 유형유형개념도설명Key/Value- key-value가 하나의 묶음(unique)으로 저장- key 안에 (column, value) 형태 필드 column famlesOrdered Key/Value- key-value가 확장된 형태- 데이터가 key 순서로 정렬Document Key/Value- 저장되는 value 데이터가 document 타입- XML, JSON, YAML 등 구조화- 복잡한 계층 구조 표현 나. NoSQL의 모델링 절차#절차설명1도메인모델 파악- 저장 위한 도메인 ..

IT 기술/DB 2024.12.04

스타 스키마

Ⅰ. 다차원 모델링 중 비정규화 모델링 기법, 스타 스키마의 정의- 다차원 의사결정 지원 데이터를 관계형 데이터베이스로 전환하는데 사용되는 데이터 모델링 기법 Ⅱ. 스타 스키마의 구성요소 및 구조가. 스타 스키마의 구성요소구성요소설명사실(Facts)- 중심 테이블로서 관련성이 높은 Measure들의 집합차원(Dimensions)- 각 Fact를 분석하는 하나의 관점속성(Attribute)- 각 차원 테이블이 가지고 있는 속성속성계층(Hierarchies)- 차원 내 정의된 속성들 간에 존재하는 계층 관계 나. 스타 스키마의 구조구분설명 구조도개념- 사실 테이블과 차원 테이블로 데이터를 분리하여 설계한 모델특징- 장점: 이해하기 쉽고 계층구조 정의가 용이하고 물리적인 조인수가 줄어듬- 단점: 단일차원테이블..

IT 기술/DB 2024.12.04
반응형