반응형

IT 기술/DB 44

RBO(Rule Based Optimizer)와 CBO(Cost Based Optimizer) 비교

1. RBO와 CBO 개념 비교RBOCBO- 정해진 규칙에 따라 실행 계획을 선택하는 우선순위가 정의된 고정 규칙 기반의 옵티마이저- 통계 기반 비용 계산으로 최적 실행 계획을 선택하는 테이블/인덱스 등의 통계 정보 기반의 옵티마이저  2. RBO와 CBO 상세 비교항목RBOCBO개념도기준고정 규칙통계 기반 비용우선 순위인덱스 -> 소규모 테이블 -> 조인실행 비용 적은 경로통계 정보불필요필수(DBMS_STATS)유연성낮음(고정 전략)높음(데이터 따라)정확도단순 질의에 적합복잡 질의에 효율적용 환경과거 Oracle 7이하최신 Oracle 10 이상조인 순서규칙에 따라 고정비용 적은 조인 순서인덱스 활용강제 활용비용 기반 필요시장점예측 가능, 단순 구조최적 실행, 유연성단점비효율 발생 가능분석 비용 발- ..

IT 기술/DB 2025.04.09

NoSQL 유형과 모델링 절차

1. 빅데이터 처리를 위한, NoSQL의 정의- RDBMS의 한계를 극복하기 위한 대용량 비정형 데이터 분산저장 데이터베이스특징) BASE, CAP, PACELC 이론 기반 2. NoSQL 유형과 모델링 절차가. NoSQL 유형유형개념도설명Key-Value- key(식별자) -> value(데이터 객체) 구조- 빠른 읽기/쓰기, 분산 처리- Redis, DynamoDB, Riak- 세션 캐시, 사용자 프로필Column - 열 중심의 데이터 저장 구조- 대규모 로그/이벤트 처리 유리- Cassandra, HBase, ScyllaDB- 로그 수집, IoT 데이터 처리Document- JSON, BSON, XML 문서 구조- 복잡한 데이터 직관적 표현- MongoDB, CouchDB, DocumentDB- 콘..

IT 기술/DB 2025.04.09

DQ 인증(데이터 품질 인증)

1. 데이터 품질 제고 및 고도화, 데이터 품질 인증 정의- 과학기술정보통신부가 지정한 데이터 품질인증기관이 데이터 내용, 관리체계를 진단하고 수준을 평가하여 품질 인증하는 제도관련 법령)데이터 산업진흥 및 이용촉진에 관한 기본법 제20조 2. DQ인증 유형 및 등급과 심사 지표가. DQ 인증 유형 및 등급항목구분기준인증 유형Complex-Type필수 심사 항목 전체, 선택 심사 항목 3개 이상Normal-Type필수 심사 항목 전체, 선택 심사 항목 3개 미만Simple-Type필수 심사 항목 일부인증 등급Class A데이터 품질 점수 0.99 이상Class B데이터 품질 점수 0.97 이상Class C데이터 품질 점수 0.95 이상- 데이터 구조, 관리 특성에 따라 적용 필수 지표와 선택 지표로 구분..

IT 기술/DB 2025.04.09

그래프 데이터베이스와 벡터 데이터베이스

1. 그래프 데이터베이스정의관계형 데이터베이스 보안 위한 NoSQL 계열로 데이터 사이 관계를 그래프로 연결하는 데이터베이스개념도구성 기술구성 요소노드, 엣지, 속성, 레이블저장 기술Native Graph Storage, Non-Native(NoSQL)질의 언어Cypher, Gremlin, SPARQL탐색 기술DFS, BFS, Dijkstra분산 처리분산 저장, 병렬 처리, 동시성 제어활용 사례SNS 분석- key/value 통해 관계 설정ERP, IAM- 계층 관계를 그래프로 모델링- 스키마가 필요없고 데이터 간의 관계에 따라 조회하여 질의 처리 속도 향상 2. 벡터 데이터베이스정의방대한 양의 고차원 데이터를 벡터 형태로 최적화하여 저장하고 검색하기 위한 데이터베이개념도구성요소임베딩 벡터- 비정형 데이..

IT 기술/DB 2025.04.09

쿼리 오프로딩

1. 대용량 데이터 처리를 위한 아키텍처, 쿼리 오프로딩의 정의- DB 트랜잭션의 처리량을 증가시키기 위해 READ와 UPDATE성 트랜잭션을 분리하여 처리하는 기법특징) 트랜잭션 READ가 70~90%, UPDATE가 10~30% 2. 쿼리 오프로딩의 개념도 및 구성요소가. 쿼리 오프로딩 개념도- Master, Staging, Slave 3개의 DB와 CDC 복제 기술로 구성 나. 쿼리 오프로딩 구성요소구분구성설명데이터베이스Master DB- Update 트랜잭션(Create, Delete, Update) 수행Staging DB- Slave DB로 복제하기 위한 중간 경유지Slave DB- Read 트랜잭션만 수행활용 기술CDC(Change Data Capture)- Source DB의 Back Log..

IT 기술/DB 2025.04.09

Nested Loop Join과 Hash Join 비교

1. Nested Loop Join, Hash Join 개념 비교Nested Loop JoinHash Join- 두 테이블을 중첩 반복문 방식으로 조인, 외부 루프의 각 튜플마다 내부 루프를 순차적으로 검색하는 방법- 해시 테이블을 생성한 뒤, 해시 값을 기준으로 매칭하여 조인하는 일반적으로 등가 조인에 적합한 방법  2. Nested Loop Join, Hash Join 상세 비교항목Nested Loop JoinHash Join개념도SQL/* USE_NL() *//* USE_HASH() */기본 방식중첩 반복해시 테이블 구성조인 조건등가/비등가 조인등가 조인성능소규모 테이블에 유리대용량 데이터에 유리비용O(n*m)O(n+m)인덱스 활용인덱스로 성능 향상인덱스 필요 없음메모리 사용상대적으로 적음해시 테이..

IT 기술/DB 2025.04.09

빅데이터 통합 관리

Ⅰ. 데이터 거버넌스의 개념 및 주요 기능가. 데이터 거버넌스의 개념- 조직의 데이터 관리에 있어 데이터 보안, 개인정보 보호, 정확성, 가용성, 사용성 등을 보장하기 위해 수행하는 관리 프로세스 나. 데이터 거버넌스의 주요 기능기능설명데이터 품질 관리(DQM)- 데이터 프로파일링 및 데이터 정제와 같은 작업을 포함하여 데이터 사용 방법에 따라 실행메타 데이터 관리- 데이터 검색 중 데이터 찾기, 분석 도구에 의한 빅데이터 분석에 사용할 수 있도록 관리데이터 주기 관리- 데이터 생성 및 초기 저장부터 데이터 폐기까지 시스템의 데이터 흐름 관리데이터 보안 및 프라이버시- 데이터 요구 사항 및 정책에 따라 필요한 데이터 보호 수준 정의 및 관리  Ⅱ. 마스터 데이터의 개념과 필요성가. 마스터 데이터의 개념-..

IT 기술/DB 2024.12.04

대용량 데이터베이스의 인덱스

Ⅰ. 검색 연산을 최적화 하기 위한 인덱스의 개요가. 인덱스의 정의정의- 데이터베이스에 저장된 자료를 빠르게 조회하기 위해 테이블에 연관되어 독립적인 저장공간 보유 객체 나. 인덱스의 특징특징설명성능향상- 트랜잭션의 성능향상이 목적- 조회 성능 향상이 주 목적알고리즘- 트리 구조, 해시 함수 등 알고리즘 적용독립성- 테이블에 저장구조와 별도로 인덱스만 저장 가능Trade-Off- 조회와 나머지 성능을 고려하여 인덱스 생성  Ⅱ. 인덱스의 스캔 방식스캔 종류개념도설명인덱스전체 스캔- 인덱스의 모든 데이터 전체를 읽어오는 방법- WHERE인덱스범위 스캔- 인덱스의 일부 데이터의 범위를 지정하여 읽어오는 방법- WHERE, JOIN인덱스고유 스캔- 인덱스의 유일한 값을 검색하는 방법- PRIMARY KEY, ..

IT 기술/DB 2024.12.04

데이터 독립성

Ⅰ. DBMS의 궁극적인 목표, 데이터 독립성의 개요가. 데이터 독립성의 정의- 데이터베이스의 물리적 구조나 데이터의 저장 방식에 변화가 생겨도 응용 프로그램이나 사용자에게 영향을 주지 않는 능력 나. 데이터 독립성의 종류종류설명예시논리적 독립성- 개념 스키마(논리적 구조)가 변경되더라도 외부 스키마(응용 프로그램)의 변경이 불필요테이블에 새로운 열(column)을 추가하거나 관계를 변경해도, 기존 프로그램에 영향을 주지 않음물리적 독립성- 내부 스키마(물리적 저장 방식)가 변경되더라도 개념 스키마와 응용 프로그램에 영향을 주지 않는 성질인덱스를 추가하거나 저장 매체를 변경해도 논리적 구조나 프로그램은 변경할 필요 없음 Ⅱ. 데이터 독립성 보장을 위한 3단계 데이터베이스 구조 및 스키마 설명가. 3단계..

IT 기술/DB 2024.12.04

분산 데이터베이스의 투명성

Ⅰ. 빅데이터 효율적 관리, 분산 데이터베이스의 정의- 논리적으로는 하나의 시스템에 속하지만 물리적으로 여러개의 사이트에 분산되어 있는 데이터베이스 Ⅱ. 분산 데이터베이스의 투명성투명성개념특징위치 투명성- 사용자나 응용프로그램이 접근할 데이터의 물리적 위치를 알 필요가 없는 성질- Distributed Data Dictionary Directory 활용복제 투명성- 사용자가 응용프로그램이 접근할 데이터가 물리적으로 여러 곳에 복제되어 있는지 여부를 알 필요 없는 성질- 상향식 점진적 확장- 시스템 구현 복잡병행 투명성- 여러 사용자나 응용프로그램이 동시에 분산 데이터베이스에 대한 트랜잭션을 수행하는 경우에도 결과에 이상이 발생하지 않는 성질- Locking- Time Stamp분할 투명성- 사용자가 하나..

IT 기술/DB 2024.12.04
반응형