반응형

IT 기술/DB 28

분산 데이터베이스 투명성

Ⅰ. 다중 DBMS 통합 관리 시스템, 분산 데이터베이스정의물리적으로 분산된 여러 지역 DBMS를 하나의 논리적인 데이터베이스로 관리하는 데이터베이스 관리 시스템 Ⅱ. 분산 데이터베이스의 투명성(Transparency)특성설명특징분할 투명성하나의 논리적 관계가 분할되어 여러 사이트에 저장- Bottle neck 방지- 시스템 성능 향상- 설계 복잡위치 투명성데이터 저장 위치 명시 불필요, System Catalog에 유지- 어플리케이션 단순화- 이중처리로 속도 저하지역사상 투명성지역  DBMS와 물리적 DB 매핑 보장- 지역 자치성 향상- 점진적 시스템 용량 확장중복 투명성DB 객체가 여러 사이트에 중복 저장에 대해 알 필요 없음- 시스템 구현 복잡장애 투명성장애에 무관한 트랜잭션의 원자성 유지- 장애처..

IT 기술/DB 2024.10.02

DBMS 병행 제어

Ⅰ. 데이터 동시 접근, 병행수행의 개요정의다수의 사용자가 접근하는 DBMS에서 트랜잭션들의 동시 접근시 직렬성을 보장하여 작업 수행하는 기법필요성- 트랜잭션들의 직렬성 보장- 데이터의 일관성과 무결성 보장- 트랜잭션 간섭 제어 (상호 배제) Ⅱ. 병행수행 실패에 따른 문제점문제점사례설명갱신 손실(Lost Update)- 하나의 트랜잭션이 갱신한 내용을 다른 트랜잭션이 덮어씀으로써 갱신이 무효화되는 문제- 두 개의 트랜잭션이 한 개의 데이터를 동시에 갱신할 때 발생현황 파악 오류(Dirty Read)- 트랜잭션이 특정 데이터에 쓰기 작업을 하는 중간에 다른 트랜잭션이 해당 데이터를 읽어와 중간 데이터를 읽어 발생하는 문제모호성(Inconsistency)- 트랜잭션이 특정 데이터를 갱신하는 동안 다른 트랜..

IT 기술/DB 2024.10.01

앙상블 기법

Ⅰ. 복수개의 모델 조합, 앙상블 기법의 개요- 복수의 약한 분류기를 생성하고 그 예측을 결합함으로써 더 정확한 최종 예측을 도출하는 기법 Ⅱ. 랜덤 샘플 데이터 학습, Bagging가. Bagging의 정의정의Bootstrap Aggregating, 여러 개의 동일한 모델을 독립적으로 랜덤 샘플 데이터를 학습시켜 각각의 예측을 결합하여 최종 예측 수행하는 앙상블 기법 나. Bagging의 주요 과정과정설명부트스트랩 샘플링- 전체 데이터셋에서 중복 허용 랜덤 샘플링 수행- 복수의 훈련 데이터셋 생성독립 모델 학습- 생성한 훈련 데이터로 독립 모델 학습- 동일한 알고리즘으로 서로 다른 데이터 학습 예측 결합- 예측 결과 결합하여 최종 예측- 회귀 문제는 평균, 분류 문제는 투표를 통해 결정- 전체 데이터 ..

IT 기술/DB 2024.10.01

데이터 모델링의 4단계

Ⅰ. 현실세계 추상화 모델링, 데이터 모델링의 개요가. 데이터 모델링의 정의- 현실세계 데이터를 추상화하여 데이터베이스의 데이터로 표현하기 위한 전체 설계 과정 나. 데이터 모델링의 4단계 절차요구사항분석- 데이터 처리 요구 분석개념모델링- 독립적 개념 스키마 설계- 트랜잭션 모델링논리모델링- DBMS 개념 스키마 설계- 트랜잭션 I/F 설계물리모델링- 물리적 구조 설계- 트랜잭션 세부 설계- 전 단계 수정 사항 있을 시 피드백 루프로 이전 단계로 돌아가서 수정 Ⅱ. 데이터 모델링의 4단계 상세 설명 및 중요 고려 요인가. 데이터 모델링 단계별 상세 설명단계세부절차설명요구사항분석요구사항 도출- 업무 관계자 인터뷰- 외부자료 수집 분석요구사항 분석- 요구사항의 명확성, 완전성, 모호성 검증- 요구사항 도출..

IT 기술/DB 2024.10.01

NoSQL CAP 이론

Ⅰ. 분산 데이터베이스의 속성, NoSQL의 CAP 개념- 분산 DB의 3가지 속성 일관성, 가용성, 파티션 허용에 대해 3가지 전부 만족할 수 없고 장애 상황 시 2가지만 선택 가능하다는 이론 Ⅱ. NoSQL의 CAP의 개념도 및 2 Pick 설명가. CAP의 개념도 일관성(Consistency)- 모든 사용자는 항상 동시에 같은 데이터를 조회한다.가용성(Availability)- 모든 사용자는 항상 read/write 할 수 있다.- 노드 장애시 대체 노드가 작동한다.파티션 허용(Partition Tolerance)- 물리적 네트워크 분할 시에도 시스템은 정상 동작 한다. 나. CAP의 Two Pick 설명구분대표 시스템설명C + A- Oracle- MySQL- 가용성과 일관성 확보, 오류 허용하지 ..

IT 기술/DB 2024.10.01

함수적 종속성(FD), 4, 5차 정규화, DB Table Partitioning, 쿼리 오프로딩

Ⅰ. 함수적 종속성Ⅱ. 4, 5차 정규화Ⅲ. DB Table PartitioningⅣ. 쿼리 오프로딩Ⅰ. 릴레이션 내 속성간의 관계, 함수적 종속성 설명가. 함수적 종속성 개요정의한 릴레이션 내의 X,Y 속성 간의 "X가 Y를 결정하는 유일한 속성"인 관계 나. 함수적 종속성 유형유형관계설명정규화완전함수종속성R(X, Y)에서X -> YY를 결정하는 속성이  X가 유일한 상태2차 정규화 적용부분함수종속성R(X, Y)에서X 부분집합 -> YY를 결정하는 X가 X의 부분집합이 존재2차 정규화 적용이행함수종속성R(X, Y, Z)에서X -> Y, Y -> Z 이면 X -> ZX가 Y를 결정하고 Y가 Z를 결정하면 X는 Z를 결정3차 정규화 적용결정자종속성R(X, Y)에서X -> Y, X는 후보키 XX가 식별자이지..

IT 기술/DB 2024.07.04

빅데이터 분석, 처리를 위한 Hadoop, Kappa

빅데이터 분석, 처리 기술 설명가. 빅데이터 분석도구를 선택하는 원칙나. 빅데이터 분석, 처리를 위한 Hadoop 3.0, 카파(Kappa) 아키텍처 설명Ⅰ. 비정형 데이터까지 처리 가능한 빅데이터 분석/처리 개요개념도정의다양한 형태의 대량의 데이터를 효율적으로  저장, 전처리, 분석하여 비즈니스에 필요한 인사이트를 도출하는 과정구분설명세부기술분석기법빅데이터를 분석하는 사용할 수 있는 통계 및 컴퓨터 공학의 다양한 기법- Regression, Classfication, Clustering, Machine Learning, Neural Networks, Visualization처리기술분석에 필요한 데이터를 수집, 처리, 관리하기 위해 개발된 기술- Hadoop, R, SQL, Cloud Computing ..

IT 기술/DB 2024.07.04

데이터베이스의 동시성 제어/병행제어(Concurrency Control)

데이터베이스의 동시성제어/병행제어(Concurrency Control)에 대해 설명가. 동시성제어(병행제어)의 정의 나. 병행제어의 기법의 종류, 병행제어를 안했을때의 문제점Ⅰ. 데이터베이스 트랜잭션 일관성/무결성 보장, 동시성 제어의 정의정의- 다수의 사용자가 접근하는 DBMS에서 트랜잭션의 직렬화로 트랜잭션 간의 간섭을 제어해서 데이터 일관성, 무결성을 유지하는 기법필요성- 트랜잭션 일관성, 무결성 유지- 복수 트랜잭션의 직렬화- 트랜잭션 간의 상호간섭 제어- 동시성이 높을수록 데이터 일관성이 떨어지므로 다수의 사용자가 접근하는 시스템의 경우 다양한 동시성 제어 기법 적극 활용 필수  Ⅱ. 동시성 제어 기법의 종류 및 상세 설명기법매커니즘설명Locking- s-lock: lock된 데이터 자원은 모든..

IT 기술/DB 2024.07.04
반응형