반응형

2024/12 50

데이터베이스 트랜잭션

Ⅰ. 데이터베이스 논리적 작업 단위, 트랜잭션의 개요가. 트랜잭션의 정의- 한번에 처리되어야 할 하나 또는 둘 이상의 일련의 작업단위로 데이터베이스에 행해지는 작업의 논리적 단위 나. 트랜잭션의 특징특징상태관리설명Atomicity(원자성)All or Nothing- 연산 전체가 처리되거나 전체가 처리되지 않아야함Consistency(일관성)모순없는 상태- 트랜잭션 실행을 성공적으로 완료하면 모순 없이 일관성 있는 데이터베이스 상태를 보존Isolation(고립성)Locking- 트랜잭션이 실행 중에 생성하는 연산의 중간 결과를 다른 트랜잭션이 접근할 수 없음Durability(영속성)Storeing- 성공적으로 완료된 트랜잭션의 결과는 영구적으로 데이터베이스에 저장됨 Ⅱ. 트랜잭션의 상태 전이작업 구분상태..

IT 기술/DB 2024.12.04

빅데이터 분석 도구 선택 원칙

Ⅰ. 빅데이터 분석을 위한 도구, 빅데이터 분석도구의 개념- 대량의 데이터를 효율적으로 분류, 예측 등의 분석을 통하여 인사이트를 도출하고자 적용하는 도구 Ⅱ. 빅데이터 분석도구 선택 원칙가. 조직관점 선택 원칙원칙세부 항목설명품질기능성- 다양한 분석 알고리즘 및 기능 제공성능- 대량의 데이터 분석 처리 성능보안성- 빅데이터 처리시 데이터 보안 준수 여부사용성학습성- 사용자의 러닝 코스트 측정편의성- 사용자 인터페이스 모델링 용이성목표달성도- 다양한 모델 구축하여 목표 달성 가능결과물이해성- 결과물에 대한 직관적 이해 가능 여부시각화- 시각화 표현으로 다양한 그래프 지원 나. 기능관점 선택 원칙원칙설명분석 능력- 예측, 마이닝, 의사결정트리, 시계열 분석, 신경망 등 포함한 다양한 유형의 분석 기능 검토..

IT 기술/DB 2024.12.04

정규화와 역정규화

Ⅰ. 관계형 데이터베이스 중복 최소화, 정규화의 개요가. 정규화의 개념- 관계형 데이터베이스 설계에서 중복을 최소화하게 데이터를 구조화하는 프로세스로 관련 없는 함수 종속성을 별개의 릴레이션으로 표현 나. 정규화의 종류기본 정규화- 1차 정규화, 2차 정규화, 3차 정규화, BCNF고급 정규화- 4차 정규화, 5차 정규화 Ⅱ. 정규화 상세 설명구분정규화설명기본 정규화1차 정규화- 릴레이션에 속한 모든 속성의 도메인이 더 이상 분해되지 않는 원자값으로 구성2차 정규화- 기본키가 아닌 모든 속성이 기본키에 완전 함수 종속되도록 구성3차 정규화- 기본키가 아닌 모든 속성이 기본키에 이행적 함수 종속이 되지 않도록 구성BCNF- 릴레이션의 함수 종속 관계에서 모든 결정자가 후보키이면 만족고급 정규화4차 정규화-..

IT 기술/DB 2024.12.04

NoSQL

Ⅰ. 분산 환경 최적화 DBMS, NoSQL의 개념- 테이블-컬럼 스키마 없이 분산 환경에서 key - value 기반으로 단순 검색 및 추가 작업이 가능한 DBMS Ⅱ. NoSQL의 유형 및 모델링 절차가. NoSQL의 유형유형개념도설명Key/Value- key-value가 하나의 묶음(unique)으로 저장- key 안에 (column, value) 형태 필드 column famlesOrdered Key/Value- key-value가 확장된 형태- 데이터가 key 순서로 정렬Document Key/Value- 저장되는 value 데이터가 document 타입- XML, JSON, YAML 등 구조화- 복잡한 계층 구조 표현 나. NoSQL의 모델링 절차#절차설명1도메인모델 파악- 저장 위한 도메인 ..

IT 기술/DB 2024.12.04

스타 스키마

Ⅰ. 다차원 모델링 중 비정규화 모델링 기법, 스타 스키마의 정의- 다차원 의사결정 지원 데이터를 관계형 데이터베이스로 전환하는데 사용되는 데이터 모델링 기법 Ⅱ. 스타 스키마의 구성요소 및 구조가. 스타 스키마의 구성요소구성요소설명사실(Facts)- 중심 테이블로서 관련성이 높은 Measure들의 집합차원(Dimensions)- 각 Fact를 분석하는 하나의 관점속성(Attribute)- 각 차원 테이블이 가지고 있는 속성속성계층(Hierarchies)- 차원 내 정의된 속성들 간에 존재하는 계층 관계 나. 스타 스키마의 구조구분설명 구조도개념- 사실 테이블과 차원 테이블로 데이터를 분리하여 설계한 모델특징- 장점: 이해하기 쉽고 계층구조 정의가 용이하고 물리적인 조인수가 줄어듬- 단점: 단일차원테이블..

IT 기술/DB 2024.12.04

데이터 전처리 결측값과 이상값

Ⅰ. 데이터 클렌징 처리, 결측값과 이상값구분결측값 이상값정의- 데이터에서 일부분 또는 전체에 대한 입력이 누락되어 없는 값- 데이터에서 일정 범위를 벗어난 값으로 특이하게 작거나 큰 값검출 기법- isna() 함수 사용- isnull() 함수 사용- sum() 이용 개수 확인- 통계 기법- IQR 이용- z-score 방법처리 기법- 제거법- 단일 대체법- 다중 대체법- 제거- 변환- 분리 Ⅱ. 결측값과 이상값 처리 기법 상세 설명가. 결측값 처리 기법구분특징설명제거법- 데이터 제거- 하나의 변수라도 결측시 대상에서 제외단일대체법- 평균- 관측된 자료의 평균값 대체- 연역- 유추값, 유사 자료의 패턴 대체- 회귀- 회귀분석 이용하여 대체- 핫덱- 유사한 특성 응답 값 중 랜덤 추출 값 대체다중대체법- ..

IT 기술/DB 2024.12.04

연결함정

Ⅰ. 정규화 무손실 분해 실패, 연결 함정의 개요가. 연결 함정의 정의- ER모델에서 외혁적으로는 모든 튜플의 관계가 연결된 것 같지만 실제로는 관계성이 모호한 ER모델의 관계성 오류 나. 연결 함정의 종류종류특징설명부채꼴 함정관계성 모호- 개체 집합 사이에 관계성 집합이 정의되어 있지만 모호한 경우균열 함정관계성 미존재- 개체 집합 사이에 관계썽 집합이 정의되어 있지만 일부 집합 사이에 관계성이 존재하지 않는 경우- 연결 함정은 ER 모델 설계 시 발생할 수 있으며 관계성이 모호하거나 존재하지 않는 오류 Ⅱ. 부채꼴 함정의 오류와 해결방안가. 부채꼴 함정 오류문제점설명- 개체 집합 사이에 관계성 집합이 정의되어 있으나, 관계성 예시가 모호한 현상- 교수가 어떤 단과대학에 재직하는지 알 수 있으나, 어떤..

IT 기술/DB 2024.12.04

데이터 표준화

Ⅰ. 데이터 표준화의 개요가. 데이터 표준화의 개념- 시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하고 적용하는 활동 나. 데이터 표준화의 요소데이터 명칭- 데이터를 유일하게 구별해주는 이름데이터 정의- 데이터 의미하는 범위 및 자격 요건데이터 형식- 데이터 표현 형태의 정의로 입력 오류 최소화데이터 규칙- 데이터 규칙을 정의하여 입력 및 통제 위험 최소화 Ⅱ. 데이터 표준화의 필요성구분필요성설명데이터 운영데이터 불일치- 정보시스템 개발 및 운영 과정에서 동일한 의미의 데이터를 다른 명칭으로 중복 관리하여 불일치 발생 가능데이터 의미 파악 지연- 새로운 정보 요건이나 정보 요건 변경시 필요한 데이터를 파악하는데 시간 낭비하여 적시제공 어려움데이터 처리데이터..

IT 기술/DB 2024.12.03

[Python] MongoDB 다루기

Python에서 MongoDB를 사용하려면 **pymongo**라는 라이브러리를 사용합니다. pymongo는 MongoDB와 Python 간의 상호작용을 쉽게 해주는 라이브러리입니다. MongoDB는 NoSQL 데이터베이스로, JSON 형식의 데이터를 저장하고 관리하는 데 사용됩니다.아래는 Python과 MongoDB를 연동하여 데이터를 CRUD(Create, Read, Update, Delete)하는 예제 코드입니다. 이 예제에서는 pymongo 라이브러리를 사용하여 MongoDB와 상호작용하는 방법을 단계별로 설명합니다.1. pymongo 설치먼저 pymongo 라이브러리를 설치해야 합니다. 터미널에서 아래 명령어를 실행하세요.pip install pymongo2. MongoDB에 연결하기MongoD..

[Python] Sleep 함수 사용법에 대해

Python의 sleep() 함수는 프로그램을 지정한 시간만큼 일시적으로 멈추게 하는 함수입니다. 이 함수는 주로 시간 지연이 필요한 작업에서 유용하게 사용됩니다. 예를 들어, 서버와의 연결을 기다리거나 반복 작업 사이에 일정 간격을 두고 싶을 때 사용됩니다.time.sleep() 함수는 time 모듈에 포함되어 있으며, 이 함수를 사용하면 코드의 실행을 지정한 시간(초 단위)만큼 중단시킬 수 있습니다.사용법import time# 시간 지연을 위해 sleep() 함수 사용time.sleep(초 단위의 시간) 여기서 초 단위의 시간은 실수로도 입력할 수 있습니다. 예를 들어, 1.5를 입력하면 1.5초 동안 대기하게 됩니다.예시 코드import timeprint("프로그램 시작")# 2초 동안 일시 중지t..

반응형