반응형

IT 기술 168

머신러닝 성능지표

Ⅰ. 인공지능 모델의 성능평가, 머신러닝 성능 지표의 정의- 인공지능 모델의 실제 유용성 평가를 위해 데이터 예측 정확도, 분석 시간, 결과 해석 용이성 등의 성능 평가 목적 지표 Ⅱ. 머신러닝 성능지표 상세모델 유형성능 평가 방법설명예측 / 회귀MSEMean Squared Error, 실제값과 예측값의 차이를 제곱 평균한 값RMSERoot Mean Squared Error, MSE에 루트를 씌운 값MAEMean Absolute Error, 실제값과 예측값의 차이를 절댓값으로 평균한 값MAPEMean Absolute Percentage Error, MSE, RMSE의 단점을 보완한 방법분류정확도전체 데이터 중에 정확하게 예측한 데이터의 수정밀도Precision, 양성으로 판단한 것 중, 진짜 양성의 비율..

빅데이터 통합 관리

Ⅰ. 데이터 거버넌스의 개념 및 주요 기능가. 데이터 거버넌스의 개념- 조직의 데이터 관리에 있어 데이터 보안, 개인정보 보호, 정확성, 가용성, 사용성 등을 보장하기 위해 수행하는 관리 프로세스 나. 데이터 거버넌스의 주요 기능기능설명데이터 품질 관리(DQM)- 데이터 프로파일링 및 데이터 정제와 같은 작업을 포함하여 데이터 사용 방법에 따라 실행메타 데이터 관리- 데이터 검색 중 데이터 찾기, 분석 도구에 의한 빅데이터 분석에 사용할 수 있도록 관리데이터 주기 관리- 데이터 생성 및 초기 저장부터 데이터 폐기까지 시스템의 데이터 흐름 관리데이터 보안 및 프라이버시- 데이터 요구 사항 및 정책에 따라 필요한 데이터 보호 수준 정의 및 관리  Ⅱ. 마스터 데이터의 개념과 필요성가. 마스터 데이터의 개념-..

IT 기술/DB 2024.12.04

대용량 데이터베이스의 인덱스

Ⅰ. 검색 연산을 최적화 하기 위한 인덱스의 개요가. 인덱스의 정의정의- 데이터베이스에 저장된 자료를 빠르게 조회하기 위해 테이블에 연관되어 독립적인 저장공간 보유 객체 나. 인덱스의 특징특징설명성능향상- 트랜잭션의 성능향상이 목적- 조회 성능 향상이 주 목적알고리즘- 트리 구조, 해시 함수 등 알고리즘 적용독립성- 테이블에 저장구조와 별도로 인덱스만 저장 가능Trade-Off- 조회와 나머지 성능을 고려하여 인덱스 생성  Ⅱ. 인덱스의 스캔 방식스캔 종류개념도설명인덱스전체 스캔- 인덱스의 모든 데이터 전체를 읽어오는 방법- WHERE인덱스범위 스캔- 인덱스의 일부 데이터의 범위를 지정하여 읽어오는 방법- WHERE, JOIN인덱스고유 스캔- 인덱스의 유일한 값을 검색하는 방법- PRIMARY KEY, ..

IT 기술/DB 2024.12.04

데이터 독립성

Ⅰ. DBMS의 궁극적인 목표, 데이터 독립성의 개요가. 데이터 독립성의 정의- 데이터베이스의 물리적 구조나 데이터의 저장 방식에 변화가 생겨도 응용 프로그램이나 사용자에게 영향을 주지 않는 능력 나. 데이터 독립성의 종류종류설명관련 사상논리적 데이터 독립성- 데이터베이스의 논리적 구조를 변경시키더라도 기존 응용 프로그램에 영향을 주지 않는 것논리적 구조 사상물리적 데이터 독립성- 응용 프로그램이나 데이터베이스의 논리적 구조에 영향을 주지 않고 물리적 구조를 변경시킬 수 있는 것물리적 구조 사상 Ⅱ. 데이터 독립성 보장을 위한 3단계 데이터베이스 구조 및 스키마 설명가. 3단계 데이터베이스 구조의 개념도외부 단계- 사용자가 데이터베이스를 어떻게 보는지를 표현하는 단계개념 단계- DBMS나 관리자가 전체 ..

IT 기술/DB 2024.12.04

분산 데이터베이스의 투명성

Ⅰ. 빅데이터 효율적 관리, 분산 데이터베이스의 정의- 논리적으로는 하나의 시스템에 속하지만 물리적으로 여러개의 사이트에 분산되어 있는 데이터베이스 Ⅱ. 분산 데이터베이스의 투명성투명성개념특징위치 투명성- 사용자나 응용프로그램이 접근할 데이터의 물리적 위치를 알 필요가 없는 성질- Distributed Data Dictionary Directory 활용복제 투명성- 사용자가 응용프로그램이 접근할 데이터가 물리적으로 여러 곳에 복제되어 있는지 여부를 알 필요 없는 성질- 상향식 점진적 확장- 시스템 구현 복잡병행 투명성- 여러 사용자나 응용프로그램이 동시에 분산 데이터베이스에 대한 트랜잭션을 수행하는 경우에도 결과에 이상이 발생하지 않는 성질- Locking- Time Stamp분할 투명성- 사용자가 하나..

IT 기술/DB 2024.12.04

데이터옵스 (DataOps)

Ⅰ. 새로운 데이터 접근 방식, 데이터옵스의 개요가. 데이터 옵스의 개념- 데이터를 분석해 애플리케이션을 형성한 후 최종 사용자에게 신뢰할 수 있는 데이터를 제공하기 위한 데이터 운영 관리 방식 나. 데이터 옵스의 등장배경IT 부서 의존적- 데이터 전담조직에서 IT부서 협조 없이 데이터 확보 및 가공이 어려움권한 부족- 업무의 문제를 찾거나 개선하기 위한 데이터 전담조직의 권한 부족기술환경 부족- 데이터 분석 결과를 업무에 적용하고 결과 분석 후 피드백하기 위한 기술 환경 부족 Ⅱ. 데이터옵스의 프레임워크 및 주요 요소가. 데이터옵스의 프레임워크 나. 데이터옵스의 주요 요소구분주요 요소설명데이터 파이프라인(Data Pipelines)데이터 수집- 데이터 소스, 데이터 아키텍처데이터 엔지니어링- 데이터 셋..

IT 기술/DB 2024.12.04

데이터베이스 트랜잭션

Ⅰ. 데이터베이스 논리적 작업 단위, 트랜잭션의 개요가. 트랜잭션의 정의- 한번에 처리되어야 할 하나 또는 둘 이상의 일련의 작업단위로 데이터베이스에 행해지는 작업의 논리적 단위 나. 트랜잭션의 특징특징상태관리설명Atomicity(원자성)All or Nothing- 연산 전체가 처리되거나 전체가 처리되지 않아야함Consistency(일관성)모순없는 상태- 트랜잭션 실행을 성공적으로 완료하면 모순 없이 일관성 있는 데이터베이스 상태를 보존Isolation(고립성)Locking- 트랜잭션이 실행 중에 생성하는 연산의 중간 결과를 다른 트랜잭션이 접근할 수 없음Durability(영속성)Storeing- 성공적으로 완료된 트랜잭션의 결과는 영구적으로 데이터베이스에 저장됨 Ⅱ. 트랜잭션의 상태 전이작업 구분상태..

IT 기술/DB 2024.12.04

빅데이터 분석 도구 선택 원칙

Ⅰ. 빅데이터 분석을 위한 도구, 빅데이터 분석도구의 개념- 대량의 데이터를 효율적으로 분류, 예측 등의 분석을 통하여 인사이트를 도출하고자 적용하는 도구 Ⅱ. 빅데이터 분석도구 선택 원칙가. 조직관점 선택 원칙원칙세부 항목설명품질기능성- 다양한 분석 알고리즘 및 기능 제공성능- 대량의 데이터 분석 처리 성능보안성- 빅데이터 처리시 데이터 보안 준수 여부사용성학습성- 사용자의 러닝 코스트 측정편의성- 사용자 인터페이스 모델링 용이성목표달성도- 다양한 모델 구축하여 목표 달성 가능결과물이해성- 결과물에 대한 직관적 이해 가능 여부시각화- 시각화 표현으로 다양한 그래프 지원 나. 기능관점 선택 원칙원칙설명분석 능력- 예측, 마이닝, 의사결정트리, 시계열 분석, 신경망 등 포함한 다양한 유형의 분석 기능 검토..

IT 기술/DB 2024.12.04

정규화와 역정규화

Ⅰ. 관계형 데이터베이스 중복 최소화, 정규화의 개요가. 정규화의 개념- 관계형 데이터베이스 설계에서 중복을 최소화하게 데이터를 구조화하는 프로세스로 관련 없는 함수 종속성을 별개의 릴레이션으로 표현 나. 정규화의 종류기본 정규화- 1차 정규화, 2차 정규화, 3차 정규화, BCNF고급 정규화- 4차 정규화, 5차 정규화 Ⅱ. 정규화 상세 설명구분정규화설명기본 정규화1차 정규화- 릴레이션에 속한 모든 속성의 도메인이 더 이상 분해되지 않는 원자값으로 구성2차 정규화- 기본키가 아닌 모든 속성이 기본키에 완전 함수 종속되도록 구성3차 정규화- 기본키가 아닌 모든 속성이 기본키에 이행적 함수 종속이 되지 않도록 구성BCNF- 릴레이션의 함수 종속 관계에서 모든 결정자가 후보키이면 만족고급 정규화4차 정규화-..

IT 기술/DB 2024.12.04

NoSQL

Ⅰ. 분산 환경 최적화 DBMS, NoSQL의 개념- 테이블-컬럼 스키마 없이 분산 환경에서 key - value 기반으로 단순 검색 및 추가 작업이 가능한 DBMS Ⅱ. NoSQL의 유형 및 모델링 절차가. NoSQL의 유형유형개념도설명Key/Value- key-value가 하나의 묶음(unique)으로 저장- key 안에 (column, value) 형태 필드 column famlesOrdered Key/Value- key-value가 확장된 형태- 데이터가 key 순서로 정렬Document Key/Value- 저장되는 value 데이터가 document 타입- XML, JSON, YAML 등 구조화- 복잡한 계층 구조 표현 나. NoSQL의 모델링 절차#절차설명1도메인모델 파악- 저장 위한 도메인 ..

IT 기술/DB 2024.12.04
반응형