반응형

전체 글 238

CNN

Ⅰ. 컴퓨터 비전 분석 대표 인공지능 알고리즘, CNN의 정의- 주로 이미지 및 영상 분석에 사용되며 이미지의 특징을 학습하고 이를 활용해 이미지를 분류하는 인공지능 모델 Ⅱ. CNN의 구조 및 주요 layer 설명가. CNN의 구조- CNN은 Convolution Layer, Pooling Layer, Fully Connected Layer로 구성된 나. CNN의 주요 layer 상세 설명주요 계층개념도설명ConvolutionLayer- 이미지를 filter를 통해 탐색하고 특징을 추출하여 feature map을 생성- 필터의 이동량을 stride로 조절- 데이터 손실 방지를 위해 padding 활용PoolingLayer- 기하급수적으로 늘어나는 연산량을 줄이기 위해 주요 특징만 강조하여 이미지 사이즈..

의사결정나무 (Decision Tree)

1. 나무 구조의 분류 및 예측 분석 모델, 의사결정나무의 개념정의- 의사 결정에 대한 규칙을 나무 구조로 나타내어 전체 자료를 분류하거나 예측을 수행하는 분석 모델구성요소root node- 의사결정나무가 시작되는 노드parent node- child 노드의 상위 노드child node- 하나의 마디로부터 분리되어 나간 2개 이상의 노드terminal node- 더 이상 분리되지 않는 최종 노드branch- root node부터 terminal node까지 연결된 nodedepth- root node부터 terminal node까지 node 들의 수 2. 의사결정나무의 불순도 및 분석 프로세스가. 의사결정나무의 불순도구분수식설명지니 지수- 불순도 측정 지수, 얼마나 다양한 데이터가 섞여있는지 정도- 지니..

결측값 / 이상값

1. 누락된 데이터 값, 데이터 결측값가. 결측값의 정의- 데이터 수집 및 처리 과정에서 정보 손실, 연구 대상 무응답 등 여러 원인으로 발생한 데이터 누락 값 나. 결측값의 종류 및 처리 방법구분항목설명결측값종류완전 무작위 결측- 다른 값에 영향 받지 않고 완전히 무작위로 발생- 모든 정보가 데이터 분석에 문제가 되지 않는 경우무작위 결측- 결측이 다른 변수에 따라 조건부로 결측이 발생- 특정 변수 결측 여부가 자료 내 타 변수와 관련 있는 경우비무작위 결측- 결측 여부가 해당 변수의 값에 의해 결정되어 발생- 무작위가 아니라 주도면밀한 추가 조사가 필요결측값처리 방법제거법- 완전 제거법: 불완전 자료 무시, 완전 관측 자료만 분석- 한쌍 제거법: 결측치 변수만 해당 분석에서 제외단순 대치법- 평균 대..

이미지 데이터 어노테이션

1. 컴퓨터 비전 데이터 라벨링, 이미지 데이터 어노테이션의 정의- 인공지능 모델을 학습시키기 위한 학습 데이터 생성 과정에서 이미지 데이터에 레이블을 추가하는 과정 2. 이미지 데이터 어노테이션 유형 및 기법가. 이미지 데이터 어노테이션 유형유형특징설명이미지 분류사진 자체 클래스 분류- 이미지 자체를 하나의 객체로 보고 분류- 객체를 하나의 클래스로 분류하는 방법객체 탐지사진 내 객체 클래스 분류- 이미지내 둘 이상의 객체 분류하는 방법- 이미지내 관심 객체 식별한 뒤 클래스 분류객체 분할사진 내 객체 정밀 분류- 이미지내 다중 객체들 간의 위치 뿐 아니라 객체 모서리(edge)를 찾아 클래스 분류 나. 이미지 데이터 어노테이션 기법기법특징설명바운딩 박스- 빠른 데이터 가공- 이미지 혹은 영상안 객체의..

데이터베이스 튜닝 (Tuning)

Ⅰ. 데이터베이스 튜닝의 개념과 목적가. 데이터베이스 튜닝의 개념데이터 베이스 응용 프로그램, 데이터베이스, 운영체제를 조정해서 한정된 자원에서 최적의 성능을 이끌어내기 위한 작업 나. 데이터베이스 튜닝의 목적목적설명처리 능력 향상시간별 트랜잭션 처리량 증가처리 시간 단축작업완료 소요 시간 단축응답 시간 단축사용자 요청부터 시스템 응답까지 시간 단축로드 시간 단축데이터베이스 로드 시간 단축 Ⅱ. 데이터베이스 설계 단계 튜닝 기법가. 데이터베이스 튜닝 단계1단계DB 설계 튜닝 (모델링 관점)- 반정규화- 분산 파일 배치2단계DBMS 튜닝 (환경 관점)- Buffer 크기- Cache 크기3단계SQL 튜닝 (APP 관점- Hash- Join 나. 설계 단계 튜닝 기법 상세 설명구분기법설명데이터베이스- 실체뷰..

IT 기술/DB 2024.10.03

DB 옵티마이저

Ⅰ. 최적의 SQL 쿼리 수행을 위한, 옵티마이저의 개요가. 옵티마이저의 정의- 사용자가 질의한 SQL문에 대해서 실행 계획과 처리 비용을 추정하여 최적의 실행 계획을 수립하는 DBMS 핵심 엔진 나. 옵티마이저의 핵심 기능- 실행 계획 탐색: 주어진 SQL 질의를 처리할 수 있는 실행 계획 나열- 비용 산정: 각 실행 계획의 예상 비용 계산하고 최소 비용 계획 실행 Ⅱ. 옵티마이저 분류가. 규칙기반 옵티마이저, RBO항목설명개념인덱스 구조, 비교연산자에 따른 순위 부여를 기준으로 최적의 결오를 설정특징- 판단이 규칙적이고 분명하여 사용자가 정확히 예측 가능- 통계 정보라는 현실 요소를 무시하여 판단 오차 클 수 있음우선순위1. ROWID 사용 단일 행2. 클러스터 조인에 의한 단일 행3. UNIQUE ..

카테고리 없음 2024.10.03

ISO 8000 (Data Quality)

Ⅰ. 데이터 품질 국제 표준, ISO 8000가. ISO 8000 정의 및 특징구분설명정의- 기업, 조직에서 생산되는 데이터 라이프 사이클 과정에서 데이터 품질 요구사항을 명세한 국제 표준특징- 마스터 데이터 명세- 데이터 교환, 구문, 의미, 명세 적합성에 대한 상세 정의- 관리 프레임워크 정의- 품질 관리에 대한 9 Box Matrix 모델 기반 활동 제시 나. ISO 8000 구성도 및 구성요소구분상세 설명구성도구성요소ISO 8000 - 1ISO 8000 시리즈에 대한 전반적인 개요ISO 8000 - 2ISO 8000 시리즈에 대한 표준 사용 용어, 원칙 소개ISO 8000 - 8정보 및 데이터 품질 관리 개념 및 측정, 시험 방법ISO 8000 - 51데이터 거버넌스, 데이터 관리 정책ISO 80..

IT 기술/DB 2024.10.03

데이터 거래소

Ⅰ. 가공된 데이터를 거래하는 데이터 거래소의 개요가. 데이터 거래소의 정의- 기업, 공공기관, 정부에서 확보한 데이터를 가공해 부가가치를 높여 필요한 소비자에게 공급하는 플랫폼 나. 데이터 거래소의 제안배경데이터 유출데이터 유출은 데이터 필요 수요가 있다는 반증표준 품질 보증다양한 형태의 데이터에 대해 품질 표준화데이터 통합 분석산재된 데이터를 수집, 저장하여 통합 플랫폼에서 분석, 활용효율적 데이터 유통빅데이터 산업 활성화를 위한 유통 창구 역할 필요새로운 경제 창출신개념 사업 창조로 고용창출 등 촉매제 역할  Ⅱ. 데이터 거래소 개념도 및 구성요소가. 데이터 거래소 개념도 나. 데이터 거래소 구성요소구성요소설명특징빅데이터 플랫폼정형, 비정형 데이터 처리 및 분석 지원표준 플랫폼검색엔진이용자가 필요로..

IT 기술/DB 2024.10.03

데이터 메시

Ⅰ. 데이터 메시의 개요가. 데이터 메시의 정의 및 필요성정의: 데이터 파이프라인을 활용하여 여러 도메인의 데이터를 탈중앙화하여 관리하는 데이터 아키텍처 나. 데이터 메시의 4원칙원칙설명도메인 지향 분산 데이터 소유권 및 아키텍처(Domain Ownership)- 데이터 생성과 확장, 사용자 증가, 데이터 접근 정책의 다양성에 대응제품으로서의 데이터(Data as a Product)- 데이터를 쉽게 검색하고 품질이 보장된 데이터를 사용하여 생산성 향상셀프 서비스 데이터 인프라 플랫폼(Self-serve data platform)- 도메인별 자율적 제품 개발 구축, 실행 및 운영연합 컴퓨팅 거버넌스(Federated computational governance)- 데이터 사용자가 상호 운용을 위한 표준을 ..

IT 기술/DB 2024.10.02

데이터 품질 관리

Ⅰ. 데이터 품질관리 정의 및아키텍처가. 데이터 품질관리 정의- 기관이나 조직 내외부의 정보시스템 및 DB 사용자의 기대 만족을 위해 지속적으로 데이터를 관리하는 활동 나. 데이터 품질관리 아키텍처구성요소특징 및 설명데이터- 기업의 목적 달성을 위해 사용되는 전산화된 데이터데이터 구조- 데이터가 저장되는 틀- 데이터 취급하는 관점에 따라 구조 변경- 사용자 뷰, 모델, 데이터베이스 파일 형태데이터 관리 프로세스- 데이터 및 데이터 구조의 품질을 유지 및 개선하기 위한 활동- 데이터 품질 관리 체계적 접근을 위해 성숙도 모델 활용 Ⅱ. 데이터 품질관리 성숙도 모델가. 데이터 품질관리 성숙도 모델 구성요소구성요소설명데이터 품질 기준- 데이터 품질에 대한 정의품질관리 프로세스- 데이터 품질기준을 향상시키기 위..

IT 기술/DB 2024.10.02
반응형