반응형

2024/10/08 3

의사결정나무 (Decision Tree)

1. 나무 구조의 분류 및 예측 분석 모델, 의사결정나무의 개념정의- 의사 결정에 대한 규칙을 나무 구조로 나타내어 전체 자료를 분류하거나 예측을 수행하는 분석 모델구성요소root node- 의사결정나무가 시작되는 노드parent node- child 노드의 상위 노드child node- 하나의 마디로부터 분리되어 나간 2개 이상의 노드terminal node- 더 이상 분리되지 않는 최종 노드branch- root node부터 terminal node까지 연결된 nodedepth- root node부터 terminal node까지 node 들의 수 2. 의사결정나무의 불순도 및 분석 프로세스가. 의사결정나무의 불순도구분수식설명지니 지수- 불순도 측정 지수, 얼마나 다양한 데이터가 섞여있는지 정도- 지니..

결측값 / 이상값

1. 누락된 데이터 값, 데이터 결측값가. 결측값의 정의- 데이터 수집 및 처리 과정에서 정보 손실, 연구 대상 무응답 등 여러 원인으로 발생한 데이터 누락 값 나. 결측값의 종류 및 처리 방법구분항목설명결측값종류완전 무작위 결측- 다른 값에 영향 받지 않고 완전히 무작위로 발생- 모든 정보가 데이터 분석에 문제가 되지 않는 경우무작위 결측- 결측이 다른 변수에 따라 조건부로 결측이 발생- 특정 변수 결측 여부가 자료 내 타 변수와 관련 있는 경우비무작위 결측- 결측 여부가 해당 변수의 값에 의해 결정되어 발생- 무작위가 아니라 주도면밀한 추가 조사가 필요결측값처리 방법제거법- 완전 제거법: 불완전 자료 무시, 완전 관측 자료만 분석- 한쌍 제거법: 결측치 변수만 해당 분석에서 제외단순 대치법- 평균 대..

이미지 데이터 어노테이션

1. 컴퓨터 비전 데이터 라벨링, 이미지 데이터 어노테이션의 정의- 인공지능 모델을 학습시키기 위한 학습 데이터 생성 과정에서 이미지 데이터에 레이블을 추가하는 과정 2. 이미지 데이터 어노테이션 유형 및 기법가. 이미지 데이터 어노테이션 유형유형특징설명이미지 분류사진 자체 클래스 분류- 이미지 자체를 하나의 객체로 보고 분류- 객체를 하나의 클래스로 분류하는 방법객체 탐지사진 내 객체 클래스 분류- 이미지내 둘 이상의 객체 분류하는 방법- 이미지내 관심 객체 식별한 뒤 클래스 분류객체 분할사진 내 객체 정밀 분류- 이미지내 다중 객체들 간의 위치 뿐 아니라 객체 모서리(edge)를 찾아 클래스 분류 나. 이미지 데이터 어노테이션 기법기법특징설명바운딩 박스- 빠른 데이터 가공- 이미지 혹은 영상안 객체의..

반응형