반응형

IT 기술/인공지능 39

멀티모달 AI

Ⅰ. 인간의 인지적 학습법 모방, 멀티모달 AI의 개념- 이미지, 텍스트, 음성, 비디오 등 다양한 모달리티를 동시에 받아들이고 사고하는 AI 모델 Ⅱ. 멀티모달 AI의 개념도 및 종류가. 멀티모달 AI의 개념도멀티 모델- input data의 종류가 1가지이고 여러개의 모델을 거치는 방식멀티 모달- input data의 종류가 2가지 이상이며 모델은 1개 또는 2개 이상이 되는 방식 나. 멀티모달 AI 종류종류개념도설명Early Fusion- 종류가 다른 두 가지 데이터를 하나의 데이터로 먼저 합친 이후 모델 학습Joint Fusion- 두 개의 모달리티 데이터를 동시에 학습하지 않고 유연하게 모달리티를 병합- end-to-end learningLate Fusion- 다른 두 가지 데이터를 각각 다른 ..

강화학습

Ⅰ. 행동에 따른 보상으로 모델 학습, 강화학습의 개요가. 강화학습의 정의- 주어진 환경에서 정의된 에이전트가 현재 상태를 인식하여 선택 가능한 행동들 중 보상을 최대화하는 행동을 선택하도록 학습하는 기계학습의 한 방법 나. 강화학습의 특징순차적 의사결정 문제- 데이터의 관측 순서가 결과에 영향을 미침환경과 상호작용- 비용 증가에 따라 인프라 증설이 필요한 경우 장비 추가로 확장 Ⅱ. 강화학습의 개념도 및 주요 기법가. 강화학습의 개념도- 에이전트가 행동을 취하고 이에 따른 보상을 최대화하는 정책 학습 나. 강화학습의 주요 기법구분기법설명ModelFreeMDP(Markov Decision Process)- 의사결정 과정을 확률과 그래프를 이용한 기법- 상태, 상태전이 확률밀도함수, 행동, 보상함수 4요소..

생성형 적대 신경망 GAN

Ⅰ. 생성형 적대 신경망, GAN의 개요가. GAN의 정의- 가짜 데이터를 생성하는 모델과 진짜와 가짜를 구분하는 모델을 함께 학습시켜 진짜와 구분하기 힘든 데이터를 생성하는 모델 나. GAN의 특징비지도학습- 학습 데이터의 레이블이 따로 주어지지 않고 진짜 이미지의 특징을 학습해 진짜 같은 가짜 이미지를 생성하는 모델생성모델, 분류모델- 생성 모델과 판별 모델 2개의 모델을 학습에 활용하여 오버피팅 문제 해결 Ⅱ. GAN의 절차도 및 구성요소가. GAN의 절차도- 분류기는 분류 정확도 높이도록, 생성자는 분류 정확도 낮추도록 학습 진행 나. GAN의 구성요소구분설명훈련 데이터- 생성 모델과 분류 모델을 훈련시키는데 사용되는 학습 데이터 집합Generator(생성 모델)- 생성자로 훈련 데이터 기반으로 ..

시계열 분석

Ⅰ. 시계열 분석 개념- 시간의 흐름에 따라 기록된 데이터를 분석하고 여러 변수간의 인과관계를 분석하는 방법론 Ⅱ. 시계열 데이터의 특징특징설명시간 종속성- 시간을 기준으로 정렬되며 데이터의 순서가 중요계절성- 계절성으로 알려진 반복 패턴 또는 주기 발생추세- 시간 경과에 따른 데이터의 장기적인 움직임노이즈- 특정 패턴이나 원인에 기인할 수 없는 임의의 변동 데이터자기상관성- 연속된 데이터 포인트 간의 상관성 및 유사성 존재 Ⅲ. 시계열 분석 모델모델설명수식AR Model(Autoregressive)- 자기 회귀 모델로 과거 시점의 데이터가 현재 시점에 영향을 미치는 모델X(t) = w*X(t-1) + b + u*e(t)w, u: 가중치b: 상수e(t): white-noiseMA Model(Moving ..

RNN과 LSTM

Ⅰ. 시퀸스 데이터 학습 모델, RNN가. RNN의 정의- 시계열 데이터와 같이 시퀸스 데이터를 학습하기 위해 과거 출력을 재귀적으로 참조하는 모델 나. RNN의 동작방식1현 시점 t, 다음 시점 t+1에 보내는 은닉 상태값 ht2입력 데이터 x와 현 시점 셀과의 가중치 Wxh 계산3이전 시점 셀의 결과와 현재 시점 셀과의 가중치 Whh 계산4현재 시점  셀과출력 데이터 Y의 가중치 Why 계산5은닉층 활성 함수로는 주로 하이퍼볼릭 탄젠트 사용- 주요 데이터 사이가 멀어지면 장기의존성 문제 해결위해 LSTM 등장 Ⅱ. RNN 한계 극복 모델, LSTM가. LSTM의 정의- RNN의 출력과 멀리 있는 정보를 기억할 수 없어 발생하는 문제 보완한 장/단기 기억 모델 나. LSTM의 동작 방식1상태를 두 개,..

CNN

Ⅰ. 컴퓨터 비전 분석 대표 인공지능 알고리즘, CNN의 정의- 주로 이미지 및 영상 분석에 사용되며 이미지의 특징을 학습하고 이를 활용해 이미지를 분류하는 인공지능 모델 Ⅱ. CNN의 구조 및 주요 layer 설명가. CNN의 구조- CNN은 Convolution Layer, Pooling Layer, Fully Connected Layer로 구성된 나. CNN의 주요 layer 상세 설명주요 계층개념도설명ConvolutionLayer- 이미지를 filter를 통해 탐색하고 특징을 추출하여 feature map을 생성- 필터의 이동량을 stride로 조절- 데이터 손실 방지를 위해 padding 활용PoolingLayer- 기하급수적으로 늘어나는 연산량을 줄이기 위해 주요 특징만 강조하여 이미지 사이즈..

의사결정나무 (Decision Tree)

1. 나무 구조의 분류 및 예측 분석 모델, 의사결정나무의 개념정의- 의사 결정에 대한 규칙을 나무 구조로 나타내어 전체 자료를 분류하거나 예측을 수행하는 분석 모델구성요소root node- 의사결정나무가 시작되는 노드parent node- child 노드의 상위 노드child node- 하나의 마디로부터 분리되어 나간 2개 이상의 노드terminal node- 더 이상 분리되지 않는 최종 노드branch- root node부터 terminal node까지 연결된 nodedepth- root node부터 terminal node까지 node 들의 수 2. 의사결정나무의 불순도 및 분석 프로세스가. 의사결정나무의 불순도구분수식설명지니 지수- 불순도 측정 지수, 얼마나 다양한 데이터가 섞여있는지 정도- 지니..

결측값 / 이상값

1. 누락된 데이터 값, 데이터 결측값가. 결측값의 정의- 데이터 수집 및 처리 과정에서 정보 손실, 연구 대상 무응답 등 여러 원인으로 발생한 데이터 누락 값 나. 결측값의 종류 및 처리 방법구분항목설명결측값종류완전 무작위 결측- 다른 값에 영향 받지 않고 완전히 무작위로 발생- 모든 정보가 데이터 분석에 문제가 되지 않는 경우무작위 결측- 결측이 다른 변수에 따라 조건부로 결측이 발생- 특정 변수 결측 여부가 자료 내 타 변수와 관련 있는 경우비무작위 결측- 결측 여부가 해당 변수의 값에 의해 결정되어 발생- 무작위가 아니라 주도면밀한 추가 조사가 필요결측값처리 방법제거법- 완전 제거법: 불완전 자료 무시, 완전 관측 자료만 분석- 한쌍 제거법: 결측치 변수만 해당 분석에서 제외단순 대치법- 평균 대..

이미지 데이터 어노테이션

1. 컴퓨터 비전 데이터 라벨링, 이미지 데이터 어노테이션의 정의- 인공지능 모델을 학습시키기 위한 학습 데이터 생성 과정에서 이미지 데이터에 레이블을 추가하는 과정 2. 이미지 데이터 어노테이션 유형 및 기법가. 이미지 데이터 어노테이션 유형유형특징설명이미지 분류사진 자체 클래스 분류- 이미지 자체를 하나의 객체로 보고 분류- 객체를 하나의 클래스로 분류하는 방법객체 탐지사진 내 객체 클래스 분류- 이미지내 둘 이상의 객체 분류하는 방법- 이미지내 관심 객체 식별한 뒤 클래스 분류객체 분할사진 내 객체 정밀 분류- 이미지내 다중 객체들 간의 위치 뿐 아니라 객체 모서리(edge)를 찾아 클래스 분류 나. 이미지 데이터 어노테이션 기법기법특징설명바운딩 박스- 빠른 데이터 가공- 이미지 혹은 영상안 객체의..

반응형