반응형

Ⅰ. 행동에 따른 보상으로 모델 학습, 강화학습의 개요

가. 강화학습의 정의

- 주어진 환경에서 정의된 에이전트가 현재 상태를 인식하여 선택 가능한 행동들 중 보상을 최대화하는 행동을 선택하도록 학습하는 기계학습의 한 방법

 

나. 강화학습의 특징

순차적 의사결정 문제 - 데이터의 관측 순서가 결과에 영향을 미침
환경과 상호작용 - 비용 증가에 따라 인프라 증설이 필요한 경우 장비 추가로 확장

 

Ⅱ. 강화학습의 개념도 및 주요 기법

가. 강화학습의 개념도

- 에이전트가 행동을 취하고 이에 따른 보상을 최대화하는 정책 학습

 

나. 강화학습의 주요 기법

구분 기법 설명
Model
Free
MDP
(Markov Decision Process)
- 의사결정 과정을 확률과 그래프를 이용한 기법
- 상태, 상태전이 확률밀도함수, 행동, 보상함수 4요소 활용
Markov Chain - MDP에서 액션과 상태가 없다고 가정하고 시간에 따른 상태 변화 측정 기법
Q-Learning - Q 함수는 어떤 상태에서 행동을 취할 때 미래에 예상되는 전체 보상의 최대값으로 이를 최대화하는 방향으로 학습하는 기법
Model
Based
DQN
(Deep Q Network)
- 딥러닝과 강화학습의 Q-Learning을 조합한 기법

 

Ⅲ. 강화학습 활용 분야

분야 설명
게임 - 가상 환경의 지능형 캐릭터
자율주행 - 주변 환경 인식 및 판단을 통한 실시간 자율 주행
로봇제어 - 실환경에서 작동 및 제어되는 로봇 학습
금융 - 금융, 경제지표 분석을 통한 수익 극대화

 

반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

머신러닝과 딥러닝 차이  (3) 2024.10.11
멀티모달 AI  (2) 2024.10.11
생성형 적대 신경망 GAN  (0) 2024.10.11
시계열 분석  (1) 2024.10.11
RNN과 LSTM  (0) 2024.10.11
반응형

Ⅰ. 생성형 적대 신경망, GAN의 개요

가. GAN의 정의

- 가짜 데이터를 생성하는 모델과 진짜와 가짜를 구분하는 모델을 함께 학습시켜 진짜와 구분하기 힘든 데이터를 생성하는 모델

 

나. GAN의 특징

비지도학습 - 학습 데이터의 레이블이 따로 주어지지 않고 진짜 이미지의 특징을 학습해 진짜 같은 가짜 이미지를 생성하는 모델
생성모델, 분류모델 - 생성 모델과 판별 모델 2개의 모델을 학습에 활용하여 오버피팅 문제 해결

 

Ⅱ. GAN의 절차도 및 구성요소

가. GAN의 절차도

- 분류기는 분류 정확도 높이도록, 생성자는 분류 정확도 낮추도록 학습 진행

 

나. GAN의 구성요소

구분 설명
훈련 데이터 - 생성 모델과 분류 모델을 훈련시키는데 사용되는 학습 데이터 집합
Generator
(생성 모델)
- 생성자로 훈련 데이터 기반으로 데이터를 생성하고 분류기를 속이기 위해 진짜와 가까운 가짜 데이터를 생성
Discriminator
(분류 모델)
- 판별자로 생성 모델이 생성한 가짜 데이터를 진짜와 분류하기 위해 학습하는 모델

 

Ⅲ. GAN의 도전과제

구분 문제점 설명
데이터 훈련 데이터의 불완전성 - 모델 학습에 활용되는 훈련 데이터의 불완전성으로 오류 발생
생성 데이터의 품질 - GAN으로 생성한 합성 데이터의 품질이 인간이 만들어낸 데이터에 미치지 못함
윤리 / 법 딥페이크 - 불법으로 사람의 얼굴을 합성한 딥페이크 영상으로 개인정보 침해
저작권 - 다른 사람의 창작물 무단 학습으로 도용 및 저작권 문제 발생

- 기술의 부정적 사용 문제 해결을 위한 정부 차원 법적 제도화 필요

반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

멀티모달 AI  (2) 2024.10.11
강화학습  (0) 2024.10.11
시계열 분석  (1) 2024.10.11
RNN과 LSTM  (0) 2024.10.11
CNN  (0) 2024.10.11
반응형

Ⅰ. 시계열 분석 개념

- 시간의 흐름에 따라 기록된 데이터를 분석하고 여러 변수간의 인과관계를 분석하는 방법론

 

Ⅱ. 시계열 데이터의 특징

특징 설명
시간 종속성 - 시간을 기준으로 정렬되며 데이터의 순서가 중요
계절성 - 계절성으로 알려진 반복 패턴 또는 주기 발생
추세 - 시간 경과에 따른 데이터의 장기적인 움직임
노이즈 - 특정 패턴이나 원인에 기인할 수 없는 임의의 변동 데이터
자기상관성 - 연속된 데이터 포인트 간의 상관성 및 유사성 존재

 

Ⅲ. 시계열 분석 모델

모델 설명 수식
AR Model
(Autoregressive)
- 자기 회귀 모델로 과거 시점의 데이터가 현재 시점에 영향을 미치는 모델 X(t) = w*X(t-1) + b + u*e(t)
w, u: 가중치
b: 상수
e(t): white-noise
MA Model
(Moving Average)
- 이동 평균 모델로 트렌드나 추세가 변하는 상황에 적합한 모델 X(t) = w*e(t-1) + b +u*e(t)
ARMA Model - AR 모델과 MA 모델을 합친 모델로 과거 데이터의 영향와 추세까지 반영한 모델 X(t) = w1*X(t-1) + w2*e(t-1) + b +u*e(t)
ARIMA Model - 정상성을 가정하지 않고 차분을 포함하여 분석하는 모델 d = 2:Xt = (Xt - Xt-1) - (Xt-1 - Xt-2)
반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

강화학습  (0) 2024.10.11
생성형 적대 신경망 GAN  (0) 2024.10.11
RNN과 LSTM  (0) 2024.10.11
CNN  (0) 2024.10.11
의사결정나무 (Decision Tree)  (1) 2024.10.08
반응형

Ⅰ. 시퀸스 데이터 학습 모델, RNN

가. RNN의 정의

- 시계열 데이터와 같이 시퀸스 데이터를 학습하기 위해 과거 출력을 재귀적으로 참조하는 모델

 

나. RNN의 동작방식

1 현 시점 t, 다음 시점 t+1에 보내는 은닉 상태값 ht
2 입력 데이터 x와 현 시점 셀과의 가중치 Wxh 계산
3 이전 시점 셀의 결과와 현재 시점 셀과의 가중치 Whh 계산
4 현재 시점  셀과출력 데이터 Y의 가중치 Why 계산
5 은닉층 활성 함수로는 주로 하이퍼볼릭 탄젠트 사용

- 주요 데이터 사이가 멀어지면 장기의존성 문제 해결위해 LSTM 등장

 

Ⅱ. RNN 한계 극복 모델, LSTM

가. LSTM의 정의

- RNN의 출력과 멀리 있는 정보를 기억할 수 없어 발생하는 문제 보완한 장/단기 기억 모델

 

나. LSTM의 동작 방식

1 상태를 두 개, 단기 상태 ht와 장기 상태 Ct로 나누어 계산
2 Forget Gate는 이번 입력을 얼마나 이후에 반영할지 계산
3 Input Gate는 이번 정보를 얼마나 내보낼지 계산
4 Output Gate는 과거 정보를 얼마나 까먹을지 계산
5 장기 상태 Ct로 RNN의 장기의존성 문제 해결

 

Ⅲ. LSTM 보다 간단한 구조의 GRU

- reset gate와 update gate 2개로 LSTM 구조를 단순화 시킨 모델

반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

생성형 적대 신경망 GAN  (0) 2024.10.11
시계열 분석  (1) 2024.10.11
CNN  (0) 2024.10.11
의사결정나무 (Decision Tree)  (1) 2024.10.08
결측값 / 이상값  (1) 2024.10.08
반응형

Ⅰ. 컴퓨터 비전 분석 대표 인공지능 알고리즘, CNN의 정의

- 주로 이미지 및 영상 분석에 사용되며 이미지의 특징을 학습하고 이를 활용해 이미지를 분류하는 인공지능 모델

 

Ⅱ. CNN의 구조 및 주요 layer 설명

가. CNN의 구조

- CNN은 Convolution Layer, Pooling Layer, Fully Connected Layer로 구성된

 

나. CNN의 주요 layer 상세 설명

주요 계층 개념도 설명
Convolution
Layer
- 이미지를 filter를 통해 탐색하고 특징을 추출하여 feature map을 생성

- 필터의 이동량을 stride로 조절

- 데이터 손실 방지를 위해 padding 활용
Pooling
Layer
- 기하급수적으로 늘어나는 연산량을 줄이기 위해 주요 특징만 강조하여 이미지 사이즈를 줄이는 과정

- max pooling, average pooling 등이 존재
Fully Connected
Layer
- 앞에서 추출한 특징을 활용하여 최종 이미지를 분류하기 위한 계층

 

Ⅲ. CNN의 문제점 해결, ResNet

- 층이 깊어지면 정확도가 떨어지는 문제를 skip connection을 활용해 해결

반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

시계열 분석  (1) 2024.10.11
RNN과 LSTM  (0) 2024.10.11
의사결정나무 (Decision Tree)  (1) 2024.10.08
결측값 / 이상값  (1) 2024.10.08
이미지 데이터 어노테이션  (1) 2024.10.08
반응형

1. 나무 구조의 분류 및 예측 분석 모델, 의사결정나무의 개념

정의 - 의사 결정에 대한 규칙을 나무 구조로 나타내어 전체 자료를 분류하거나 예측을 수행하는 분석 모델
구성요소 root node - 의사결정나무가 시작되는 노드
parent node - child 노드의 상위 노드
child node - 하나의 마디로부터 분리되어 나간 2개 이상의 노드
terminal node - 더 이상 분리되지 않는 최종 노드
branch - root node부터 terminal node까지 연결된 node
depth - root node부터 terminal node까지 node 들의 수

 

2. 의사결정나무의 불순도 및 분석 프로세스

가. 의사결정나무의 불순도

구분 수식 설명
지니 지수

- 불순도 측정 지수, 얼마나 다양한 데이터가 섞여있는지 정도
- 지니 지수가 0이면 모든 데이터가 균일
엔트로피
지수
- 모델 예측 값과 실제 값 간의 절대오차의 평균
- 엔트로피가 높으면 불순도가 높다는 의미
정보 획득
 - 전체 엔트로피와 분할 후 엔트로피의 차이
- 정보 획득이 없을 때까지 트리 생성

 

나. 의사결정나무 분석 프로세스

구분 세부 내용 설명
설계 의사결정나무 형성 - 목표 변수를 가장 잘 분류할 수 있는 분리 기준 설정
- 최종 끝마디가 되는 정지 규칙 설정
분석 가지치기 - 분류 오류가 발생할 수 있거나 부적절한 추론 규칙을 가진 가지 제거
타당성 평가 - 교차타당성 (Cross Validation)을 이용하여 의사결정나무 평가
결론 해석 및 예측 - 구축된 나무모형 해석, 분류 및 예측 적용

 

3. 의사결정나무 알고리즘

알고리즘 정의 특징
ID3 - 반복적으로 이분하는 알고리즘 - 불순도 지수로 엔트로피 지수 사용
- 엔트로피 작게하는 방향으로 진행
- 독립변수가 모두 범주형일 때 가능
C4.5 - 기존의 ID3 알고리즘 개선 - 정교한 불순도 지표 활용
- 범주형 뿐 아니라 연속형 변수 사용 가능
- 결측치 포함 데이터 사용 가능
CART
(Classification And Regression Tree)
- 분류와 회귀 모두 가능한 알고리즘 - 불순도 지수로 지니 지수 사용
- 의사결정나무를 모두 이진트리로 구성
CHAID
(Chi-Squared Automatic Interaction Detection)
- 카이제곱 또는 F-검정 활용 분류 - 수치형, 범주형 변수 모두 활용 가능
- 이지 분리, 다지 분리 모두 활용 가능

 

4. 의사결정나무 활용 기반 알고리즘

- 의사결정나무를 기반으로 보팅, 배깅, 부스팅 기법을 사용해 다양한 머신러닝 분석 모델로 활용

반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

시계열 분석  (1) 2024.10.11
RNN과 LSTM  (0) 2024.10.11
CNN  (0) 2024.10.11
결측값 / 이상값  (1) 2024.10.08
이미지 데이터 어노테이션  (1) 2024.10.08
반응형

1. 누락된 데이터 값, 데이터 결측값

가. 결측값의 정의

- 데이터 수집 및 처리 과정에서 정보 손실, 연구 대상 무응답 등 여러 원인으로 발생한 데이터 누락 값

 

나. 결측값의 종류 및 처리 방법

구분 항목 설명
결측값
종류
완전 무작위 결측 - 다른 값에 영향 받지 않고 완전히 무작위로 발생
- 모든 정보가 데이터 분석에 문제가 되지 않는 경우
무작위 결측 - 결측이 다른 변수에 따라 조건부로 결측이 발생
- 특정 변수 결측 여부가 자료 내 타 변수와 관련 있는 경우
비무작위 결측 - 결측 여부가 해당 변수의 값에 의해 결정되어 발생
- 무작위가 아니라 주도면밀한 추가 조사가 필요
결측값
처리 방법
제거법 - 완전 제거법: 불완전 자료 무시, 완전 관측 자료만 분석
- 한쌍 제거법: 결측치 변수만 해당 분석에서 제외
단순 대치법 - 평균 대체 방법: 관측치의 평균값으로 대체
- 연역적 대체 방법: 논리적으로 유추하여 대체
- 일치 대응 대체 방법: 다른 조사 자료에서 추출하여 대채
다중 대치법 - 단순 대치법의 오차 및 난해성 보안을 위한 방법
- m 번의 대치를 통한 m 개의 가상 완전 자료 만들어 분석
- 대치, 분석, 결합 3단계로 구성

- 결측값 발생시 연구 신뢰도 감소 및 편향 발생으로 적절한 조치 필요

 

2. 정상 범위를 벗어난 데이터, 데이터 이상값

가. 이상값의 정의

- 각 변수의 분포에서 비정상적으로 분포를 벗어나는 극단적인 값

 

나. 이상값의 검출 방법 및 처리 방법

구분 항목 설명
이상값
검출 방법
통계 기법 - Z-Score: 평균에서 3 표준편차(0.15%) 이상 떨어진 값
- 기하평균: 기하평균에서 2.5 표준편차 이상 떨어진 값
- 사분위수 활용: Q1, Q3 기준 사분위범위의 1.5배 이상 떨어진 값
시각화 - 전체 데이터에 대해서 시각화하여 이상값 검출
- 확률 밀도함수, 히스토그램, 시계열차트, 산점도
머신러닝 기법 - 클러스터링 기법, 의사결정 나무 활용하여 이상값 검출
이상값
처리 방법
삭제 - 이상값으로 판단되는 관측값 제외 후 분석
변환 - 자연 로그를 취해 값 차이를 감소시켜 실제값 변형
대체 - 정상 범위에서 하한값보다 작으면 하한값으로, 상한값보다 크면 상한값으로 대체

- 이상값 발생시 편향으로 과대 또는 과소 추정이 발생하므로 적절한 조치 필요

 

반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

시계열 분석  (1) 2024.10.11
RNN과 LSTM  (0) 2024.10.11
CNN  (0) 2024.10.11
의사결정나무 (Decision Tree)  (1) 2024.10.08
이미지 데이터 어노테이션  (1) 2024.10.08
반응형

1. 컴퓨터 비전 데이터 라벨링, 이미지 데이터 어노테이션의 정의

- 인공지능 모델을 학습시키기 위한 학습 데이터 생성 과정에서 이미지 데이터에 레이블을 추가하는 과정

 

2. 이미지 데이터 어노테이션 유형 및 기법

가. 이미지 데이터 어노테이션 유형

유형 특징 설명
이미지 분류 사진 자체 클래스 분류 - 이미지 자체를 하나의 객체로 보고 분류
- 객체를 하나의 클래스로 분류하는 방법
객체 탐지 사진 내 객체 클래스 분류 - 이미지내 둘 이상의 객체 분류하는 방법
- 이미지내 관심 객체 식별한 뒤 클래스 분류
객체 분할 사진 내 객체 정밀 분류 - 이미지내 다중 객체들 간의 위치 뿐 아니라
객체 모서리(edge)를 찾아 클래스 분류

 

나. 이미지 데이터 어노테이션 기법

기법 특징 설명
바운딩 박스 - 빠른 데이터 가공 - 이미지 혹은 영상안 객체의 가장자리에 맞춘 사각형 틀 그려 캡쳐
폴리곤 - 객체 크기 정확히 인식 - 객체 테두리의 모든 지점을 표시해 객체를 인식하는 방법
폴리라인 - 직선, 곡선 추적 목적 - 지도 및 도로와 같이 시작 종료가 없는 형태 추적시 사용 기법
포인트 - 간단한 작업 - 이미지 속 객체의 개수 계산 방법으로 단일 픽셀을 찾아낼 때 사용
큐보이드 - 3D 환경에서 객체 식별 - 바운딩 박스와 유사하지만 3D환경에서 길이, 너비, 폭까지 인식
시맨틱
세그멘테이션
- 모든 픽셀 대상 작업 - 이미지의 모든 픽셀을 채색하여 객체간 정밀하게 클래스 분류하는 기법
반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

시계열 분석  (1) 2024.10.11
RNN과 LSTM  (0) 2024.10.11
CNN  (0) 2024.10.11
의사결정나무 (Decision Tree)  (1) 2024.10.08
결측값 / 이상값  (1) 2024.10.08

+ Recent posts