IT 기술/인공지능

RAG(Retrieval Augmented Generation)

gooooooood 2024. 10. 24. 12:25
반응형

Ⅰ. Hallucination 통제, RAG의 정의

- 대큐모 언어 모델의 출력을 최적화하여 응답을 생성하기 전 외부 지식 베이스를 참조하여 LLM 모델의 정확성과 신뢰성 향상시키는 프로세스

 

Ⅱ. RAG의 개념도 및 절차

가. RAG의 개념도

 

나. RAG의 절차

구분 절차 설명
검색 단계 질문 임베딩 - 사용자 입력 값 벡터 임베딩
- 데이터 검색을 위해 자연어를 벡터로 표현
유사성 검색 - 지식 베이스에서 유사한 데이터 검색
- 유사성이 높은 문서 목록 생성
관련도 순위 결정 - 가장 관련 높은 문서 순위 조정
- 메타데이터 필터링으로 관련 없는 정보 제외
생성 단계 추론 - 검색된 내용과 사용자 질문 바탕으로 프롬프트 구성
프롬프트엔지니어링 - 언어 모델이 검색된 정보 기반으로 질문에 답변할 수 있게 함
응답 생성 - 생성된 텍스트 문법 및 정확성과 일관성 확인 후처리

 

Ⅲ. RAG와 fine tuning 비교

구분 RAG fine tuning
이점 - 외부 데이터 접근
- 데이터의 최신성 유지
- 근거 확실한 데이터 기반
- 양질의 라벨링 데이터로 모델 품질 향상
- 데이터 업데이트가 빈번하지 않는 도메인에서 유용
도전 과제 - 관련 없는 문서 검색으로 낭비되는 시간 줄이기 위한 검색 모델 구축 필요 - 양질의 데이터가 없을 경우 모델 정확도 영향
활용 - 데이터 업데이트가 빈번한 도메인 - 특정 작업용 어플리케이션

 

반응형

'IT 기술 > 인공지능' 카테고리의 다른 글

XAI(eXplainable AI)  (2) 2024.10.24
초거대 AI  (1) 2024.10.24
sLLM  (1) 2024.10.24
딥페이크  (0) 2024.10.24
어텐션 매커니즘  (1) 2024.10.24