반응형
Ⅰ. Hallucination 통제, RAG의 정의
- 대큐모 언어 모델의 출력을 최적화하여 응답을 생성하기 전 외부 지식 베이스를 참조하여 LLM 모델의 정확성과 신뢰성 향상시키는 프로세스
Ⅱ. RAG의 개념도 및 절차
가. RAG의 개념도
나. RAG의 절차
구분 | 절차 | 설명 |
검색 단계 | 질문 임베딩 | - 사용자 입력 값 벡터 임베딩 - 데이터 검색을 위해 자연어를 벡터로 표현 |
유사성 검색 | - 지식 베이스에서 유사한 데이터 검색 - 유사성이 높은 문서 목록 생성 |
|
관련도 순위 결정 | - 가장 관련 높은 문서 순위 조정 - 메타데이터 필터링으로 관련 없는 정보 제외 |
|
생성 단계 | 추론 | - 검색된 내용과 사용자 질문 바탕으로 프롬프트 구성 |
프롬프트엔지니어링 | - 언어 모델이 검색된 정보 기반으로 질문에 답변할 수 있게 함 | |
응답 생성 | - 생성된 텍스트 문법 및 정확성과 일관성 확인 후처리 |
Ⅲ. RAG와 fine tuning 비교
구분 | RAG | fine tuning |
이점 | - 외부 데이터 접근 - 데이터의 최신성 유지 - 근거 확실한 데이터 기반 |
- 양질의 라벨링 데이터로 모델 품질 향상 - 데이터 업데이트가 빈번하지 않는 도메인에서 유용 |
도전 과제 | - 관련 없는 문서 검색으로 낭비되는 시간 줄이기 위한 검색 모델 구축 필요 | - 양질의 데이터가 없을 경우 모델 정확도 영향 |
활용 | - 데이터 업데이트가 빈번한 도메인 | - 특정 작업용 어플리케이션 |
반응형