Question 1

Self RAG이란 무엇인가요?

Accepted Answer

보통 AI는 질문을 받으면 무조건 자료를 검색합니다. 하지만 이 방식은 AI가 먼저 "이 질문에 검색이 필요한가?"를 스스로 판단해요. 마치 의사가 환자를 볼 때 "이건 검사가 필요하겠다" 또는 "이건 바로 알 수 있다"고 판단하는 것과 같습니다.

"1 더하기 1은?"처럼 이미 알고 있는 건 굳이 검색하지 않고 바로 답합니다. "최근 반도체 수출 동향은?"처럼 최신 정보가 필요하면 자료를 찾아보고요. 답변을 만든 후에도 "이 답이 정확한가?" 스스로 검증하는 단계까지 거칩니다.

의료 분야에서 특히 유용하게 쓰이고 있어요. 의료 논문 검색 서비스에서 AI가 의사의 질문을 받을 때, 일반 상식인지 최신 연구 결과를 찾아야 하는지 자동으로 구분해서 대응합니다. 불필요한 검색을 줄여서 답변 속도도 빨라지고, 정확도도 높아지는 일석이조의 효과가 있습니다.

Question 2

Self RAG의 기술적 원리는 무엇인가요?

Accepted Answer

📚 선수학습: 이 내용을 이해하려면 RAG (Retrieval-Augmented Generation)를 먼저 읽으면 좋습니다.

핵심 아키텍처

Self-RAG는 Asai et al. (2023)이 제안한 방법으로, LLM이 스스로 검색 여부를 판단하고, 생성한 답변의 품질을 자체 평가(self-reflection)하는 프레임워크다. 핵심은 네 가지 리플렉션 토큰(reflection token)[^1]을 LLM에 학습시켜, 생성 과정에서 비평(critique)을 인라인으로 수행하는 것이다.

네 가지 리플렉션 토큰:

| 토큰 | 역할 | 값 |
|------|------|-----|
|  | 검색이 필요한가? |  /  /  |
|  | 검색된 문서가 관련 있는가? |  /  |
|  | 생성이 문서에 근거하는가? |  /  /  |
|  | 답변이 유용한가? |  /  /  /  /  |

생성 과정은 다음과 같이 진행된다:

```[IsSUP]selfrag/selfrag_ll

토큰	역할	값
`[Retrieve]`	검색이 필요한가?	`Yes` / `No` / `Continue`
`[IsREL]`	검색된 문서가 관련 있는가?	`Relevant` / `Irrelevant`
`[IsSUP]`	생성이 문서에 근거하는가?	`Fully` / `Partially` / `No`
`[IsUSE]`	답변이 유용한가?	`5` / `4` / `3` / `2` / `1`

벤치마크	표준 RAG	Self-RAG	향상
PopQA	50.8	54.9	+4.1
PubHealth	72.4	81.2	+8.8
ARC-Challenge	67.7	72.4	+4.7
ASQA (EM)	33.9	37.3	+3.4

Self RAG

쉽게 이해하기

기술 심층 분석

핵심 아키텍처

성능 및 비교

장점과 한계

실무 적용 가이드

댓글

관련 방법론

Self RAG

쉽게 이해하기

기술 심층 분석

핵심 아키텍처

성능 및 비교

장점과 한계

실무 적용 가이드

Footnotes

댓글

관련 방법론