AI.zip
  • AI 모델
  • 방법론
  • AI 서비스
  • 가격 비교
  • 블로그

AI.zip

AI 모델, 서비스, 방법론을 큐레이션하는 에디토리얼 플랫폼

탐색

  • AI 모델
  • AI 서비스
  • 방법론
  • 블로그

커뮤니티

  • 소개
  • 디스코드 참여
  • 문의

법적고지

  • 이용약관
  • 개인정보처리방침

© 2026 ai.zip. All rights reserved.

Discord 커뮤니티
블로그Claude Code 내부 동작 방식 완전 해부 — 에이전틱 루프부터 컨텍스트 로딩까지

Claude Code 내부 동작 방식 완전 해부 — 에이전틱 루프부터 컨텍스트 로딩까지

심층 분석
2026년 4월 1일약 9분

Claude Code 내부 동작 방식 완전 해부 — 에이전틱 루프부터 컨텍스트 로딩까지

A deep technical explainer of Claude Code's internal architecture: the single-threaded agentic loop (ReAct pattern), con

news.hada.io

핵심 포인트

  • 1.Claude Code는 Anthropic이 만든 AI 코딩 에이전트로, 터미널에서 직접 실행되면서 코드 작성, 디버깅, 리팩토링을 자율적으로 수행한다
  • 2.2025년 출시 이후 연간 매출 10억 달러를 돌파하며 개발 도구 시장의 판도를 바꿨는데, 그 핵심에는 놀라울 정도로 단순한 아키텍처가 있다
  • 3.이 글에서는 Claude Code의 내부 동작 방식을 에이전틱 루프부터 컨텍스트 로딩, 권한 모델, 서브에이전트까지 완전히 해부한다

Claude Code는 Anthropic이 만든 AI 코딩 에이전트로, 터미널에서 직접 실행되면서 코드 작성, 디버깅, 리팩토링을 자율적으로 수행한다. 2025년 출시 이후 연간 매출 10억 달러를 돌파하며 개발 도구 시장의 판도를 바꿨는데, 그 핵심에는 놀라울 정도로 단순한 아키텍처가 있다. 이 글에서는 Claude Code의 내부 동작 방식을 에이전틱 루프부터 컨텍스트 로딩, 권한 모델, 서브에이전트까지 완전히 해부한다.

에이전틱 루프: 단일 스레드의 힘

Claude Code의 심장부는 "nO"라는 코드네임의 마스터 에이전트 루프다. 경쟁사들이 멀티 에이전트 스웜이나 복잡한 오케스트레이션을 추구하는 동안, Anthropic은 단일 스레드 while 루프 하나로 모든 것을 처리하는 접근법을 택했다.

이 루프는 6단계로 동작한다:

  1. 사용자 입력: 터미널(대화형) 또는 stdin/--print(헤드리스) 모드로 메시지가 들어온다
  2. 컨텍스트 조립: 시스템이 현재 날짜, git 상태(브랜치, 최근 커밋, 워킹 트리), CLAUDE.md 메모리 파일, 사용 가능한 도구 목록을 포함한 프롬프트를 구성한다
  3. 모델 추론: Anthropic API가 대화를 처리하고 하나 이상의 tool_use 블록을 생성한다. 각 블록은 도구 이름과 구조화된 JSON 입력을 포함한다
  4. 권한 평가: 각 도구 호출이 실행 전에 권한 검사를 거친다
  5. 도구 실행: 승인된 호출이 실행되고, 결과가 tool_result 블록으로 추가된다
  6. 루프 지속: 모델이 추가 도구를 호출하거나 최종 텍스트 응답을 생성한다

이 구조는 2023년 Yao et al.이 제안한 ReAct(Reasoning + Acting) 패턴과 정확히 일치한다. 생각(Thought) → 행동(Action) → 관찰(Observation)의 반복이 Claude Code에서는 추론 → 도구 호출 → 결과 피드백으로 구현된 것이다.

핵심 제약 조건이 하나 있다: 루프는 전적으로 사용자의 터미널 프로세스에서 실행된다. 원격 실행 서버가 없으므로 파일, 셸, 인증 정보가 도구가 명시적으로 전송하지 않는 한 로컬 머신을 벗어나지 않는다.

컨텍스트 로딩 시스템: 두 개의 캐시 블록

모든 API 호출 전에 두 종류의 컨텍스트 블록이 조립된다.

시스템 컨텍스트시스템 컨텍스트는 개발 환경의 현재 상태를 캡처한다:

  • Git 브랜치명, 기본 브랜치, 사용자명: 현재 작업 중인 브랜치와 프로젝트 구조를 파악
  • git status --short 출력: 워킹 트리의 변경 사항을 최대 2,000자까지 포함. 이 제한은 대규모 모노레포에서 컨텍스트 윈도우를 보호하기 위한 설계
  • git log --oneline으로 최근 5개 커밋: 최근 작업 이력을 통해 모델이 프로젝트 방향을 이해
  • 선택적 캐시 무효화 인젝션: 상황에 따라 캐시된 컨텍스트를 강제로 갱신

CLAUDE_CODE_REMOTE=1 환경변수가 설정되거나 git 지시가 비활성화되면 git 상태 수집이 생략된다. 이는 원격 실행 환경에서 불필요한 git 호출을 방지하기 위함이다.

사용자 컨텍스트사용자 컨텍스트는 프로젝트별 지식과 설정을 담는다:

  • CLAUDE.md 메모리 파일: 4단계 계층(managed → user → project → local)으로 관리된다. 프로젝트 루트의 CLAUDE.md에 코딩 컨벤션, 아키텍처 규칙, 자주 쓰는 명령어를 기록하면 매 대화에서 자동으로 로딩된다
  • 현재 날짜 인젝션: "Today's date is YYYY-MM-DD" 형식으로 주입되어 시간 감각을 제공

두 블록 모두 lodash/memoize로 성능 최적화되어 있어, 동일 대화 내에서 반복 계산을 피한다. CLAUDE_CODE_DISABLE_CLAUDE_MDS=1로 메모리 파일 로딩을 완전히 비활성화할 수도 있다.

권한 모델: 3단계 게이트

보안은 Claude Code 설계의 핵심 축이다. 모든 도구 호출은 실행 전에 권한 검사를 거치며, 결과는 세 가지 중 하나다:

결과동작예시
allow즉시 실행, 결과 추가Read, Glob, Grep (읽기 전용)
ask사용자 확인 프롬프트 표시Bash 명령, 파일 삭제
deny거부, 에러 피드백 반환금지된 명령 패턴

Read, Glob, Grep 같은 읽기 전용 도구는 모든 모드에서 자동 승인된다. acceptEdits 모드에서는 파일 편집도 자동 승인되지만, bash 명령은 여전히 확인을 요구한다. 이 설계는 안전성과 생산성 사이의 균형을 정밀하게 조율한다.

사용자는 .claude/settings.json에서 도구별 권한을 세밀하게 설정할 수 있고, 허용 패턴(allowedTools)과 거부 패턴을 정규식으로 정의할 수 있다.

서브에이전트: 격리된 컨텍스트의 활용

Claude Code의 Task 도구는 자체 에이전틱 루프를 가진 서브에이전트를 생성할 수 있다. 각 서브에이전트는 격리된 대화 컨텍스트와 선택적으로 제한된 도구 세트를 가진다.

이 설계의 핵심 통찰은 "비상관 컨텍스트 윈도우를 테스트 타임 컴퓨트의 한 형태로 활용"하는 것이다. 긴 단일 세션에서는 이전 대화의 잡음이 쌓이지만, 오염되지 않은 신선한 컨텍스트 윈도우를 가진 병렬 서브에이전트는 특정 하위 작업에서 더 높은 추론 능력을 발휘할 수 있다.

서브에이전트의 두 가지 활용 패턴:

  • Subagent: 단일 작업 내 빠른 병렬 조사. 예를 들어 여러 파일에서 특정 패턴을 동시에 검색하거나, 독립적인 리서치를 병렬로 수행
  • Team: 진정한 병렬 워크스트림. 한 에이전트가 백엔드를 리팩토링하는 동안 다른 에이전트가 프론트엔드 테스트를 업데이트하는 식의 대규모 병렬 작업

서브에이전트는 로컬에서 실행되거나 원격으로 실행될 수 있으며, git worktree를 활용해 격리된 파일 시스템에서 작업할 수도 있다.

쿼리 엔진과 스트리밍

쿼리 엔진(query.ts)은 에이전틱 루프의 실행 인프라를 담당한다:

  • 실시간 스트리밍: API 응답이 Server-Sent Events로 도착하며 점진적으로 렌더링된다. 도구 호출은 전체 응답이 완료되기 전에 mid-stream에서 감지되어 실행 파이프라인을 트리거한다
  • 도구 디스패칭: tool_use 블록을 파싱하고 적절한 도구로 라우팅한다
  • 턴별 예산 관리: 토큰과 도구 호출 횟수에 대한 per-turn 제한을 적용한다. 이를 통해 무한 루프나 비용 폭주를 방지한다
  • 결과 크기 관리: 각 도구는 maxResultSizeChars를 지정하며, 초과 결과는 임시 파일에 저장되고 미리보기만 모델에 전달된다

실시간 조향: h2A 큐

h2A라는 비동기 이중 버퍼 큐가 마스터 루프와 협력하여 진정한 대화형 스트리밍을 구현한다. 에이전트가 복잡한 작업을 수행하는 도중에도 사용자가 새로운 지시, 제약 조건, 방향 전환을 삽입할 수 있다. 전체 작업을 중단하고 재시작할 필요 없이 실시간으로 코스를 수정할 수 있는 것이다.

이 기능은 실제 프로덕션에서 핵심적이다. 에이전트가 잘못된 방향으로 진행 중일 때 즉시 교정할 수 있고, 추가 컨텍스트를 작업 중간에 주입할 수 있다.

컨텍스트 압축과 대화 지속성

세션은 ~/.claude/에 JSON 트랜스크립트로 저장된다. --resume <session-id>로 전체 히스토리를 복원하고, 메모리 파일을 재탐색하며, 권한을 기본값으로 초기화한다.

긴 대화에서는 컨텍스트 윈도우 사용량이 약 92%에 도달하면 wU2 압축기가 자동으로 트리거된다. 오래된 메시지를 요약하여 컨텍스트 윈도우를 확보하되, 원본 트랜스크립트는 디스크에 항상 보존되므로 정보 손실은 없다.

TODO 리스트 기능(TodoWrite)도 장기 대화 관리에 핵심적인 역할을 한다. 모델이 다단계 작업을 수행할 때 구조화된 JSON 작업 목록을 생성하고, 진행 상황을 추적하며, 도구 실행 후 시스템 메시지로 현재 TODO 상태가 주입되어 목표를 잃지 않게 한다.

터미널 UI: React in the Terminal

터미널 인터페이스는 Ink(CLI용 React 렌더러)를 사용한 React 앱이다. 대화 뷰, 입력 영역, 도구 호출 표시, 권한 다이얼로그, 진행 표시기 모두 Yoga(CSS flexbox)로 레이아웃하고 ANSI 이스케이프 코드로 스타일링하는 React 컴포넌트다.

이 접근법 덕분에 터미널이라는 제약된 환경에서도 풍부한 상호작용 경험을 제공하며, VS Code 확장, JetBrains 플러그인, 웹 UI 등 다양한 프론트엔드로의 확장도 동일한 에이전트 코어 위에서 이루어진다.

왜 이 아키텍처가 작동하는가

Claude Code의 설계 철학은 "단순하고 규율 있는 단일 스레드 마스터 루프가 제어 가능한 자율성을 제공한다"는 것이다. 복잡한 멀티 에이전트 시스템 대신 하나의 루프가 하나의 일관된 대화 히스토리를 유지하면서, 필요할 때만 서브에이전트로 병렬성을 확보한다.

이 단순함이 세 가지를 만든다. 첫째, 디버깅 용이성 — 단일 스레드이므로 상태 추적이 쉽다. 둘째, 예측 가능성 — 도구 호출 순서가 명확하고 권한 게이트가 일관된다. 셋째, 사용자 신뢰 — 모든 것이 로컬에서 실행되고 모든 도구 호출이 권한 게이트를 통과하며 대화 전체가 JSON으로 보존된다.

Boris Cherny가 Sonnet 3.5 API 테스트용으로 만든 가벼운 터미널 인터페이스에서 시작해, 연간 20억 달러 규모의 프로덕트로 성장한 Claude Code. 그 기술적 토대는 ReAct 패턴이라는 검증된 방법론 위에 실용적인 엔지니어링 결정들이 쌓인 결과다.

참고 자료

Claude Code 내부 동작 방식 완전 해부 — Agentic Loop부터 컨텍스트 로 | GeekNews
GeekNews

Claude Code 내부 동작 방식 완전 해부 — Agentic Loop부터 컨텍스트 로 | GeekNews

Claude Code가 터미널에서 어떻게 돌아가는지 공식 문서(VineeTagarwaL의 Mintlify 정리본) 기준으로 핵심만 정리했습니다.Claude Code는 어떻게 동작하나?한마디로 “읽고 → 생각하고 → 도구 쓰고 → 결과 보고 → 반복” 하는 루프입니다.Agentic Loop 6단계사용자가 터미널에 메시지 입력 (또는 --print / stdi

ReAct: Synergizing Reasoning and Acting in Language Models
arXiv.org

ReAct: Synergizing Reasoning and Acting in Language Models

While large language models (LLMs) have demonstrated impressive capabilities across tasks in language understanding and interactive decision making, their abilities for reasoning (e.g. chain-of-thought prompting) and acting (e.g. action plan generation) have primarily been studied as separate topics. In this paper, we explore the use of LLMs to generate both reasoning traces and task-specific actions in an interleaved manner, allowing for greater synergy between the two: reasoning traces help the model induce, track, and update action plans as well as handle exceptions, while actions allow it to interface with external sources, such as knowledge bases or environments, to gather additional information. We apply our approach, named ReAct, to a diverse set of language and decision making tasks and demonstrate its effectiveness over state-of-the-art baselines, as well as improved human interpretability and trustworthiness over methods without reasoning or acting components. Concretely, on question answering (HotpotQA) and fact verification (Fever), ReAct overcomes issues of hallucination and error propagation prevalent in chain-of-thought reasoning by interacting with a simple Wikipedia API, and generates human-like task-solving trajectories that are more interpretable than baselines without reasoning traces. On two interactive decision making benchmarks (ALFWorld and WebShop), ReAct outperforms imitation and reinforcement learning methods by an absolute success rate of 34% and 10% respectively, while being prompted with only one or two in-context examples. Project site with code: https://react-lm.github.io

Inside Claude Code's Architecture: The Agentic Loop That Codes For You
DEV Community

Inside Claude Code's Architecture: The Agentic Loop That Codes For You

How Anthropic built a terminal AI that reads, writes, executes, asks permission, and loops...

Claude Code: Behind-the-scenes of the master agent loop
PromptLayer

Claude Code: Behind-the-scenes of the master agent loop

When Tom&#x27;s Guide reported that Anthropic had to add weekly limits after users ran Claude Code 24/7, it caused quite a stir. Claude Code did something right. Let&#x27;s dive into the architecture behind the scenes and see if we can learn a thing or two about agentic engineering (or

How the agent loop works
Claude API Docs

How the agent loop works

Understand the message lifecycle, tool execution, context window, and architecture that power your SDK agents.

이 글에서 다루는 AI

Claude Code

서비스

Claude

서비스

ReAct (Reasoning + Acting)

방법론

Agentic Workflow

방법론

ai.zip 커뮤니티에 참여하세요

AI 소식·유용한 링크 공유, 새 모델/서비스 토론까지 -- Discord에서 함께해요.

Discord 참여하기

이전글

Claude Code /btw 명령어로 토큰 비용 50% 줄이는 법

다음글

Suno v5.5 완전 분석 — 내 목소리로 AI 노래 만들기, 가격, Udio 비교까지

댓글

0개

댓글을 작성하려면

로그인

해주세요

글 정보

심층 분석
2026년 4월 1일9분

관련 서비스

Claude Code

Claude

관련 방법론

ReAct (Reasoning + Acting)

Agentic Workflow