Claude Managed Agents 완벽 가이드 — AI 에이전트 개발 기간을 수개월에서 수일로

안녕하세요, blog.ne.kr입니다. 오늘은 Anthropic이 2026년 4월 8일 공식 출시한 Claude Managed Agents에 대해 깊이 있게 알아보겠습니다. AI 에이전트를 직접 구축하려면 수개월이 걸리던 인프라 작업을 이제 며칠 만에 해결할 수 있게 됐다는 소식인데요. 이 글 하나로 아키텍처, 요금, 실제 도입 사례, 그리고 솔직한 한계점까지 모두 파악할 수 있도록 정리했습니다.

핵심 요약

  • 출시일: 2026년 4월 8일, Anthropic이 Claude Platform을 통해 정식 공개
  • 핵심 개념: 에이전트를 직접 구축하는 대신 Anthropic의 호스팅 인프라 위에서 에이전트를 실행하는 서비스
  • 아키텍처: Brain(클로드 + 하니스) · Hands(샌드박스 + 도구) · Session(이벤트 로그)을 분리한 3-레이어 구조
  • 요금: Claude 모델 사용 비용 + 에이전트 실행 시간당 $0.08(약 116원)
  • 도입 효과: 개발 기간 수개월 → 수일, p95 첫 토큰 응답 시간(TTFT) 90% 이상 단축

목차

Claude Managed Agents란 무엇인가

AI 에이전트를 ‘운영’하는 복잡성을 Anthropic이 대신 책임지겠다는 선언입니다.

AI 에이전트를 프로덕션 환경에 배포하는 작업은 생각보다 훨씬 복잡합니다. 모델 자체만 있으면 되는 게 아니라, 에이전트가 안전하게 작업을 수행할 수 있는 격리된 컨테이너(샌드박스), 장기 작업 상태를 추적하는 세션 관리, 외부 도구를 호출하는 오케스트레이션 레이어, 그리고 장애가 발생했을 때 복구하는 에러 핸들링까지 모두 갖춰야 합니다. 이 인프라를 처음부터 쌓으면 통상 수개월이 걸립니다.

Claude Managed Agents는 이 모든 인프라를 Anthropic이 직접 제공하는 호스팅 서비스입니다. 개발자는 에이전트가 무엇을 해야 하는지 자연어나 YAML 파일로 정의하고, 어떤 도구(Tool)를 사용할지 지정하면 됩니다. 나머지 — 컨테이너 관리, 상태 저장, 크레덴셜 보안, 장애 복구 — 는 Anthropic의 플랫폼이 처리합니다.

이 제품이 탄생한 직접적인 계기는 하니스(Harness) 로직의 빠른 노후화 문제였습니다. Anthropic 엔지니어링 블로그에 따르면, Claude Sonnet 4.5에서는 컨텍스트 한도가 가까워질수록 작업을 조기에 마무리하려는 “컨텍스트 불안(context anxiety)” 현상이 있었습니다. 이를 해결하기 위해 컨텍스트 리셋 로직을 하니스에 추가했는데, Claude Opus 4.5로 업그레이드하자 해당 동작이 사라졌고 리셋 로직이 오히려 불필요한 오버헤드로 남았습니다. 모델이 발전할수록 하니스도 수시로 고쳐야 한다는 뜻인데, 이 부담을 플랫폼 레벨에서 흡수하겠다는 것이 Managed Agents의 핵심 철학입니다.

기존 방식과의 비교

구분직접 구축Claude Managed Agents
샌드박스 구성직접 컨테이너 설계자동 프로비저닝
세션 관리직접 DB/로그 설계append-only 세션 로그 제공
크레덴셜 보안직접 Vault 설계보안 Vault + MCP 프록시 제공
장애 복구직접 구현자동 재개(wake/resume)
멀티 에이전트직접 구현연구 프리뷰로 제공
개발 기간수개월수일
운영 비용전담 엔지니어 필요$0.08/시간

Brain · Hands · Session 아키텍처 해부

운영체제가 하드웨어를 추상화하듯, Managed Agents는 에이전트 컴포넌트를 추상화합니다.

Anthropic 엔지니어링 팀이 Managed Agents를 설계하면서 참고한 개념은 운영체제의 하드웨어 추상화입니다. 1970년대 디스크와 최신 SSD가 같은 read() 명령으로 동작하듯, 에이전트 컴포넌트 역시 내부 구현이 바뀌어도 외부 인터페이스는 안정적으로 유지되어야 한다는 철학입니다.

이 철학 아래 세 가지 컴포넌트를 분리했습니다.

Brain — Claude + 하니스

Brain은 Claude 모델 자체와, Claude를 호출하고 도구 호출(tool call)을 적절한 인프라로 라우팅하는 하니스(harness) 루프입니다. 이전 설계에서는 하니스가 컨테이너 안에 상주했는데, 이렇게 되면 컨테이너 장애 시 하니스도 함께 죽어 세션이 유실되는 문제가 있었습니다.

새 설계에서는 하니스가 컨테이너 밖으로 나왔습니다. 하니스는 컨테이너를 다른 도구와 동일하게 execute(name, input) → string 형태로 호출합니다. 컨테이너가 죽으면 하니스가 도구 호출 에러로 캐치하고, 필요하면 provision({resources})로 새 컨테이너를 초기화합니다. 하니스 자체가 죽어도 wake(sessionId)로 새 하니스를 부팅하고, getSession(id)로 이벤트 로그를 복원해 마지막 지점부터 재개할 수 있습니다.

Hands — 샌드박스 + 도구

Hands는 Claude가 실제 작업을 수행하는 격리된 실행 환경입니다. 코드 실행, 파일 편집, 외부 API 호출 등이 여기서 이루어집니다. 이 샌드박스는 크레덴셜이 절대 노출되지 않도록 설계됐습니다.

보안 설계의 핵심은 두 가지 패턴입니다. Git 저장소의 경우, 액세스 토큰을 이용해 샌드박스 초기화 시점에 클론을 완료하고 로컬 git remote에 연결합니다. 이후 에이전트가 pushpull을 실행할 때 토큰을 직접 다루지 않아도 됩니다. 커스텀 도구의 경우, MCP(Model Context Protocol)와 OAuth 토큰을 외부 Vault에 저장하고, Claude가 MCP 도구를 호출할 때 전용 프록시를 경유하게 합니다. 프록시가 세션 토큰을 받아 Vault에서 실제 크레덴셜을 조회해 외부 서비스를 호출하므로, 하니스는 크레덴셜을 아예 알 수 없습니다.

Session — 이벤트 로그

Session은 에이전트가 수행한 모든 것의 append-only(추가 전용) 로그입니다. 세션은 Brain이나 Hands와 완전히 분리돼 있어, 하니스나 샌드박스가 죽어도 세션 데이터는 보존됩니다. 하니스는 에이전트 루프를 실행하는 동안 emitEvent(id, event)로 세션에 지속적으로 기록합니다.

세션 설계에서 중요한 점은, 세션이 Claude의 컨텍스트 윈도우와 다르다는 것입니다. 장기 작업은 컨텍스트 윈도우를 초과하는 경우가 많습니다. Managed Agents는 컨텍스트 압축(compaction), 선택적 트리밍, 메모리 도구 등을 활용해 컨텍스트 한도를 넘는 작업도 이어서 처리할 수 있도록 합니다. 그 결과 Anthropic 내부 기준으로 p50 첫 토큰 응답 시간(TTFT)이 약 60%, p95가 90% 이상 단축됐습니다.

주요 기능과 요금 구조

기능 목록보다 “내가 안 짜도 되는 것”의 목록으로 이해하면 더 빠릅니다.

핵심 기능 목록

기능설명
자동 샌드박스에이전트마다 격리된 컨테이너 자동 생성
세션 관리append-only 이벤트 로그로 상태 영구 보존
자동 에러 복구하니스/컨테이너 장애 시 자동 재개
보안 크레덴셜 관리MCP 프록시 + 외부 Vault로 토큰 격리
모니터링 대시보드Claude Platform에서 에이전트 동작 실시간 조회
권한 토글도구별 자동 실행 여부 설정
멀티 에이전트 (프리뷰)복잡한 작업 시 서브 에이전트 자동 생성
자동 프롬프트 정제 (프리뷰)응답 품질 자동 개선, 내부 테스트에서 태스크 성공률 최대 10점 향상

요금 구조

요금은 두 가지 항목으로 구성됩니다.

항목단가
Claude 모델 사용 비용기존 API 요금과 동일 (모델별 상이)
에이전트 런타임 비용$0.08 / 에이전트 실행 시간

시간당 $0.08은 약 116원(2026년 4월 기준 환율)으로, 24시간 연속 실행 시 하루 약 $1.92가 추가됩니다. 단순 계산 시 엔지니어 1인이 인프라를 직접 구축 · 운영하는 비용보다 훨씬 저렴합니다. 다만 대규모 플릿(fleet) 운영 시에는 누적 비용을 별도로 계산해 봐야 합니다.

실제 도입 사례 — Notion · Rakuten · Asana

이론보다 실제 사례가 설득력이 높습니다. 초기 고객 3사를 살펴보겠습니다.

Anthropic이 공개한 초기 고객으로는 Notion, Rakuten Group, Asana 세 기업이 있습니다.

Notion — 클라이언트 온보딩 자동화

WIRED가 독점 데모로 공개한 사례입니다. Notion 프로덕트 매니저 Eric Liu는 신규 고객 온보딩 시 처리해야 하는 긴 체크리스트를 Claude Managed Agent에 위임하는 방식을 시연했습니다. 에이전트가 Notion 내에서 온보딩 태스크를 하나씩 완료하는 동안, 매니저는 Claude Platform 대시보드에서 에이전트가 어떤 도구를 사용하고 어느 단계까지 진행됐는지 실시간으로 확인할 수 있었습니다. 사람이 개입하지 않아도 되는 반복 업무를 대규모로 자동화한 사례입니다.

Rakuten · Asana

Rakuten Group과 Asana도 이미 Managed Agents를 자사 제품에 통합한 상태라고 Anthropic은 밝혔습니다. 구체적인 활용 내용은 아직 공개되지 않았지만, Asana는 업무 관리 플랫폼 특성상 프로젝트 자동화나 작업 위임 관련 기능에 활용했을 가능성이 높습니다.

시장 맥락 — ARR $300억 돌파

이 출시는 Anthropic의 급격한 성장세와 맞닿아 있습니다. Anthropic은 출시 하루 전인 4월 7일, 연간 반복 매출(ARR)이 $300억(약 43조 원)을 돌파했다고 발표했는데, 이는 2025년 12월 대비 약 3배 높은 수치입니다. 매출 성장의 대부분은 개발자 API 기반의 Claude Platform에서 나오고 있습니다. 경쟁사 OpenAI도 “Frontier”라는 에이전트 플랫폼을 운영 중인 상황에서, 이번 Managed Agents 출시는 엔터프라이즈 에이전트 시장 선점을 위한 직접적인 경쟁 포석으로 읽힙니다.

시작하는 방법 — 단계별 가이드

공식 문서 기준으로 에이전트를 처음 만들어보는 과정을 정리했습니다.

Managed Agents는 Claude Platform API를 통해 접근합니다. 시작 흐름은 크게 세 단계입니다.

1단계 — 에이전트 정의

에이전트가 수행할 작업을 자연어 또는 YAML 파일로 기술합니다.

“`yaml

agent_definition.yaml 예시

name: “client-onboarding-agent” description: | 신규 고객 온보딩 체크리스트를 자동으로 처리합니다. Notion 페이지 생성, 슬랙 메시지 발송, CRM 업데이트를 수행합니다. tools: – name: notion auto_execute: true – name: slack auto_execute: false # 사용자 승인 필요 – name: crm_api auto_execute: true “`

2단계 — 세션 시작

API를 호출해 에이전트 세션을 시작합니다.

“`python import anthropic

client = anthropic.Anthropic(api_key=”YOUR_API_KEY”)

에이전트 세션 시작

session = client.managed_agents.sessions.create( agent_id=”client-onboarding-agent”, initial_prompt=”신규 고객 Kim Chulsu의 온보딩을 시작하세요.” )

print(f”Session ID: {session.id}”) print(f”Status: {session.status}”) “`

3단계 — 모니터링 및 이벤트 구독

세션 ID로 진행 상황을 폴링하거나 웹훅으로 이벤트를 수신합니다.

“`python

세션 상태 조회

session_status = client.managed_agents.sessions.get(session_id=session.id)

for event in session_status.events: print(f”[{event.type}] {event.content}”) “`

실제 엔드포인트와 파라미터 상세는 공식 문서(platform.claude.com/docs/en/managed-agents/overview)를 기준으로 하세요. API 스펙은 베타 단계에서 변경될 수 있습니다.

한계점과 주의사항

장점만 보면 반쪽짜리 정보입니다. 도입 전 반드시 알아야 할 제약을 솔직하게 정리합니다.

현재 베타 · 연구 프리뷰 기능 존재

멀티 에이전트 오케스트레이션과 자동 프롬프트 정제 기능은 아직 연구 프리뷰 단계입니다. 프로덕션 핵심 경로에 이 기능을 사용하는 것은 아직 시기상조입니다. 안정화 일정도 공개되지 않았습니다.

벤더 종속성

Managed Agents는 인프라 전반을 Anthropic에 위임하는 구조입니다. 샌드박스, 세션 로그, 크레덴셜 Vault 모두 Anthropic 플랫폼 위에서 동작하므로, 서비스 장애 또는 정책 변경 시 대응이 어렵습니다. 규제 산업(금융, 의료)이나 데이터 주권이 중요한 기업은 자사 VPC 피어링 또는 온프레미스 배포 가능 여부를 확인해야 합니다.

비용 예측의 어려움

런타임 비용 $0.08/시간은 단순해 보이지만, 에이전트가 대기 중인 시간도 과금 대상인지, 여러 서브 에이전트를 병렬 실행할 때 각각 별도 과금되는지 등 세부 정책을 반드시 확인해야 합니다. 대규모 플릿을 운영하는 경우 예상보다 높은 청구가 발생할 수 있습니다.

컨텍스트 엔지니어링 여전히 필요

Managed Agents가 인프라를 추상화하더라도, 좋은 에이전트를 만드는 핵심은 여전히 프롬프트와 컨텍스트 설계에 있습니다. 하니스를 직접 짜지 않아도 되지만, 에이전트가 무엇을 해야 하는지, 어떤 도구를 쓸지, 어떤 조건에서 멈출지는 여전히 개발자가 설계해야 합니다.

자주 묻는 질문 (FAQ)

Q1. Claude Managed Agents는 기존 Claude API와 어떻게 다른가요?

기존 Claude API는 단발성 요청-응답(request-response) 방식입니다. 에이전트 루프, 도구 실행, 상태 관리는 모두 개발자가 직접 구현해야 합니다. Claude Managed Agents는 이 인프라 전체를 Anthropic이 호스팅하는 서비스입니다. 기존 API는 “Claude 모델을 빌린다”는 개념이라면, Managed Agents는 “Claude가 포함된 에이전트 플랫폼을 빌린다”는 개념에 가깝습니다.

Q2. 요금이 시간당 $0.08이면 월 비용은 얼마나 되나요?

24시간 × 30일 연속 실행 기준으로 월 $57.6(약 8만 4천 원)이 런타임 비용으로 발생합니다. 여기에 Claude 모델 토큰 사용 비용이 별도로 추가됩니다. 실제로는 에이전트가 항상 실행 중인 게 아니라 필요할 때만 동작하므로, 많은 사용 사례에서 실제 비용은 이보다 낮습니다.

Q3. 기존에 직접 구축한 에이전트를 마이그레이션할 수 있나요?

가능하지만 작업이 필요합니다. 특히 기존 하니스 로직, 세션 관리 방식, 도구 호출 구조가 Managed Agents의 인터페이스(execute, provision, wake, emitEvent 등)와 다를 수 있습니다. Anthropic은 MCP(Model Context Protocol)를 지원하므로, MCP 기반으로 도구를 먼저 래핑하면 마이그레이션이 수월합니다.

Q4. 멀티 에이전트 기능은 언제 정식 출시되나요?

현재 연구 프리뷰(research preview) 상태이며, 정식 출시 일정은 공개되지 않았습니다. 복잡한 작업을 서브 에이전트로 분기하는 기능이 포함되어 있으며, 내부 테스트에서 자동 프롬프트 정제 기능이 태스크 성공률을 최대 10점까지 향상시킨 것으로 알려졌습니다. 프로덕션 적용은 정식 출시 후가 안전합니다.

Q5. 보안 측면에서 자체 구축 대비 더 안전한가요?

Managed Agents의 보안 설계는 크레덴셜이 샌드박스에 절대 노출되지 않는다는 원칙을 구조적으로 구현하고 있습니다. Git 토큰은 초기화 시점에만 사용되고, 외부 API 크레덴셜은 MCP 프록시와 Vault를 통해 간접 호출됩니다. 반면 자체 구축 시 크레덴셜 관리를 잘못 설계하면 프롬프트 인젝션 공격에 취약할 수 있습니다. 단, 모든 데이터가 Anthropic 인프라를 통과한다는 점은 규제 요건에 따라 리스크가 될 수 있습니다.

마무리

Claude Managed Agents는 단순한 새 API가 아닙니다. “에이전트 인프라를 누가 책임지는가”라는 질문에 Anthropic이 직접 나서겠다는 선언입니다. 수개월짜리 인프라 구축 작업을 며칠로 줄여주는 실질적인 가치가 있는 것은 사실이지만, 벤더 종속성과 베타 기능의 안정성은 도입 전 신중하게 따져봐야 할 부분입니다. 지금 당장 대규모 에이전트를 구축할 계획이 있다면 파일럿 프로젝트로 먼저 검증해 보길 권합니다. 이 글이 도움이 됐다면 댓글로 의견을 남겨주시고, AI 에이전트 관련 최신 소식이 궁금하다면 블로그를 북마크해 두세요.

핵심 체크리스트

  • Claude Platform 계정을 만들고 Managed Agents 베타 접근 권한을 신청했나요?
  • 에이전트가 수행할 작업을 자연어 또는 YAML로 명확하게 정의했나요?
  • 에이전트가 사용할 도구(Tool) 목록과 각 도구의 자동 실행 여부를 결정했나요?
  • 런타임 비용($0.08/시간)과 모델 토큰 비용을 합산해 월 예산을 산정했나요?
  • MCP를 통해 기존 외부 도구를 연동하거나, OAuth 토큰을 Vault에 등록했나요?
  • 세션 ID를 저장해 장애 시 wake(sessionId)로 재개할 수 있는 흐름을 설계했나요?
  • 멀티 에이전트 · 자동 프롬프트 정제 기능은 프리뷰 상태임을 인지하고 프로덕션에 적용하지 않기로 했나요?
  • Claude Platform 대시보드에서 에이전트 실행 로그와 도구 사용 내역을 모니터링할 수 있도록 설정했나요?
  • 데이터 주권 또는 규제 요건상 Anthropic 인프라에 데이터를 보내도 문제없는지 법무 · 컴플라이언스 팀에 확인했나요?
  • 파일럿 에이전트를 소규모로 먼저 실행해 비용과 성능을 검증했나요?
접속 - | 오늘 - | 어제 - | 전체 -
위로 스크롤