더 효과적인 AI 에이전트 구축

채널 아이콘
Anthropic 구독자 70,600명

요약

이 영상은 Anthropic의 Alex와 Erik이 Claude 에이전트의 강점과 이를 활용한 더 효과적인 AI 에이전트 구축 방법을 설명합니다. Claude가 오픈 엔디드 환경에서 반복 학습과 RL(강화 학습)을 통해 에이전트로서 능력을 키우는 과정과 코딩을 기반으로 한 아티팩트 생성 방식을 소개합니다. 또한 Claude Code SDK와 Skills 기능을 활용해 개발자가 복잡한 에이전트 루프와 도구 통합을 손쉽게 구현하는 방법을 살펴봅니다. 마지막으로 워크플로우에서 멀티-에이전트로의 진화, 관측성 문제, 그리고 앞으로의 에이전트 활용 전망을 다룹니다.

주요 키워드

Agent Loop Reinforcement Learning (RL) Claude Code SDK Skills Multi-Agent Observability Computer Use Workflow of Agents Coding Agent

하이라이트

  • 🔑 Claude는 오픈 엔디드 문제 해결과 RL(강화 학습) 훈련을 통해 에이전트 역할을 연습하며 탁월한 성능을 발휘합니다.
  • ⚡️ 코딩 에이전트로 훈련된 Claude는 Python 스크립트나 SVG 생성 코드를 작성해 복잡하고 반복적인 작업을 빠르게 처리할 수 있습니다.
  • 🛠️ Claude Code SDK는 핵심 에이전트 루프, 도구 실행, 파일 상호작용 기능을 제공해 개발자의 개발 비용을 크게 줄여줍니다.
  • 🌟 Skills 기능을 통해 프레젠테이션 템플릿, 이미지, 코드 등 다양한 파일을 에이전트에게 주입해 즉시 활용 가능한 역량으로 업그레이드합니다.
  • 🚀 에이전트 기반 루프는 기존의 워크플로우보다 높은 품질을 보이며, 싱글샷 응답보다 지속적 피드백을 통한 개선이 가능합니다.
  • 📊 멀티-에이전트를 활용하면 부모 에이전트가 여러 서브 에이전트를 동시에 배치해 병렬로 작업 속도를 높이고 맥락을 보존할 수 있습니다.
  • 🔍 복잡한 멀티-에이전트 시스템에서는 관측성(Observability)이 어려워지므로, 처음엔 단순 구조로 시작해 점진적으로 확장하는 접근이 중요합니다.
  • 🔮 향후 에이전트는 스스로 개발한 코드를 테스트·검증하고 컴퓨터 UI를 직접 조작해 Google Docs나 웹 앱 등 다양한 도메인에서 활용될 전망입니다

용어 설명

Agent

사용자 목표를 달성하기 위해 스스로 계획, 실행, 검증 과정을 반복하는 AI 구성 요소

Reinforcement Learning (RL)

행동과 보상 체계를 통해 장기적인 목표 달성을 학습하는 강화 학습 기법

Agent Loop

에이전트가 도구를 호출하고 결과를 평가하며 반복적으로 작업을 완성하는 순환 구조

Claude Code SDK

Claude 기반 에이전트를 쉽게 구축하기 위해 에이전트 루프, 도구 실행, 파일 작업 등을 통합 제공하는 라이브러리

Skills

에이전트에게 템플릿, 이미지, 코드, 데이터 등 다양한 리소스를 주입해 즉시 활용하도록 돕는 기능

Observability

에이전트 시스템의 내부 작동 과정을 모니터링하고 검증할 수 있는 가시성 수준

Multi-Agent

여러 개의 에이전트를 병렬 또는 협업 방식으로 운영해 성능과 신뢰도를 높이는 구조

[00:00:18] 소개 및 주제 개요

Alex(Claude Relations 리드)와 Erik(멀티-에이전트 연구)가 더 효과적인 AI 에이전트 구축을 주제로 대화를 시작하며, 오늘 다룰 핵심 내용을 소개합니다.

Alex와 Erik이 소개하며, 오늘 세션에서 더 효과적인 AI 에이전트 구축 방법에 대해 다룰 것임을 안내합니다.
[00:00:34] Claude가 에이전트 작업에 강한 이유

Claude는 훈련 단계에서 오픈 엔디드 문제를 해결하며 여러 단계를 거쳐 도구를 활용해 보는 연습을 반복해 에이전트 역량을 쌓았습니다.

Claude의 에이전트 역량이 뛰어난 이유를 설명합니다. 훈련 과정에서 개방형 문제를 통해 여러 단계의 작업과 도구 사용, 탐색 능력을 연습했기 때문입니다.
코딩 능력이 다른 도메인으로 전이되지 않는다는 일반적 인식에 대해 반박합니다. 뛰어난 코딩 에이전트는 API 활용, 스케줄링 등 다양한 작업을 수행할 수 있다고 설명합니다.
[00:01:15] 코딩 에이전트로서의 훈련

코딩, 검색 등 다양한 환경에서 RL과 기타 훈련 기법을 적용해 Claude는 적은 가이드만으로도 긴 러닝태스크 수행 능력을 익혔습니다.

타임라인 정보가 없습니다.

[00:01:57] 코드 기반 아티팩트 자동 생성

최근 Claude 웹 기능으로 Python 스크립트를 작성해 엑셀 시트나 SVG 다이어그램 파일을 자동으로 생성하는 사례를 통해 코드 활용의 이점을 설명합니다.

Claude AI 웹 기능의 실제 사례를 소개합니다. Python 스크립트 작성을 통해 Excel 파일 생성 등 실제 파일을 만들 수 있는 기능에 대해 설명합니다.
Erik의 실제 경험 사례를 공유합니다. Claude가 SVG 직접 작성과 코드 생성을 통해 프레젠테이션용 다이어그램을 효과적으로 제작한 사례를 설명합니다.
Claude가 코드를 작성해 SVG 파일을 생성했는데, 이는 Claude가 직접 반복적인 패턴을 그리는 것보다 훨씬 빠르게 실행되었다.
[00:02:57] Claude Code SDK 활용법

개발자가 API 호출부터 루프, 도구 관리, 파일 상호작용까지 직접 구현할 필요 없이 Claude Code SDK를 통해 맞춤형 에이전트를 빠르게 구축하는 방법을 다룹니다.

많은 경우에 코드를 작성해서 결과물을 생성하는 것이 직접 만드는 것보다 효율적이며, 사람이 마우스로 할 수 없는 속도로 반복 작업을 처리할 수 있다.
개발자들이 Claude로 에이전트를 구축할 때 Claude Code SDK가 인기를 끌고 있다. 이는 코딩 에이전트뿐만 아니라 범용 에이전트로 사용할 수 있다.
이전에는 에이전트를 구축하려면 API부터 시작해서 루프, 도구, 파일 상호작용, MCP 등을 모두 직접 만들어야 했지만, Claude Code SDK에는 이미 모든 것이 구축되어 있다.
개발자들은 핵심 에이전트 루프를 다시 만들 필요 없이 Claude Code SDK를 사용하고, 자신만의 커스텀 비즈니스 로직과 도구를 MCP를 통해 추가할 수 있다.
Claude Code는 코딩뿐만 아니라 다양한 용도로 활용되고 있으며, 데이트 계획 같은 웹 검색 기반 작업에도 효과적으로 사용할 수 있다.
Claude MD 파일이라는 새로운 기능이 소프트웨어 엔지니어들 사이에서 인기를 끌고 있으며, 이를 통해 프로그래밍 스타일이나 디렉토리 구조 등의 정보를 Claude에게 제공할 수 있다.
Claude Skills라는 새로운 개념을 소개하며, 이는 단순한 메모 파일을 넘어 파워포인트 템플릿, 코드, 이미지 등 다양한 파일을 제공할 수 있는 확장 기능이라고 설명합니다.
[00:05:23] Skills로 에이전트 역량 확장

프레젠테이션 템플릿, 코드 스니펫, 이미지 자산 등을 파일 형태로 제공하는 Skills 개념을 소개하고, 'The Matrix'의 정보 주입 비유로 설명합니다.

Skills의 실용성을 설명하며, 프레젠테이션 제작 시 지시사항뿐만 아니라 회사 경영진 프로필 사진까지 재사용 가능한 형태로 제공할 수 있다고 강조합니다.
매트릭스의 쿵푸 학습 장면에 비유하며, Claude에게 스킬을 제공하면 갑자기 해당 분야의 전문가가 되는 것과 같다고 설명합니다.
[00:06:43] 워크플로우에서 에이전트로의 진화

정해진 단계 워크플로우에서 모델 루프 기반의 에이전트로 전환된 과정과, 다시 에이전트들을 체인으로 연결하는 ‘워크플로우 오브 에이전트’ 개념을 검토합니다.

몇 달 전 대화를 회상하며, 당시 워크플로에서 단일 에이전트 시스템으로의 전환 시기였다고 언급하고, 그 이후의 발전 상황에 대해 질문합니다.
Claude의 피드백 응답과 자체 수정 능력이 크게 향상되어, 절대적인 품질이 중요한 작업에서 에이전트 루프가 워크플로를 극적으로 능가한다고 설명합니다.
'에이전트의 워크플로'라는 새로운 개념을 소개하며, 이전의 단계별 워크플로 방식의 한계를 설명합니다. SQL 명령 실패 시 전체 워크플로가 망가지는 문제를 예시로 듭니다.
워크플로의 각 단계는 단순한 일회성 시도가 아닌 닫힌 루프로 작동합니다. Claude가 SQL 쿼리를 실행하고 결과를 확인한 후 올바른 값을 얻을 때까지 반복적으로 개선하여 다음 단계로 넘어갑니다.
프롬프트 연결에서 에이전트 루프 연결로의 진화에 대해 논의하며, 관찰가능성과 검증이라는 새로운 중요한 도전 과제를 소개합니다.
[00:08:31] 관측성(Observability) 및 검증 이슈

시스템 복잡도가 높아질수록 가시성 확보가 어려워지므로, 단순한 솔루션에서 출발해 필요에 따라 복잡도를 단계적으로 추가하는 전략을 제안합니다.

에이전트의 관찰가능성은 시스템이 복잡해질수록 어려워지는 문제입니다. 모델의 능력이 향상되었음에도 불구하고 단순함의 중요성을 강조하며, 가장 간단한 것부터 시작해서 점진적으로 복잡성을 추가해야 한다고 설명합니다.
멀티 에이전트와 에이전트 워크플로의 차이점을 명확히 구분합니다. 워크플로는 순차적 진행이지만, 멀티 에이전트는 여러 Claude가 동시에 병렬 작업을 수행하는 방식입니다.
[00:09:43] 멀티-에이전트 개념과 차별점

멀티-에이전트는 여러 에이전트를 병렬로 운영해 작업 속도와 품질을 개선하는 구조로, 워크플로우 기반 에이전트와의 차이점을 명확히 구분합니다.

깊이 있는 연구 검색 제품과 Claude Code에서 멀티 에이전트 시스템의 실제 활용 사례를 소개합니다. 오케스트레이터 에이전트가 하위 에이전트들을 생성하여 병렬 검색을 수행하고, 메인 컨텍스트를 보호하면서 효율적으로 작업을 처리합니다.
Claude의 서브에이전트 시스템에 대한 설명으로, 서브에이전트가 Claude가 호출할 수 있는 도구처럼 작동하며 프롬프트를 매개변수로 전달받아 작업을 수행한다고 설명합니다.
Claude를 더 나은 매니저로 훈련시키는 연구에 대해 논의하며, 초보 매니저처럼 불완전하거나 불명확한 지시를 주는 실수를 한다고 설명합니다.
서브에이전트 훈련을 통해 Claude가 더 장황하고 상세해지며, 전체적인 맥락을 제공하여 더 나은 작업을 할 수 있도록 학습한다고 설명합니다.
[00:12:27] 실패 모드, 모범 사례 및 미래 전망

과도한 커뮤니케이션이 효율을 떨어뜨리는 실패 사례를 공유하고, 단순함에서 출발할 것, 에이전트 관점으로 도구 설계할 것 등의 모범 사례를 제안하며 향후 에이전트가 스스로 코드를 검증·테스트하고 컴퓨터 UI를 직접 조작할 미래를 전망합니다.

멀티에이전트의 다양한 사용 사례를 논의하며, 코딩, 병렬화, MapReduce 작업, 그리고 여러 출력 부분을 나누어 처리하는 것의 효과성에 대해 설명합니다.
멀티에이전트를 테스트 타임 컴퓨트의 형태로 활용하는 방법을 설명하며, 여러 Claude가 협력하여 더 나은 결과를 얻을 수 있다고 언급합니다.
에이전트 특화에 대한 질문과 답변으로, 같은 작업을 여러 에이전트에게 주어 다양한 접근 방식을 시도해볼 수 있다고 설명합니다.
서로 다른 접근 방식을 통해 같은 문제를 해결하는 다중 에이전트의 활용법을 설명합니다. 많은 도구를 가진 시스템에서는 도구를 서브에이전트 단위로 분할하여 각 서브에이전트가 약 20개 정도의 도구만 관리하도록 하는 것이 효과적입니다.
수천 개의 Claude 인스턴스를 동시에 사용하는 대규모 확장의 가능성과 그로 인한 혼란 발생 여부에 대해 논의합니다. 아직 실험해보지 않은 흥미로운 연구 주제로 여겨집니다.
멀티에이전트 시스템의 주요 실패 모드들을 설명합니다. 과도한 구축으로 인한 효율성 저하, 에이전트들 간의 과도한 커뮤니케이션으로 인한 실제 작업 진척 부족 등이 주요 문제점입니다. 인간 조직과 유사한 패턴을 보입니다.
에이전트 개발을 시작하는 개발자들을 위한 모범 사례를 제시합니다. 간단하게 시작하고 필요한 복잡성만 추가하며, 에이전트의 관점에서 생각하여 충분한 정보를 제공하는 것이 중요합니다. 모델은 제공된 정보만 볼 수 있다는 점을 항상 고려해야 합니다.
MCP와 도구 구축 시 흔히 하는 잘못된 접근법을 지적합니다. MCP나 도구를 API와 일대일로 대응시키려는 본능적 접근은 잘못된 것임을 강조합니다.
에이전트 도구는 API보다는 UI와 일대일로 대응되어야 한다는 중요한 설계 원칙을 설명합니다. 모델은 사용자처럼 작동하므로, 여러 API 호출보다는 모든 정보가 한 번에 제시되는 것이 효율적입니다.
에이전트의 미래에 대해 소프트웨어 엔지니어링과 같은 검증 가능한 영역부터 시작하여 더욱 널리 퍼질 것으로 예측합니다. 코딩 에이전트가 이미 많은 사람들의 작업 방식을 바꾸었다고 강조합니다.
에이전트의 자체 검증 능력 향상의 중요성을 논의합니다. 컴퓨터 사용 기능을 통해 웹앱을 작성하고 직접 테스트하여 버그를 찾을 수 있다면, 사용자가 QA 역할을 할 필요가 없어진다고 설명합니다.
멀티 에이전트를 테스트 타임 컴퓨트의 한 형태로 활용하는 것도 흥미로운 탐구 영역이 많을 것 같습니다.
기본적으로 여러 Claude가 문제를 함께 해결하도록 하면
하나의 Claude보다
더 나은 최종 답안을 얻을 수 있습니다.
안녕하세요, 저는 Anthropic에서 Claude Relations을 담당하는 Alex입니다.
오늘은 더 효과적인 에이전트를 구축하는 방법에 대해 이야기하겠습니다.
동료와 함께 진행하겠습니다.
저는 Erik이고, Anthropic에서
멀티 에이전트 연구를 하고 있습니다.
Erik, 먼저
Claude가 에이전트 작업에 이렇게 뛰어난 이유를 설명해 주시겠습니까?
네, 물론입니다.
훈련 과정에서 Claude가 에이전트 역할을 연습할 수 있도록 했습니다.
개방형 문제를 제공해서
여러 단계를 거쳐 작업할 수 있도록 하고
도구를 사용하고, 현재 상황과 작업 내용을 탐색한 후
최종 답안을 제시하도록 했습니다.
에이전트로서 많은 연습을 통해
Claude가 이 분야에서 정말 뛰어나게 되었습니다.
그러니까 장기간 실행되는 작업들이고
다양한 도메인에서 말이죠.
강화학습과 기타 훈련 메커니즘을 통해
Claude는 제한적인 가이드나 피드백만으로도
이런 작업들을 수행하는 목표를 학습하게 됩니다.
맞습니다. 코딩 작업이나
검색 작업 등에서 대량의 강화학습을 진행했습니다.
다양한 환경에서 Claude가 에이전트로서 연습할 수 있도록 한 것이죠.
Claude 모델에 대한 일반적인 인식으로
코드 분야에서 정말 강력하다고 하지만
그것이 다른 도메인으로 전이되지 않거나
코딩이 별개의 영역이라는 생각이 있는데
이에 대한 당신의 견해는 어떠신가요?
코딩이 우리가 처음으로 집중한 작업입니다만
뛰어난 코딩 에이전트가 있다면
그 코딩 에이전트는 다른 종류의 작업도 수행할 수 있습니다.
검색이 필요하다면 API를 통해 웹 검색을 할 수 있고
주말 계획을 세우는 것도 가능합니다.
스케줄을 만들어서 말이죠.
우리는 코딩을 매우 기본적인 기술로 보고 있고
이것이 파급효과를 통해
Claude가 모든 종류의 작업에서 뛰어나게 만들 것입니다.
가장 어려운 것부터 훈련하면
나머지는 모두 쉬워진다는 접근 방식이죠.
최근에 웹의 Claude AI에서 출시한
기능 중 흥미로운 점은
Claude가 코드 작성을 통해
실제 파일을 생성할 수 있다는 것입니다.
Python 스크립트를 작성하고
그 스크립트가 실행되면
갑자기 Excel 시트가 나타나는 식이죠.
이것이 우리가 나아가고 있는
미래 방향인가요?
Claude가 스크립트를 작성하고
컴퓨터에서 작업을 수행해서
파일을 만들거나
전통적으로 코드와 관련 없던
작업들을 수행하는 것 말이죠?
그것이 Claude가 이런 작업들을
수행할 수 있는 정말 효과적인 방법 중 하나라고 생각합니다.
실제로 며칠 전에 Claude가
프레젠테이션용 다이어그램 제작을 도와줬는데
SVG를 직접 작성해서
파일을 생성할 수 있었습니다.
그런데 더 상세한 다이어그램이 필요해서
많은 반복 작업이 필요했는데
Claude가 SVG를 생성하는 코드를 작성해서
실제로 이를 수행할 수 있었습니다.
Claude 자체보다 훨씬, 훨씬 빠르게 실행되었어요
Claude가 직접 작성해야 했다면
정말 반복적인 이미지 파일이었거든요
수많은 세밀한 패턴들이 들어있는
- 네. - 네, 맞습니다
많은 경우에 코드를 작성해서
어떤 결과물을 생성하는 것이
직접 그 결과물을 만들려고 시도하는 것보다 훨씬 낫습니다
더 어려운 경우를 처리하는 한 가지 방법이죠
- 아, 맞네요
코드는 이런 속도 향상을 가능하게 해줍니다
사람이 마우스로 클릭하고 드래그하는 것으로는
컴퓨터에서 할 수 없는 속도죠
반복적인 작업 같은 것들 말이에요
- 바로 그겁니다. Claude는 for 루프를 사용할 수 있어요
- 네, 만약 여러분이 개발자이고
Claude로 에이전트를 구축하고 있다면
최근에 정말 인기를 끌기 시작한 것 중 하나가
Claude Code SDK입니다
이것이 무엇인지
그리고 개발자들이 어떻게 사용하기 시작하고 있는지 설명해 주실 수 있나요?
- 네, 개발자들이
Claude Code SDK를 사용하는 것에 대해 정말 기대하고 있습니다
이전에 만약 여러분이
코딩 에이전트나 어떤 에이전트든 구축하고 싶었다면
정말 아무것도 없는 상태에서
API 엔드포인트만 호출하는 것부터 시작해서
반복문을 직접 구축하고, 모든 도구를 구축하고
이런 도구들을 실행하고
파일과 상호작용하고, MCP와 상호작용하는 모든 것을 해야 했어요
우리는 기본적으로 이 모든 것을 Claude Code에 이미 구축해 놓았습니다
이름은 Claude Code이지만
실제로 Claude Code는 범용 에이전트입니다
코드에 가장 자주 사용되는 것뿐이에요
네, 저희는 많은 개발자들이 이 SDK를 사용하도록 권장하고 있습니다
에이전트 루프의 핵심으로 말이죠
그렇게 하면 개발자들이 많은 시간을 들여서
저희가 이미 많은 시간을 투자해서
다듬고 완성한 핵심 에이전트 루프를 다시 만들 필요가 없어요
대신 그것을 사용하고
자신만의 도구를 추가하면 됩니다
자신만의 커스텀 비즈니스 로직이나
MCP를 통해 기능을 제공할 수 있어요
- 맞습니다, 그런 커스터마이징 가능성을 제공해서
코딩 전용 부분을 제거할 수 있군요
- 정확합니다 - 그리고
필요한 프롬프트나 도구를 넣으면
스캐폴드에 깔끔하게 들어맞습니다
- 네, 사람들이
Claude Code를 온갖 용도로 사용하고 있다고 생각해요
제가 Claude Code를 가장 이상하게 사용한 건
한번은 데이트를 계획하게 했을 때였어요
웹 검색을 여러 번 해서
지역의 흥미로운 활동과 레스토랑을 찾았는데
코드와는 전혀 관련이 없었지만 모든 도구가 있으니까요
- 데이트는 어떠셨나요?
- 꽤 좋았어요
훌륭했어요, 네 - Claude가 잘했군요?
- 네, 필롤리 가든스와
근처의 중국 레스토랑이었어요
- 와, 인상적이네요 - 네
- 인상적입니다 - 네
Claude Code의 또 다른 기능으로
최근에 많은 소프트웨어 엔지니어들이 사용하는
인기 있는 기능을 봤는데요
Claude MD 파일입니다
이런 파일들은 프로젝트 내에서
정의하는 파일들이고
Claude에게 관련 정보를 제공합니다
여러분의 프로그래밍 스타일이나
디렉토리 구조 같은 것들에 대해서요
그런 것들 말이에요
저희는 이제 비슷한 개념을 출시했습니다
한 단계 더 나아간 Skills라는 개념을 출시했어요.
Skills가 무엇인지 설명해 주실 수 있나요?
개발자들이 어떻게 사용하기 시작하는지
그리고 이것이 에이전트에게 어떤 의미인지요?
네, Claude Skills는 정말 흥미로운 확장 기능입니다.
Claude MD 파일에서 단순히 메모 파일을 제공하는 것이 아니라
어떤 종류의 파일이든 제공할 수 있어요.
파워포인트 템플릿 파일이 될 수도 있고, 코드가 될 수도 있고
Claude가 사용할 도우미 스크립트가 될 수도 있어요.
이미지나 자산이 될 수도 있고요.
단순한 지시사항뿐만 아니라
에이전트가 사용할 리소스를 제공하는 이런 확장은
정말, 정말 강력한 도구라고 생각해요. 예를 들어
단순히 파워포인트 프레젠테이션을 만드는 지시사항뿐만 아니라
회사 경영진의 프로필 사진들까지 제공할 수 있어요.
여러 프레젠테이션에서 재사용해야 할 수도 있는
그런 자료들을 모두 Claude에게
재사용 가능한 형태로 제공하는 거죠.
그러면 Claude는 필요한 모든 것을 바로 거기서 가져올 수 있어요.
내부적으로 들었던 비유 중에
정말, 정말 마음에 드는 게 있어요.
"매트릭스"에서 네오가
처음으로 쿵푸를 배울 때
쿵푸 정보를 주입받으면
갑자기 쿵푸 마스터가 되잖아요.
제가 Claude에게 스킬을 제공할 때와 매우 비슷해요.
예를 들어, 스프레드시트 만드는 방법을 알려주면
갑자기 Claude가
은행가가 되어서
제게 재무 모델을 만들어 줄 수 있어요.
그리고 그들이 사용할 수 있도록 모든 장비와
도구들을 로드하는 것과도 같아요.
맞아요.
단순한 지시사항이 아니라 이런 것들로 시작할 수 있어요.
네, 정말 좋아요.
화제를 조금 바꿔서
지난번에 몇 달 전에 여기서 카메라 앞에서 이야기했을 때
에이전트에 대해 얘기했었는데
그때는 워크플로에서
프롬프트를 연결하는 매우 정의된 방식에서
단일 에이전트 시스템으로
전환하는 시기였어요.
모델을 루프로 실행하는 방식으로요.
그 이후로 이 분야에서 어떤 발전이 있었나요?
네, 에이전트가 워크플로를 대체하는 것을 정말 많이 봤어요.
Claude가 피드백에 응답하고
자신의 작업을 수정하는 데 정말 뛰어나졌거든요.
그래서 이제 에이전트 루프가 워크플로를
절대적인 품질이 가장 중요한 대부분의 작업에서
극적으로 능가해요.
워크플로도 여전히 좋아요.
매우 낮은 지연시간이 필요하고
Claude가 한 번에 최선의 답변을 주기를 원할 때요.
하지만 에이전트는 이제 정말, 정말 높은 성능을 보여줘요.
그 이후로 발전한 것 중 하나는
제가 '에이전트의 워크플로'라고 부르는 것이에요.
이전에는 애플리케이션이
Claude가 한 번에
데이터를 로드하기 위해 SQL 명령을 작성하는
워크플로를 가지고 있었다면
그 다음 워크플로 단계에서 그 데이터를 표시하기 위한 차트를 작성했어요.
만약 SQL 명령이 실패하면
데이터가 반환되지 않는다는 걸 모르고
그러면 워크플로의 두 번째 단계가—
맞아요.
완전히 망가져 버려요.
하지만 이제는 각각의 단계가
워크플로의 각 단계가 실제로는 닫힌 루프입니다
단순히 한 번의 시도로 SQL 쿼리를 작성하는 것이 아니라
실행한 후 Claude가 결과를 확인하고
계속 반복하며 개선할 수 있습니다
올바른 값을 얻었다고 확신할 때까지 말이죠
그리고 나서야 워크플로의 다음 단계로 넘어갑니다
네, 흥미롭네요
그렇죠, 이런 진화과정이 있는 것 같아요
프롬프트를 연결하는 것에서
이제는 에이전트들을 이런 루프로 연결하는 것까지
앞으로 어떻게 발전할지 지켜봐야겠네요
또 다른 중요한 논의 주제로는
최근에 훨씬 더 많은 관심을 받고 있는
관찰가능성과 검증에 관한 문제가 있습니다
그 과제가 무엇인지 설명해 주실 수 있나요?
그리고 사람들이 어떻게 접근하고 있는지도요
네, 에이전트의 관찰가능성은 정말 어려운 문제입니다
특히 시스템이 더 복잡해질수록 말이죠
그래서 제가 여전히 믿고 있는 이유 중 하나가
여전히 정말로 중요하다고 생각하는 것이
모델이 오늘날 1년 전보다 훨씬 더 능력이 있고
에이전트나 더 복잡한 설정에서 더 잘 작동할 수 있지만
에이전트나 더 복잡한 구성에서도
단순함이 여전히 정말 중요한 요소라고 생각합니다
큰 에이전트 워크플로를 구축할 수 있다고 해도
여전히 시작은
가장 간단한 것부터
그다음에 더 복잡한 솔루션으로 발전시켜 나가야 합니다
먼저 원샷으로 시도해보는 것부터 말이죠
또는 Claude Code SDK에 단일 프롬프트를 시도해보는 것
이제는 정말 간단하고 쉽게 사용할 수 있거든요
그리고 필요에 따라서만 레이어를 추가해야 합니다
복잡성의 레이어를 말이죠
그래야 관찰가능성을 더 어렵게 만들지 않거든요
에이전트 워크플로와 병행하여 나오는 또 다른 용어가
멀티 에이전트인데, 이게 같은 것인가요?
아니면 다른 건가요?
네, 멀티 에이전트는 제가 현재 주력 연구 분야입니다
에이전트 워크플로와는 꽤 다르다고 말씀드리겠습니다
네, 에이전트 워크플로는
한 에이전트가 작업을 마치고
완료되면 전환되거나
그 결과가 다음 에이전트로 전달되어 작업하는 방식입니다
멀티 에이전트는 근본적으로 여러 에이전트나
여러 Claude가 동시에 작업하는 것입니다
하나의 상위 에이전트가 작업을 위임하여
다섯 개의 하위 에이전트가 각각 병렬로 작업할 수 있죠
저희 깊이 있는 연구 검색 제품이
바로 이런 방식으로 작동합니다. 메인 오케스트레이터 에이전트가
결정을 내리고 여러 하위 에이전트를 생성합니다
병렬로 많은 검색을 수행할 수 있어서
사용자에게 훨씬 더 좋습니다
모든 것이 병렬로 진행되기 때문에
답을 훨씬 빨리 받을 수 있거든요
Claude Code에서도 비슷한 것을 볼 수 있는데
모델이 하위 에이전트를 사용합니다
만약 어떤 하위 작업이 수만 개의 토큰이 필요하다면
수만 개의 토큰 말이죠
클래스의 특정 구현을 찾는 것처럼 말이죠
하지만 답은 실제로 아주 작은 것으로 귀결됩니다
하위 에이전트에서 그 작업을 수행할 수 있어서
메인 컨텍스트를 모든 것으로부터 보호합니다
메인 작업에 필요하지 않은 토큰들로부터 말이죠
네, 기본적으로 이 작업 부분을 오프로드하고
필요한 최종 답변만 받아올 수 있습니다
그러면 이 경우에 하위 에이전트를 노출하는 건가요?
Claude가 호출할 수 있는 도구처럼 작동하는 건가요?
맞습니다.
프롬프트를 전달하죠
매개변수 같은 형태로 전달하는 건가요?
정확히 그렇습니다.
Claude에게는 서브에이전트가 도구처럼 보이고
서브에이전트에게 프롬프트를 전달할 수 있어요
그러면 서브에이전트가 작업을 수행하죠
제 연구의 일부는 Claude를 훈련시켜서
더 나은 매니저가 되도록 하는 거예요
오, 흥미롭네요. 명확한 지시를
서브에이전트에게 주고
필요한 것들을 제대로
얻어낼 수 있도록 말이죠
이게 어떻게 다른지,
아니면 전체적인 도구 호출의
특화된 부분인지, 아니면 다른 면이 있나요?
도구 호출의 프레임워크를 사용한다고 말할 수 있어요
커뮤니케이션 프로토콜을 위해서요
그리고 그 도구가 우연히
Claude, 다른 Claude로 뒷받침되는 거죠
Claude가 서브에이전트가 뭔지
직관적으로 이해하나요, 아니면 가르쳐야 하나요?
실제로 너 자신의 다른 버전과
대화하고 있다고, Claude야,
당황하지 말라고 하는 식으로요?
Claude가 초보 매니저들이 저지르는
같은 실수를 많이 한다고 할 수 있어요
불완전하거나 명확하지 않은
지시를 주는 거죠
맞아요. 서브에이전트에게요
맞아요
서브에이전트가
적절한 맥락을 가지고 있을 거라고 기대하는데
실제로는 그렇지 않죠. 그리고
서브에이전트 훈련 중에 본 것은
Claude가 훨씬 더 장황하고 상세해지기 시작한다는 거예요
그리고 서브에이전트에게 전체적인 맥락을 제공해요
무슨 일이 일어나고 있는지 말이죠
그래야 더 나은 작업을 할 수 있고
전체에 도움이 되니까요
확실히 Claude는
배울 게 많고
이것을 더 잘하기 위해 배우고 있어요
알겠습니다
어떤 사용 사례들이 있나요?
검색과 맥락 보존이 하나인데, 다른 것들도 있나요?
사람들이
멀티에이전트를 위해 사용하는 다른 것들이?
네, 코딩이 있죠
코딩에서 서브에이전트를 많이 사용해요
병렬화하거나 MapReduce할 수 있는 모든 것들이요
많은 출력을 생성해야 하거나
생성하는 출력에 10개 부분이 있다면
어떤 출력을 만들 때,
그것을 10개의 서브에이전트로 나눌 수 있다면
맥락을 절약하고 더 빠른 결과를 얻는 데
정말 효과적일 수 있어요
또한 흥미로운 것들을 탐구할 수 있어요
멀티에이전트를 테스트 타임 컴퓨트의 형태로요
기본적으로 Claude가,
많은 Claude들이 문제에 대해 작업하는 것이
하나보다 더 나은 최종 답안을 줄 수 있어요
사람들과 마찬가지로,
여러 사람이 머리를 맞대면
더 나은 결과를 얻을 수 있죠
그런 경우에는 이런 에이전트들을 특화시키나요?
한 유형의 페르소나나 다른 것으로 맞추나요,
아니면 그냥 어떤 형태든 취하도록 두나요?
둘 다 할 수 있다고 생각해요
때로는 여러 사람에게
똑같은 작업을 주고 확인하는 것이 도움이 돼요
서로 다른 답변들이 무엇인지 확인하는 거죠.
때로는 많은 사람들이나
여러 에이전트가 같은 문제에 대해
다른 접근 방식으로 작업하거나 분할하는 것이 좋습니다.
제가 많이 본 사례 중 하나는
100개나 200개 정도의 많은 도구를 가진 고객들이
에이전트가 사용하기를 원할 때,
이런 도구들을 서브에이전트들 사이에
분할하는 것이 정말 효과적이라는 걸 발견했습니다.
그래서 메인 에이전트가 알아야 할 것은
이 도구 묶음을 사용하고 싶다는 것뿐이고
그러면 서브에이전트가 가서
실제 작업을 처리하는 거죠.
그래서 각 서브에이전트는 약 20개 정도의 도구만
이해하고 사용법을 알면 됩니다.
- 에이전트를 끝까지 확장해본 적이 있나요?
예를 들어 Claude 천 개 버전이
하나의 문제에 모두 작업한다면 어떻게 될까요?
그냥 혼란으로 변할까요?
- 아직 해보지 않았습니다. - 그렇군요.
- 하지만 답변 드리겠습니다.
- 정말 좋은 연구 아이디어네요.
에이전트나 멀티에이전트에서
현재 보고 있는 다른 실패 모드들은 무엇인가요?
- 네, 복잡한 시스템과 마찬가지로
뭔가를 과도하게 구축하기 쉽고
효율성을 많이 잃고
많은 불필요한 부담을 만들어내죠.
과도하게 구축된 멀티에이전트 시스템이
서로 대화하는 데만 너무 많은 시간을 쓰고
주 과제에서 실제로 진전을 만들지 못하는
경우를 봤습니다. 그리고 알다시피,
인간 에이전트나 인간 조직도 이런 문제를 겪죠.
회사가 커질수록
커뮤니케이션 오버헤드가 더 많아지고
실제로 수행되는 작업은 점점 줄어들죠.
현장의 사람들이 실제로 진전을 만드는 것 말이에요.
- 그래서 이것도 연구할 흥미로운 주제라고 생각합니다.
Claude들의 조직을 어떻게 하면
오버헤드는 작게 유지하면서 매우 효과적으로 만들 수 있을까요?
- 개발자가 에이전트를 시작하고 싶다면,
Claude Code SDK로 구축하든
아니면 혼자서 시도하든 상관없이,
어떤 팁이나 모범 사례가 있나요?
- 네, 모범 사례는 정말로
간단하게 시작하고 확실히 하는 것입니다.
필요한 복잡성만 추가하세요.
또 다른 정말 중요한 점은
에이전트의 관점에서 생각하는 것입니다.
Claude에게 도구나 프롬프트를 제공할 때나
어떤 기능을 제공할 때는 Claude의 입장이 되어
실제로 받는 것, 모델로서 보는 것을 읽어보고
문제를 해결할 수 있는 충분한 정보가
실제로 있는지 확인하세요.
우리는 모든 것을 보고 있지만
모델은 우리가 보여준 것만 본다는
사실을 잊기가 매우 쉽습니다.
- 맞습니다. - 그리고 그건...
- 네. - 네, 저는 항상
돌아가서 확인하는 것이 중요하다고 생각합니다.
도구 호출의 원시 기록이나
로그와 모든 것을 그냥 보는 것이요.
- 정확히 맞습니다. 또 다른 점은
사람들이 MCP 같은 것들을 더 많이 구축하고
Claude를 더 많은 것들에 연결하려고 할 때,
사람들이 가지는 매우 자연스러운 첫 번째 본능이
매우 잘못된 것인데, 바로 MCP나
도구가 API와 일대일 대응이어야 한다는 생각입니다.
모델을 위한 도구나 MCP는 실제로는
API가 아닌 UI와 일대일로 대응되어야 한다고 생각합니다.
궁극적으로 모델은 이런 것들의 사용자이기 때문입니다.
기존 프로그램처럼 작동하지 않습니다.
API에 세 개의 분리된 엔드포인트가 있다면
예를 들어 Slack 대화를 로드하고
사용자 ID를 사용자명으로 변환하고
채널 ID를 채널명으로 변환하는
그런 도구들을 모델에게 제공한다면
Slack을 이해하기 위해, 무엇이든 이해하기 위해
세 번의 도구 호출을 해야 할 것입니다.
반면 사용자로서는
모든 것이 깔끔하게 렌더링된 상태로 보죠.
- 흥미롭네요. - 그래서 모델을 위한 도구나 MCP를
만들 때는
모든 것을 한 번에 제시하도록 해야 합니다
가능한 한 적은 상호작용으로요.
사용자에게도 끔찍할 것처럼
Slack을 사용할 때마다
사용자 ID를 클릭해야 하고
이름을 확인해야 한다면 말입니다.
- 맞습니다. 좋은 접근이네요.
최종 상태에서 역으로 작업하는 것 같네요
기술 명세를
일대일로 매핑하려고 하는 대신에요.
- 정확합니다. 그리고
필요한 모든 맥락을 함께 포함해야 합니다.
- 에이전트의 미래에 대해 어떻게 생각하시나요?
앞으로
6~12개월에 대한 예측이 있나요?
- 에이전트는 훨씬 더 널리 퍼질 것 같습니다
검증 가능한 영역부터 시작해서요
소프트웨어 엔지니어링 같은 분야에서요.
코딩 에이전트는 이미 제가 일하는 방식을
그리고 Anthropic의 수많은 사람들이 일하는 방식을 바꿨습니다
그리고 여전히 엄청난 잠재력이
있다고 생각합니다.
정말 흥미로운 것 중 하나는 에이전트가
자신의 작업을 검증하는 데 더 나아질 수 있다면
컴퓨터 사용 같은 기능으로 웹앱을 작성하고
실제로 그것을 열어서 테스트하고
자체적으로 버그를 찾을 수 있다면
당신이 그 일을 할 필요가 없죠.
그것이 가장 흥미로운 일 중 하나입니다.
- 네. - 테스트의
루프를 닫는 것처럼
제가 Claude의 QA 엔지니어가 될 필요가 없도록요.
- 맞습니다. 이 모든 것들을 결합하는 거군요
소프트웨어 엔지니어링 능력부터
컴퓨터 사용 능력까지
이 모든 조각들을 함께 맞추면요.
- 네, 그리고 컴퓨터 사용이
다른 많은 길과 영역들을 열어줄 것입니다
지금까지 에이전트가
접근할 수 없었던 영역들을요.
- 그 예시가 무엇일까요?
- Claude가 Google 문서에서
당신을 위해 작업을 하도록 하고 싶다면
- 네. - 지금은
Claude가 당신을 위해 글을 쓸 수 있지만
복사해서 붙여넣기를 계속 해야 합니다.
- 맞습니다. - 하지만 컴퓨터 사용이 있다면
'Claude야, 이 Google 문서를 정리해줄 수 있어?'라고 하면
바로 그 자리에서 해줄 수 있습니다.
스크롤하고, 클릭하고, 텍스트를 편집하며
복사 붙여넣기를 계속 할 필요보다
훨씬 더 좋은 경험입니다.
- 네. - 당신이 어디에 있든
컴퓨터 사용이 있다면 Claude가 함께할 수 있습니다.
- Claude가 제 Google 문서를 작성하고
모든 댓글에 대신 답변해주는 것이 매우 기대됩니다.
- 정확히요. - 그것이
아주 좋은 미래가 될 것입니다.
Erik, 정말 좋았습니다.
대화해주셔서 정말 감사합니다.
- 당연히요, 감사합니다.