[00:00]
멀티 에이전트를 테스트 타임 컴퓨트의 한 형태로 활용하는 것도 흥미로운 탐구 영역이 많을 것 같습니다.
[00:01]
기본적으로 여러 Claude가 문제를 함께 해결하도록 하면
[00:05]
하나의 Claude보다
[00:08]
더 나은 최종 답안을 얻을 수 있습니다.
[00:11]
안녕하세요, 저는 Anthropic에서 Claude Relations을 담당하는 Alex입니다.
[00:18]
오늘은 더 효과적인 에이전트를 구축하는 방법에 대해 이야기하겠습니다.
[00:21]
동료와 함께 진행하겠습니다.
[00:22]
저는 Erik이고, Anthropic에서
[00:24]
멀티 에이전트 연구를 하고 있습니다.
[00:25]
Erik, 먼저
[00:27]
Claude가 에이전트 작업에 이렇게 뛰어난 이유를 설명해 주시겠습니까?
[00:30]
네, 물론입니다.
[00:33]
훈련 과정에서 Claude가 에이전트 역할을 연습할 수 있도록 했습니다.
[00:34]
개방형 문제를 제공해서
[00:35]
여러 단계를 거쳐 작업할 수 있도록 하고
[00:38]
도구를 사용하고, 현재 상황과 작업 내용을 탐색한 후
[00:41]
최종 답안을 제시하도록 했습니다.
[00:43]
에이전트로서 많은 연습을 통해
[00:47]
Claude가 이 분야에서 정말 뛰어나게 되었습니다.
[00:49]
그러니까 장기간 실행되는 작업들이고
[00:51]
다양한 도메인에서 말이죠.
[00:53]
강화학습과 기타 훈련 메커니즘을 통해
[00:54]
Claude는 제한적인 가이드나 피드백만으로도
[00:57]
이런 작업들을 수행하는 목표를 학습하게 됩니다.
[01:00]
맞습니다. 코딩 작업이나
[01:01]
검색 작업 등에서 대량의 강화학습을 진행했습니다.
[01:04]
다양한 환경에서 Claude가 에이전트로서 연습할 수 있도록 한 것이죠.
[01:07]
Claude 모델에 대한 일반적인 인식으로
[01:10]
코드 분야에서 정말 강력하다고 하지만
[01:12]
그것이 다른 도메인으로 전이되지 않거나
[01:15]
코딩이 별개의 영역이라는 생각이 있는데
[01:17]
이에 대한 당신의 견해는 어떠신가요?
[01:20]
코딩이 우리가 처음으로 집중한 작업입니다만
[01:22]
뛰어난 코딩 에이전트가 있다면
[01:24]
그 코딩 에이전트는 다른 종류의 작업도 수행할 수 있습니다.
[01:26]
검색이 필요하다면 API를 통해 웹 검색을 할 수 있고
[01:28]
주말 계획을 세우는 것도 가능합니다.
[01:30]
스케줄을 만들어서 말이죠.
[01:32]
우리는 코딩을 매우 기본적인 기술로 보고 있고
[01:34]
이것이 파급효과를 통해
[01:38]
Claude가 모든 종류의 작업에서 뛰어나게 만들 것입니다.
[01:42]
가장 어려운 것부터 훈련하면
[01:44]
나머지는 모두 쉬워진다는 접근 방식이죠.
[01:48]
최근에 웹의 Claude AI에서 출시한
[01:50]
기능 중 흥미로운 점은
[01:53]
Claude가 코드 작성을 통해
[01:56]
실제 파일을 생성할 수 있다는 것입니다.
[01:57]
Python 스크립트를 작성하고
[02:00]
그 스크립트가 실행되면
[02:04]
갑자기 Excel 시트가 나타나는 식이죠.
[02:08]
이것이 우리가 나아가고 있는
[02:09]
미래 방향인가요?
[02:11]
Claude가 스크립트를 작성하고
[02:13]
컴퓨터에서 작업을 수행해서
[02:15]
파일을 만들거나
[02:17]
전통적으로 코드와 관련 없던
[02:18]
작업들을 수행하는 것 말이죠?
[02:20]
그것이 Claude가 이런 작업들을
[02:23]
수행할 수 있는 정말 효과적인 방법 중 하나라고 생각합니다.
[02:26]
실제로 며칠 전에 Claude가
[02:28]
프레젠테이션용 다이어그램 제작을 도와줬는데
[02:30]
SVG를 직접 작성해서
[02:32]
파일을 생성할 수 있었습니다.
[02:34]
그런데 더 상세한 다이어그램이 필요해서
[02:36]
많은 반복 작업이 필요했는데
[02:38]
Claude가 SVG를 생성하는 코드를 작성해서
[02:41]
실제로 이를 수행할 수 있었습니다.
[02:43]
[02:45]
[02:48]
Claude 자체보다 훨씬, 훨씬 빠르게 실행되었어요
[02:50]
Claude가 직접 작성해야 했다면
[02:51]
정말 반복적인 이미지 파일이었거든요
[02:54]
수많은 세밀한 패턴들이 들어있는
[02:56]
- 네. - 네, 맞습니다
[02:57]
많은 경우에 코드를 작성해서
[03:00]
어떤 결과물을 생성하는 것이
[03:03]
직접 그 결과물을 만들려고 시도하는 것보다 훨씬 낫습니다
[03:05]
더 어려운 경우를 처리하는 한 가지 방법이죠
[03:07]
- 아, 맞네요
[03:08]
코드는 이런 속도 향상을 가능하게 해줍니다
[03:11]
사람이 마우스로 클릭하고 드래그하는 것으로는
[03:13]
컴퓨터에서 할 수 없는 속도죠
[03:16]
반복적인 작업 같은 것들 말이에요
[03:17]
- 바로 그겁니다. Claude는 for 루프를 사용할 수 있어요
[03:18]
- 네, 만약 여러분이 개발자이고
[03:21]
Claude로 에이전트를 구축하고 있다면
[03:23]
최근에 정말 인기를 끌기 시작한 것 중 하나가
[03:25]
Claude Code SDK입니다
[03:26]
이것이 무엇인지
[03:28]
그리고 개발자들이 어떻게 사용하기 시작하고 있는지 설명해 주실 수 있나요?
[03:30]
- 네, 개발자들이
[03:32]
Claude Code SDK를 사용하는 것에 대해 정말 기대하고 있습니다
[03:34]
이전에 만약 여러분이
[03:37]
코딩 에이전트나 어떤 에이전트든 구축하고 싶었다면
[03:40]
정말 아무것도 없는 상태에서
[03:42]
API 엔드포인트만 호출하는 것부터 시작해서
[03:45]
반복문을 직접 구축하고, 모든 도구를 구축하고
[03:48]
이런 도구들을 실행하고
[03:50]
파일과 상호작용하고, MCP와 상호작용하는 모든 것을 해야 했어요
[03:53]
우리는 기본적으로 이 모든 것을 Claude Code에 이미 구축해 놓았습니다
[03:56]
이름은 Claude Code이지만
[03:58]
실제로 Claude Code는 범용 에이전트입니다
[04:01]
코드에 가장 자주 사용되는 것뿐이에요
[04:03]
네, 저희는 많은 개발자들이 이 SDK를 사용하도록 권장하고 있습니다
[04:06]
에이전트 루프의 핵심으로 말이죠
[04:08]
그렇게 하면 개발자들이 많은 시간을 들여서
[04:11]
저희가 이미 많은 시간을 투자해서
[04:14]
다듬고 완성한 핵심 에이전트 루프를 다시 만들 필요가 없어요
[04:17]
대신 그것을 사용하고
[04:19]
자신만의 도구를 추가하면 됩니다
[04:21]
자신만의 커스텀 비즈니스 로직이나
[04:23]
MCP를 통해 기능을 제공할 수 있어요
[04:25]
- 맞습니다, 그런 커스터마이징 가능성을 제공해서
[04:28]
코딩 전용 부분을 제거할 수 있군요
[04:30]
- 정확합니다 - 그리고
[04:31]
필요한 프롬프트나 도구를 넣으면
[04:34]
스캐폴드에 깔끔하게 들어맞습니다
[04:36]
- 네, 사람들이
[04:37]
Claude Code를 온갖 용도로 사용하고 있다고 생각해요
[04:39]
제가 Claude Code를 가장 이상하게 사용한 건
[04:42]
한번은 데이트를 계획하게 했을 때였어요
[04:44]
웹 검색을 여러 번 해서
[04:46]
지역의 흥미로운 활동과 레스토랑을 찾았는데
[04:48]
코드와는 전혀 관련이 없었지만 모든 도구가 있으니까요
[04:51]
- 데이트는 어떠셨나요?
[04:52]
- 꽤 좋았어요
[04:53]
훌륭했어요, 네 - Claude가 잘했군요?
[04:55]
- 네, 필롤리 가든스와
[04:56]
근처의 중국 레스토랑이었어요
[04:57]
- 와, 인상적이네요 - 네
[04:59]
- 인상적입니다 - 네
[05:00]
Claude Code의 또 다른 기능으로
[05:01]
최근에 많은 소프트웨어 엔지니어들이 사용하는
[05:05]
인기 있는 기능을 봤는데요
[05:07]
Claude MD 파일입니다
[05:08]
이런 파일들은 프로젝트 내에서
[05:11]
정의하는 파일들이고
[05:12]
Claude에게 관련 정보를 제공합니다
[05:14]
여러분의 프로그래밍 스타일이나
[05:16]
디렉토리 구조 같은 것들에 대해서요
[05:18]
그런 것들 말이에요
[05:19]
저희는 이제 비슷한 개념을 출시했습니다
[05:21]
한 단계 더 나아간 Skills라는 개념을 출시했어요.
[05:23]
Skills가 무엇인지 설명해 주실 수 있나요?
[05:25]
개발자들이 어떻게 사용하기 시작하는지
[05:27]
그리고 이것이 에이전트에게 어떤 의미인지요?
[05:29]
네, Claude Skills는 정말 흥미로운 확장 기능입니다.
[05:32]
Claude MD 파일에서 단순히 메모 파일을 제공하는 것이 아니라
[05:36]
어떤 종류의 파일이든 제공할 수 있어요.
[05:39]
파워포인트 템플릿 파일이 될 수도 있고, 코드가 될 수도 있고
[05:43]
Claude가 사용할 도우미 스크립트가 될 수도 있어요.
[05:46]
이미지나 자산이 될 수도 있고요.
[05:49]
단순한 지시사항뿐만 아니라
[05:51]
에이전트가 사용할 리소스를 제공하는 이런 확장은
[05:54]
정말, 정말 강력한 도구라고 생각해요. 예를 들어
[05:57]
단순히 파워포인트 프레젠테이션을 만드는 지시사항뿐만 아니라
[05:59]
회사 경영진의 프로필 사진들까지 제공할 수 있어요.
[06:02]
여러 프레젠테이션에서 재사용해야 할 수도 있는
[06:04]
그런 자료들을 모두 Claude에게
[06:06]
재사용 가능한 형태로 제공하는 거죠.
[06:08]
그러면 Claude는 필요한 모든 것을 바로 거기서 가져올 수 있어요.
[06:10]
내부적으로 들었던 비유 중에
[06:13]
정말, 정말 마음에 드는 게 있어요.
[06:14]
"매트릭스"에서 네오가
[06:16]
처음으로 쿵푸를 배울 때
[06:19]
쿵푸 정보를 주입받으면
[06:22]
갑자기 쿵푸 마스터가 되잖아요.
[06:24]
제가 Claude에게 스킬을 제공할 때와 매우 비슷해요.
[06:27]
예를 들어, 스프레드시트 만드는 방법을 알려주면
[06:29]
갑자기 Claude가
[06:30]
은행가가 되어서
[06:32]
제게 재무 모델을 만들어 줄 수 있어요.
[06:34]
그리고 그들이 사용할 수 있도록 모든 장비와
[06:37]
도구들을 로드하는 것과도 같아요.
[06:38]
맞아요.
[06:39]
단순한 지시사항이 아니라 이런 것들로 시작할 수 있어요.
[06:41]
네, 정말 좋아요.
[06:42]
화제를 조금 바꿔서
[06:43]
지난번에 몇 달 전에 여기서 카메라 앞에서 이야기했을 때
[06:48]
에이전트에 대해 얘기했었는데
[06:49]
그때는 워크플로에서
[06:51]
프롬프트를 연결하는 매우 정의된 방식에서
[06:55]
단일 에이전트 시스템으로
[06:57]
전환하는 시기였어요.
[07:00]
모델을 루프로 실행하는 방식으로요.
[07:02]
그 이후로 이 분야에서 어떤 발전이 있었나요?
[07:05]
네, 에이전트가 워크플로를 대체하는 것을 정말 많이 봤어요.
[07:08]
Claude가 피드백에 응답하고
[07:12]
자신의 작업을 수정하는 데 정말 뛰어나졌거든요.
[07:14]
그래서 이제 에이전트 루프가 워크플로를
[07:18]
절대적인 품질이 가장 중요한 대부분의 작업에서
[07:22]
극적으로 능가해요.
[07:23]
워크플로도 여전히 좋아요.
[07:24]
매우 낮은 지연시간이 필요하고
[07:25]
Claude가 한 번에 최선의 답변을 주기를 원할 때요.
[07:28]
하지만 에이전트는 이제 정말, 정말 높은 성능을 보여줘요.
[07:32]
그 이후로 발전한 것 중 하나는
[07:35]
제가 '에이전트의 워크플로'라고 부르는 것이에요.
[07:38]
이전에는 애플리케이션이
[07:40]
Claude가 한 번에
[07:43]
데이터를 로드하기 위해 SQL 명령을 작성하는
[07:45]
워크플로를 가지고 있었다면
[07:48]
그 다음 워크플로 단계에서 그 데이터를 표시하기 위한 차트를 작성했어요.
[07:52]
만약 SQL 명령이 실패하면
[07:56]
데이터가 반환되지 않는다는 걸 모르고
[07:58]
그러면 워크플로의 두 번째 단계가—
[07:59]
맞아요.
[08:01]
완전히 망가져 버려요.
[08:02]
하지만 이제는 각각의 단계가
[08:04]
워크플로의 각 단계가 실제로는 닫힌 루프입니다
[08:06]
단순히 한 번의 시도로 SQL 쿼리를 작성하는 것이 아니라
[08:09]
실행한 후 Claude가 결과를 확인하고
[08:13]
계속 반복하며 개선할 수 있습니다
[08:14]
올바른 값을 얻었다고 확신할 때까지 말이죠
[08:16]
그리고 나서야 워크플로의 다음 단계로 넘어갑니다
[08:19]
네, 흥미롭네요
[08:20]
그렇죠, 이런 진화과정이 있는 것 같아요
[08:24]
프롬프트를 연결하는 것에서
[08:26]
이제는 에이전트들을 이런 루프로 연결하는 것까지
[08:29]
앞으로 어떻게 발전할지 지켜봐야겠네요
[08:31]
또 다른 중요한 논의 주제로는
[08:33]
최근에 훨씬 더 많은 관심을 받고 있는
[08:37]
관찰가능성과 검증에 관한 문제가 있습니다
[08:42]
그 과제가 무엇인지 설명해 주실 수 있나요?
[08:44]
그리고 사람들이 어떻게 접근하고 있는지도요
[08:46]
네, 에이전트의 관찰가능성은 정말 어려운 문제입니다
[08:49]
특히 시스템이 더 복잡해질수록 말이죠
[08:51]
그래서 제가 여전히 믿고 있는 이유 중 하나가
[08:53]
여전히 정말로 중요하다고 생각하는 것이
[08:54]
모델이 오늘날 1년 전보다 훨씬 더 능력이 있고
[08:58]
에이전트나 더 복잡한 설정에서 더 잘 작동할 수 있지만
[09:01]
에이전트나 더 복잡한 구성에서도
[09:03]
단순함이 여전히 정말 중요한 요소라고 생각합니다
[09:06]
큰 에이전트 워크플로를 구축할 수 있다고 해도
[09:10]
여전히 시작은
[09:12]
가장 간단한 것부터
[09:13]
그다음에 더 복잡한 솔루션으로 발전시켜 나가야 합니다
[09:17]
먼저 원샷으로 시도해보는 것부터 말이죠
[09:19]
또는 Claude Code SDK에 단일 프롬프트를 시도해보는 것
[09:23]
이제는 정말 간단하고 쉽게 사용할 수 있거든요
[09:27]
그리고 필요에 따라서만 레이어를 추가해야 합니다
[09:30]
복잡성의 레이어를 말이죠
[09:31]
그래야 관찰가능성을 더 어렵게 만들지 않거든요
[09:33]
에이전트 워크플로와 병행하여 나오는 또 다른 용어가
[09:36]
멀티 에이전트인데, 이게 같은 것인가요?
[09:39]
아니면 다른 건가요?
[09:40]
네, 멀티 에이전트는 제가 현재 주력 연구 분야입니다
[09:44]
에이전트 워크플로와는 꽤 다르다고 말씀드리겠습니다
[09:46]
네, 에이전트 워크플로는
[09:48]
한 에이전트가 작업을 마치고
[09:50]
완료되면 전환되거나
[09:52]
그 결과가 다음 에이전트로 전달되어 작업하는 방식입니다
[09:56]
멀티 에이전트는 근본적으로 여러 에이전트나
[09:59]
여러 Claude가 동시에 작업하는 것입니다
[10:02]
하나의 상위 에이전트가 작업을 위임하여
[10:07]
다섯 개의 하위 에이전트가 각각 병렬로 작업할 수 있죠
[10:10]
저희 깊이 있는 연구 검색 제품이
[10:12]
바로 이런 방식으로 작동합니다. 메인 오케스트레이터 에이전트가
[10:16]
결정을 내리고 여러 하위 에이전트를 생성합니다
[10:18]
병렬로 많은 검색을 수행할 수 있어서
[10:20]
사용자에게 훨씬 더 좋습니다
[10:22]
모든 것이 병렬로 진행되기 때문에
[10:24]
답을 훨씬 빨리 받을 수 있거든요
[10:27]
Claude Code에서도 비슷한 것을 볼 수 있는데
[10:30]
모델이 하위 에이전트를 사용합니다
[10:31]
만약 어떤 하위 작업이 수만 개의 토큰이 필요하다면
[10:34]
수만 개의 토큰 말이죠
[10:36]
클래스의 특정 구현을 찾는 것처럼 말이죠
[10:39]
하지만 답은 실제로 아주 작은 것으로 귀결됩니다
[10:42]
하위 에이전트에서 그 작업을 수행할 수 있어서
[10:44]
메인 컨텍스트를 모든 것으로부터 보호합니다
[10:48]
메인 작업에 필요하지 않은 토큰들로부터 말이죠
[10:50]
네, 기본적으로 이 작업 부분을 오프로드하고
[10:53]
필요한 최종 답변만 받아올 수 있습니다
[10:56]
그러면 이 경우에 하위 에이전트를 노출하는 건가요?
[10:59]
Claude가 호출할 수 있는 도구처럼 작동하는 건가요?
[11:02]
맞습니다.
[11:03]
프롬프트를 전달하죠
[11:04]
매개변수 같은 형태로 전달하는 건가요?
[11:05]
정확히 그렇습니다.
[11:06]
Claude에게는 서브에이전트가 도구처럼 보이고
[11:09]
서브에이전트에게 프롬프트를 전달할 수 있어요
[11:12]
그러면 서브에이전트가 작업을 수행하죠
[11:13]
제 연구의 일부는 Claude를 훈련시켜서
[11:15]
더 나은 매니저가 되도록 하는 거예요
[11:17]
오, 흥미롭네요. 명확한 지시를
[11:19]
서브에이전트에게 주고
[11:20]
필요한 것들을 제대로
[11:21]
얻어낼 수 있도록 말이죠
[11:22]
이게 어떻게 다른지,
[11:23]
아니면 전체적인 도구 호출의
[11:25]
특화된 부분인지, 아니면 다른 면이 있나요?
[11:28]
도구 호출의 프레임워크를 사용한다고 말할 수 있어요
[11:31]
커뮤니케이션 프로토콜을 위해서요
[11:35]
그리고 그 도구가 우연히
[11:37]
Claude, 다른 Claude로 뒷받침되는 거죠
[11:39]
Claude가 서브에이전트가 뭔지
[11:40]
직관적으로 이해하나요, 아니면 가르쳐야 하나요?
[11:43]
실제로 너 자신의 다른 버전과
[11:45]
대화하고 있다고, Claude야,
[11:47]
당황하지 말라고 하는 식으로요?
[11:49]
Claude가 초보 매니저들이 저지르는
[11:53]
같은 실수를 많이 한다고 할 수 있어요
[11:55]
불완전하거나 명확하지 않은
[11:57]
지시를 주는 거죠
[11:58]
맞아요. 서브에이전트에게요
[12:00]
맞아요
[12:01]
서브에이전트가
[12:03]
적절한 맥락을 가지고 있을 거라고 기대하는데
[12:05]
실제로는 그렇지 않죠. 그리고
[12:07]
서브에이전트 훈련 중에 본 것은
[12:10]
Claude가 훨씬 더 장황하고 상세해지기 시작한다는 거예요
[12:12]
그리고 서브에이전트에게 전체적인 맥락을 제공해요
[12:15]
무슨 일이 일어나고 있는지 말이죠
[12:16]
그래야 더 나은 작업을 할 수 있고
[12:17]
전체에 도움이 되니까요
[12:19]
확실히 Claude는
[12:23]
배울 게 많고
[12:24]
이것을 더 잘하기 위해 배우고 있어요
[12:25]
알겠습니다
[12:27]
어떤 사용 사례들이 있나요?
[12:29]
검색과 맥락 보존이 하나인데, 다른 것들도 있나요?
[12:32]
사람들이
[12:33]
멀티에이전트를 위해 사용하는 다른 것들이?
[12:35]
네, 코딩이 있죠
[12:37]
코딩에서 서브에이전트를 많이 사용해요
[12:40]
병렬화하거나 MapReduce할 수 있는 모든 것들이요
[12:43]
많은 출력을 생성해야 하거나
[12:45]
생성하는 출력에 10개 부분이 있다면
[12:48]
어떤 출력을 만들 때,
[12:50]
그것을 10개의 서브에이전트로 나눌 수 있다면
[12:53]
맥락을 절약하고 더 빠른 결과를 얻는 데
[12:56]
정말 효과적일 수 있어요
[12:58]
또한 흥미로운 것들을 탐구할 수 있어요
[13:00]
멀티에이전트를 테스트 타임 컴퓨트의 형태로요
[13:04]
기본적으로 Claude가,
[13:06]
많은 Claude들이 문제에 대해 작업하는 것이
[13:09]
하나보다 더 나은 최종 답안을 줄 수 있어요
[13:11]
사람들과 마찬가지로,
[13:12]
여러 사람이 머리를 맞대면
[13:14]
더 나은 결과를 얻을 수 있죠
[13:15]
그런 경우에는 이런 에이전트들을 특화시키나요?
[13:19]
한 유형의 페르소나나 다른 것으로 맞추나요,
[13:22]
아니면 그냥 어떤 형태든 취하도록 두나요?
[13:25]
둘 다 할 수 있다고 생각해요
[13:27]
때로는 여러 사람에게
[13:29]
똑같은 작업을 주고 확인하는 것이 도움이 돼요
[13:31]
서로 다른 답변들이 무엇인지 확인하는 거죠.
[13:33]
때로는 많은 사람들이나
[13:34]
여러 에이전트가 같은 문제에 대해
[13:36]
다른 접근 방식으로 작업하거나 분할하는 것이 좋습니다.
[13:39]
제가 많이 본 사례 중 하나는
[13:42]
100개나 200개 정도의 많은 도구를 가진 고객들이
[13:45]
에이전트가 사용하기를 원할 때,
[13:47]
이런 도구들을 서브에이전트들 사이에
[13:49]
분할하는 것이 정말 효과적이라는 걸 발견했습니다.
[13:51]
그래서 메인 에이전트가 알아야 할 것은
[13:53]
이 도구 묶음을 사용하고 싶다는 것뿐이고
[13:56]
그러면 서브에이전트가 가서
[13:57]
실제 작업을 처리하는 거죠.
[13:59]
그래서 각 서브에이전트는 약 20개 정도의 도구만
[14:02]
이해하고 사용법을 알면 됩니다.
[14:04]
- 에이전트를 끝까지 확장해본 적이 있나요?
[14:07]
예를 들어 Claude 천 개 버전이
[14:09]
하나의 문제에 모두 작업한다면 어떻게 될까요?
[14:11]
그냥 혼란으로 변할까요?
[14:13]
- 아직 해보지 않았습니다. - 그렇군요.
[14:14]
- 하지만 답변 드리겠습니다.
[14:15]
- 정말 좋은 연구 아이디어네요.
[14:17]
에이전트나 멀티에이전트에서
[14:19]
현재 보고 있는 다른 실패 모드들은 무엇인가요?
[14:22]
- 네, 복잡한 시스템과 마찬가지로
[14:26]
뭔가를 과도하게 구축하기 쉽고
[14:28]
효율성을 많이 잃고
[14:29]
많은 불필요한 부담을 만들어내죠.
[14:32]
과도하게 구축된 멀티에이전트 시스템이
[14:35]
서로 대화하는 데만 너무 많은 시간을 쓰고
[14:38]
주 과제에서 실제로 진전을 만들지 못하는
[14:40]
경우를 봤습니다. 그리고 알다시피,
[14:42]
인간 에이전트나 인간 조직도 이런 문제를 겪죠.
[14:45]
회사가 커질수록
[14:47]
커뮤니케이션 오버헤드가 더 많아지고
[14:49]
실제로 수행되는 작업은 점점 줄어들죠.
[14:51]
현장의 사람들이 실제로 진전을 만드는 것 말이에요.
[14:54]
- 그래서 이것도 연구할 흥미로운 주제라고 생각합니다.
[14:56]
Claude들의 조직을 어떻게 하면
[15:00]
오버헤드는 작게 유지하면서 매우 효과적으로 만들 수 있을까요?
[15:03]
- 개발자가 에이전트를 시작하고 싶다면,
[15:06]
Claude Code SDK로 구축하든
[15:08]
아니면 혼자서 시도하든 상관없이,
[15:10]
어떤 팁이나 모범 사례가 있나요?
[15:12]
- 네, 모범 사례는 정말로
[15:15]
간단하게 시작하고 확실히 하는 것입니다.
[15:17]
필요한 복잡성만 추가하세요.
[15:19]
또 다른 정말 중요한 점은
[15:21]
에이전트의 관점에서 생각하는 것입니다.
[15:24]
Claude에게 도구나 프롬프트를 제공할 때나
[15:27]
어떤 기능을 제공할 때는 Claude의 입장이 되어
[15:31]
실제로 받는 것, 모델로서 보는 것을 읽어보고
[15:35]
문제를 해결할 수 있는 충분한 정보가
[15:37]
실제로 있는지 확인하세요.
[15:39]
우리는 모든 것을 보고 있지만
[15:42]
모델은 우리가 보여준 것만 본다는
[15:43]
사실을 잊기가 매우 쉽습니다.
[15:46]
- 맞습니다. - 그리고 그건...
[15:47]
- 네. - 네, 저는 항상
[15:48]
돌아가서 확인하는 것이 중요하다고 생각합니다.
[15:49]
도구 호출의 원시 기록이나
[15:53]
로그와 모든 것을 그냥 보는 것이요.
[15:56]
- 정확히 맞습니다. 또 다른 점은
[15:57]
사람들이 MCP 같은 것들을 더 많이 구축하고
[16:00]
Claude를 더 많은 것들에 연결하려고 할 때,
[16:03]
사람들이 가지는 매우 자연스러운 첫 번째 본능이
[16:07]
매우 잘못된 것인데, 바로 MCP나
[16:10]
도구가 API와 일대일 대응이어야 한다는 생각입니다.
[16:13]
모델을 위한 도구나 MCP는 실제로는
[16:17]
API가 아닌 UI와 일대일로 대응되어야 한다고 생각합니다.
[16:21]
궁극적으로 모델은 이런 것들의 사용자이기 때문입니다.
[16:24]
기존 프로그램처럼 작동하지 않습니다.
[16:27]
API에 세 개의 분리된 엔드포인트가 있다면
[16:30]
예를 들어 Slack 대화를 로드하고
[16:34]
사용자 ID를 사용자명으로 변환하고
[16:37]
채널 ID를 채널명으로 변환하는
[16:40]
그런 도구들을 모델에게 제공한다면
[16:41]
Slack을 이해하기 위해, 무엇이든 이해하기 위해
[16:45]
세 번의 도구 호출을 해야 할 것입니다.
[16:47]
반면 사용자로서는
[16:48]
모든 것이 깔끔하게 렌더링된 상태로 보죠.
[16:50]
- 흥미롭네요.
- 그래서 모델을 위한 도구나 MCP를
[16:53]
만들 때는
[16:54]
모든 것을 한 번에 제시하도록 해야 합니다
[16:57]
가능한 한 적은 상호작용으로요.
[16:59]
사용자에게도 끔찍할 것처럼
[17:01]
Slack을 사용할 때마다
[17:02]
사용자 ID를 클릭해야 하고
[17:04]
이름을 확인해야 한다면 말입니다.
[17:06]
- 맞습니다. 좋은 접근이네요.
[17:07]
최종 상태에서 역으로 작업하는 것 같네요
[17:10]
기술 명세를
[17:11]
일대일로 매핑하려고 하는 대신에요.
[17:12]
- 정확합니다. 그리고
[17:14]
필요한 모든 맥락을 함께 포함해야 합니다.
[17:15]
- 에이전트의 미래에 대해 어떻게 생각하시나요?
[17:18]
앞으로
[17:19]
6~12개월에 대한 예측이 있나요?
[17:22]
- 에이전트는 훨씬 더 널리 퍼질 것 같습니다
[17:25]
검증 가능한 영역부터 시작해서요
[17:27]
소프트웨어 엔지니어링 같은 분야에서요.
[17:29]
코딩 에이전트는 이미 제가 일하는 방식을
[17:32]
그리고 Anthropic의 수많은 사람들이 일하는 방식을 바꿨습니다
[17:35]
그리고 여전히 엄청난 잠재력이
[17:36]
있다고 생각합니다.
[17:38]
정말 흥미로운 것 중 하나는 에이전트가
[17:40]
자신의 작업을 검증하는 데 더 나아질 수 있다면
[17:44]
컴퓨터 사용 같은 기능으로 웹앱을 작성하고
[17:47]
실제로 그것을 열어서 테스트하고
[17:49]
자체적으로 버그를 찾을 수 있다면
[17:51]
당신이 그 일을 할 필요가 없죠.
[17:52]
그것이 가장 흥미로운 일 중 하나입니다.
[17:53]
- 네.
- 테스트의
[17:54]
루프를 닫는 것처럼
[17:56]
제가 Claude의 QA 엔지니어가 될 필요가 없도록요.
[17:58]
- 맞습니다. 이 모든 것들을 결합하는 거군요
[18:00]
소프트웨어 엔지니어링 능력부터
[18:02]
컴퓨터 사용 능력까지
[18:04]
이 모든 조각들을 함께 맞추면요.
[18:06]
- 네, 그리고 컴퓨터 사용이
[18:08]
다른 많은 길과 영역들을 열어줄 것입니다
[18:12]
지금까지 에이전트가
[18:13]
접근할 수 없었던 영역들을요.
[18:15]
- 그 예시가 무엇일까요?
[18:17]
- Claude가 Google 문서에서
[18:18]
당신을 위해 작업을 하도록 하고 싶다면
[18:21]
- 네.
- 지금은
[18:22]
Claude가 당신을 위해 글을 쓸 수 있지만
[18:23]
복사해서 붙여넣기를 계속 해야 합니다.
[18:25]
- 맞습니다.
- 하지만 컴퓨터 사용이 있다면
[18:26]
'Claude야, 이 Google 문서를 정리해줄 수 있어?'라고 하면
[18:29]
바로 그 자리에서 해줄 수 있습니다.
[18:30]
스크롤하고, 클릭하고, 텍스트를 편집하며
[18:32]
복사 붙여넣기를 계속 할 필요보다
[18:34]
훨씬 더 좋은 경험입니다.
[18:37]
- 네.
- 당신이 어디에 있든
[18:38]
컴퓨터 사용이 있다면 Claude가 함께할 수 있습니다.
[18:41]
- Claude가 제 Google 문서를 작성하고
[18:43]
모든 댓글에 대신 답변해주는 것이 매우 기대됩니다.
[18:45]
- 정확히요.
- 그것이
[18:46]
아주 좋은 미래가 될 것입니다.
[18:48]
Erik, 정말 좋았습니다.
[18:49]
대화해주셔서 정말 감사합니다.
[18:50]
- 당연히요, 감사합니다.