Claude와 함께 에이전트의 미래를 구축하기

채널 아이콘
Anthropic 구독자 70,600명

요약

이 영상은 Claude Developer Platform(이전 Anthropic API)의 명칭 변경 배경과 주요 구성 요소(API, SDK, 문서, 콘솔)의 역할을 소개합니다. 프롬프트 캐싱, 웹 검색·페치, 코드 실행 등 에이전트 기능 확장을 통해 개발자가 모델을 제약 없이 활용하도록 지원하는 방식을 설명합니다. Anthropic이 정의하는 에이전트 개념과 '스캐폴딩' 감소를 통한 모델 자율성 확보 전략, Claude Code SDK를 통한 에이전트 루프 자동화 사례를 다룹니다. 마지막으로 컨텍스트 관리와 관찰성, 향후 로드맵(자기개선형 에이전트·모델에 컴퓨터 부여) 비전을 함께 제시합니다.

주요 키워드

Claude Developer Platform Agent Agentic Loop Prompt Caching Web Fetch Context Management Observability Claude Code SDK Code Execution Scaffolding

하이라이트

  • 🔑 명칭 변경: Anthropic API가 확장된 기능을 반영해 Claude Developer Platform으로 다시 명명했습니다.
  • 🚀 플랫폼 구성: API, SDK, 문서, 콘솔 등 통합 환경이 내부 제품(Claude Code)과 외부 고객 모두를 지원합니다.
  • 🌟 기능 확장: 프롬프트 캐싱, 웹 검색·페치, 배치 API, 코드 실행, 컨텍스트 관리 등 다양한 도구가 추가되었습니다.
  • 📌 에이전트 정의: Anthropic은 모델이 도구를 호출·처리하고 다음 단계를 자율적으로 결정하는 패턴을 에이전트로 규정합니다.
  • ⚡️ 스캐폴딩 경감: 모델 지능이 향상됨에 따라 과도한 가드레일을 줄여 더 높은 수준의 자율성과 확장성을 추구합니다.
  • 🔧 Claude Code SDK: 에이전트 루프 자동화 하네스를 제공해 개발자가 코딩·비코딩용으로 즉시 활용할 수 있습니다.
  • 📈 컨텍스트 관리: 불필요한 과거 툴 호출을 제거하고 'tombstone' 메커니즘으로 토큰 사용량을 최적화합니다.
  • 🔍 관찰성 강조: 장기 실행 에이전트 작업에 필요한 모니터링·감사 기능을 강화해 안정성과 튜닝 용이성을 확보합니다.

용어 설명

Agent

모델이 스스로 도구를 호출하고 결과를 평가해 다음 단계를 결정하는 자율 에이전트 개념

Scaffolding(스캐폴딩)

모델의 작업 흐름을 제약하는 안내나 가드레일 구조

Agentic Loop(에이전트 루프)

모델이 도구 호출과 결과 처리, 의사결정을 반복 수행하는 순환 구조

Observability(관찰성)

장기 실행 작업 중 에이전트의 상태와 활동을 모니터링·감사하는 기능

Prompt Caching(프롬프트 캐싱)

반복되는 프롬프트를 캐싱해 응답 속도와 비용을 최적화하는 기술

Web Fetch

에이전트가 웹 페이지를 불러와 내용을 분석·활용할 수 있는 기능

Claude Code SDK

에이전트 루프를 자동화해 개발자가 즉시 활용할 수 있도록 지원하는 소프트웨어 개발 키트

Context Management(컨텍스트 관리)

에이전트 루프 중 불필요한 과거 콘텍스트를 제거·최적화하는 메커니즘

[00:00:16] 팀 소개 및 주제 설정

Alex가 Anthropic의 Claude Relations 리드를 맡고 Brad(PM 팀장)과 Katelyn(엔지니어링 팀장)을 소개하며, Claude를 활용해 에이전트의 미래를 구축한다는 주제를 설정합니다.

Alex가 Anthropic의 Claude Relations 담당자로 소개하며, Claude로 에이전트의 미래를 구축하는 주제로 Brad(PM팀 리더)와 Katelyn(엔지니어링팀 리더)과 대화를 시작합니다.
Claude Developer Platform은 예전 Anthropic API에서 이름이 바뀌었으며, 이제 API, SDK, 문서, 콘솔 경험 등 개발자가 Claude 기반 구축에 필요한 모든 것을 포함하는 종합 플랫폼으로 발전했습니다.
[00:00:35] 플랫폼 명칭 변경 이유

플랫폼 명칭이 기존 'Anthropic API'에서 'Claude Developer Platform'으로 변경된 배경과 이 새로운 브랜드가 지향하는 목표를 설명합니다.

타임라인 정보가 없습니다.

[00:00:46] 플랫폼 구성 요소 및 가치 제공

Claude Developer Platform이 제공하는 API, SDK, 문서, 콘솔 등 개발자 경험 전반을 아우르는 요소를 소개하고, 내부 제품과 외부 고객을 동시에 지원하는 방식을 다룹니다.

전 세계 고객들이 Claude를 사용해 지능의 한계를 높이고 있으며, 플랫폼은 외부 고객뿐만 아니라 Claude Code 같은 내부 제품도 지원하고 있습니다.
지난 1년간 단순한 모델 접근에서 프롬프트 캐싱, 배치 API, 웹 검색/fetch, 컨텍스트 관리, 코드 실행 등 다양한 기능을 추가하며 진정한 플랫폼으로 진화했습니다.
[00:01:36] 플랫폼 기능 확장 및 진화

지난 1년간 프롬프트 캐싱, 배치 API, 웹 검색·페치, 컨텍스트 관리, 코드 실행 등 다양한 기능이 추가되며 단순 API에서 포괄적 플랫폼으로 진화한 과정을 정리합니다.

채팅 모델에서 에이전트적 미래로 이동하며 개발자 플랫폼에서 에이전트 구축이 가능해졌고, 에이전트라는 용어가 업계에서 유행어가 되면서 정의가 모호해지고 있다고 논의합니다.
[00:02:16] 에이전트 개념 정의

Anthropic이 정의하는 에이전트는 모델이 주도적으로 도구를 선택·호출하고, 결과를 처리해 다음 행동을 결정하는 자율성 요소를 핵심으로 삼습니다.

Anthropic에서 정의하는 AI 에이전트는 모델이 자율성을 가지고 도구를 선택하고 호출하며 결과를 처리하는 것입니다. 기초 연구소로서 모델의 추론 능력과 의사결정 과정을 중시합니다.
고객들은 미리 정의된 경로로 유용한 워크플로를 구축하고 있지만, 진정한 에이전트 패턴의 장점은 모델이 발전할 때마다 서비스가 자동으로 개선된다는 점입니다.
[00:03:55] 스캐폴딩과 자율성 추세

초기 스캐폴딩(가드레일) 중심 에이전트 설계에서 벗어나 모델 지능 향상에 따라 불필요한 제약을 줄여 자율성을 극대화하는 트렌드를 논의합니다.

과거에는 많은 스캐폴딩이 필요했지만, 모델의 지능이 향상되면서 필요한 스캐폴딩이 줄어들고 있습니다. 과도한 제약은 오히려 모델의 진정한 능력을 보기 어렵게 만듭니다.
현재 에이전트에 대한 다양한 논의가 활발하며, 일부는 단순한 루프만으로도 충분하다고 봅니다. 모델을 오케스트레이션하는 프레임워크들이 지속적으로 진화하고 있습니다.
업계에서는 모델 활용을 위한 프레임워크들이 너무 무거워지고 편향적이 되어서, 사람들이 단순한 반복문 방식으로 돌아가고 있다는 관찰을 공유합니다.
Anthropic의 접근 방식을 설명하며, 간단한 반복문도 좋지만 사람들이 모델을 최대한 활용할 수 있도록 도구와 기능을 제공하되, 너무 무거운 프레임워크가 되지 않도록 균형을 맞추겠다고 합니다.
전략에 대한 질문에 대해 모델의 '족쇄를 푸는' 개념을 소개하며, 모델에게 필요한 도구들을 제공하고 자유롭게 사용할 수 있게 하는 것이 핵심이라고 설명합니다.
현재 세대 모델들에는 아직 해제되지 않은 많은 지능이 있다고 확신하며, 모델에게 필요한 도구를 주고 자유롭게 놔두면 훌륭한 결과를 얻을 수 있다는 직관을 설명합니다.
웹 검색과 웹 페치 도구를 예시로 들어, 최소한의 프롬프트만으로도 모델이 자율적으로 깊이 있는 연구 작업을 수행하는 모습을 관찰했다고 합니다.
시스템 지능이 적용되는 위치의 변화를 논의하며, 개발자가 지능을 적용해서 안내하던 것에서 모델이 스스로 해결하는 방향으로 바뀌고 있다고 정리합니다. 개발자의 창의력에는 한계가 있지만 모델의 가능성은 더 크다는 것을 인정합니다.
개발자로서의 창의성 한계와 모델의 무한한 가능성에 대해 논의하며, 모델이 사용자의 다양한 요청을 처리할 수 있는 능력을 강조합니다.
개발자 플랫폼 시작을 위한 최고의 추천인 Claude Code SDK를 소개하고, 이것이 에이전트 하네스로서의 역할과 도구 호출 자동화 기능을 설명합니다.
[00:08:44] Claude Code SDK 활용

Claude Code SDK를 활용해 에이전트 루프 하네스를 제공하는 방법을 소개합니다. 코딩 전용이 아닌 범용 자동화 도구로서 빠른 프로토타이핑을 돕습니다.

Claude Code SDK가 원래는 코딩용이었지만 범용 에이전틱 하네스로 발전했음을 설명하며, 복잡한 루프 구축 없이 에이전트 프로토타이핑을 가능하게 해준다고 강조합니다.
Claude Code SDK에 대한 일반적인 오해를 다루며, 코딩 애플리케이션이 아니어도 사용할 수 있음을 설명합니다.
모델의 제약을 풀기 위해 스캐폴딩을 제거한 결과, 코딩 관련 요소는 사라지고 파일 시스템과 Linux 도구에 대한 접근 권한을 제공하는 범용 기능만 남았다고 설명합니다.
Claude Code SDK 이전에는 개발자들이 각자 프롬프트 캐싱과 도구 호출 루프를 구현해야 했지만, 이제는 더 높은 추상화 레벨에서 시작할 수 있게 되었다고 설명합니다.
비즈니스가 에이전트를 도입할 때 기술을 넘어 실제 해결할 문제와 사용 사례 선택의 중요성에 대해 논의합니다.
화자는 고객들이 에이전트 프로젝트의 비즈니스 가치를 명확히 정의하는 것이 가장 큰 임팩트를 만든다고 설명합니다. 엔지니어링 시간 절약이나 수동 작업 제거 등 구체적인 결과를 예상할 수 있어야 에이전트의 범위를 제대로 정의할 수 있다고 강조합니다.
SDK가 개별 개발자들에게 유용하다는 점을 인정하면서, 실제 비즈니스 가치를 추구하는 기업들이 SDK를 사용해야 하는지에 대한 질문이 제기됩니다.
SDK는 에이전틱 루프 런타임을 제공하여 원하는 곳에 배포할 수 있지만, 더 높은 수준의 추상화로 나아가고 있다고 설명합니다. 루프와 자동화된 도구 호출을 제공하여 규모에서 즉시 사용 가능한 솔루션을 만드는 것이 목표라고 합니다.
높은 수준의 추상화는 단순히 개발을 쉽게 만드는 것이 아니라 최고의 결과를 얻도록 돕는 것이라고 강조합니다. 연구팀과 추론팀과의 협력을 통해 Claude와 최적으로 작동하는 강력한 에이전틱 루프를 만들 수 있다고 설명합니다.
오래 실행되는 작업에서 관찰 가능성(observability)이 사용자들의 주요 관심사라고 언급합니다. 작업 조정, 프롬프트 튜닝, 도구 호출 최적화 등을 위해 플랫폼을 통한 관찰 가능성을 제공할 계획이라고 밝힙니다.
개발자 플랫폼에서 관찰 가능성과 감사 기능의 중요성에 대해 논의하며, AI 에이전트가 백그라운드에서 작업할 때 올바른 작업을 수행하는지 확인하는 방법에 대해 설명합니다.
현재 개발자 플랫폼에서 사용할 수 있는 유용한 도구들, 특히 웹 검색과 웹 페치 기능에 대해 소개하고, 컨텍스트 윈도우 관리의 중요성을 강조합니다.
[00:14:49] 컨텍스트 및 메모리 관리 도구

토큰 사용 최적화를 위한 컨텍스트 관리 기능, 오래된 툴 호출 제거·tombstone 처리, 에이전트 메모리 툴 등을 통해 효율적 프롬프트 관리 전략을 제시합니다.

Claude의 컨텍스트 토큰 한계와 고객들이 더 작은 컨텍스트에서 더 나은 결과를 얻는다는 발견을 설명하며, 에이전트 루프에서의 도구 호출이 토큰을 많이 소비하는 문제를 지적합니다.
모델이 불필요한 오래된 도구 호출을 자동으로 제거하는 새로운 기능을 소개하고, 프롬프트 정리가 모델의 집중력 향상에 미치는 긍정적 효과를 설명합니다.
필요한 컨텍스트를 실수로 제거할 위험성과 이를 방지하기 위한 가드레일에 대해 논의하며, 실제 테스트 경험을 통해 모델이 도구 결과 손실에 어떻게 반응하는지 설명합니다.
AI 모델의 도구 호출 관리 방식에 대한 설명으로, 도구 호출을 제거할 때 모델에게 완전한 기억 소실을 방지하기 위해 묘비화(tombstone) 기법을 사용한다고 설명합니다.
에이전트 메모리 기능에 대한 상세한 설명으로, 모델이 인간처럼 경험을 통해 학습하고 개선될 수 있도록 메모리 도구를 제공하며, 이를 통해 반복 작업에서 성능이 향상된다고 설명합니다.
개발자의 메모리 관리 권한에 대한 설명으로, 모델에게 핵심 메모리 기능을 제공하면서도 개발자가 원하는 저장소(클라우드, 로컬 등)에 메모리를 저장할 수 있도록 유연성을 제공한다고 합니다.
미래 로드맵에 대한 질문으로, 최근 출시된 많은 새로운 기능들과 Claude Code SDK 등 곧 출시될 제품들에 대한 기대감을 표현하며, 향후 6-12개월간의 전망을 묻습니다.
[00:19:12] 로드맵 및 미래 전망

향후 로드맵에서는 더 높은 추상화된 에이전트 솔루션과 관찰성 도구, 메모리 기능 확장, 모델에 컴퓨터를 부여해 자기개선형 에이전트를 구현할 비전을 공유합니다.

높은 수준의 추상화와 관찰 가능성을 통해 Claude에서 최고의 결과를 얻을 수 있도록 단순화하는 미래 비전을 제시하며, 장기 실행 작업에서 데이터와 통찰을 얻을 수 있는 통합적 접근 방식을 설명합니다.
Brad가 언급한 메모리 기능과 같은 새로운 기능들을 통해 시간이 지남에 따라 Claude가 단순히 좋은 결과를 제공하는 것을 넘어 자체 개선되고 지속적으로 향상되는 선순환 구조를 만들 수 있다고 설명합니다.
사용자들이 Claude로 개발하면서 점점 더 나은 결과를 얻게 되는 '아하!' 순간들을 경험하게 되는 것이 로드맵의 궁극적인 목표라고 강조합니다.
새로운 모델 출시에 대한 흥미와 열정을 표현하며, 예상치 못한 새로운 기능들(ASCII 그림 개선 등)이 발견되는 즐거움에 대해 이야기합니다.
Claude에게 컴퓨터를 제공하는 것의 중요성을 신입사원에게 컴퓨터를 주지 않는 상황에 비유하여 설명합니다. 현재는 모든 사용자가 컴퓨터 없는 Claude를 사용하고 있는 상황이라고 지적합니다.
코드 실행 도구를 통해 Claude가 VM에서 코드를 작성하고 실행하여 이미지 확대나 Excel 데이터 분석 등을 수행할 수 있는 현재의 초기 단계를 소개합니다.
개발자로서, 제 창의력에는 한계가 있어요.
제가 생각할 수 있는 사용 사례는 한정적이거든요.
하지만 모델은, 어떤 것이든
누군가 가져오는 어떤 것이든
모델이 그걸 수행하는 방법을 찾아낼 거예요.
안녕하세요, 저는 Alex입니다. Anthropic의 Claude Relations를 담당하고 있어요.
오늘 이야기할 주제는
Claude로 에이전트의 미래를 구축하는 것이고,
동료들과 함께 하겠습니다.
저는 Brad입니다.
Claude Developer Platform의 PM팀을 이끌고 있어요.
저는 Katelyn이고, Claude Developer Platform의
엔지니어링 팀을 담당합니다.
Claude Developer Platform에 대해 이야기해봅시다.
네, 그것부터 시작하죠.
그것부터 시작합시다. - 거기서부터.
예전에는 Anthropic API라고 불렸어요.
네. - 큰 이름 변경을 거쳤죠.
큰 이름 변경을 거쳤어요.
왜 그런 변경을 했는지 설명해주실 수 있나요?
그리고 이 새로운 플랫폼이 무엇이고 어떤 것들을 포함하는지도요?
네, 물론이죠.
Claude Developer Platform은
API, SDK, 문서화, 콘솔 내의 모든 경험을
포함하고 있고,
개발자가 Claude를 기반으로
구축하는데 필요한 모든 것을
정말 포함하고 있어요. 전 세계의
정말 훌륭한 고객분들을 섬기고 있어서
겸손하게 자랑스럽게 생각해요.
이분들이 Claude를 사용해서 지능의 한계를 높이려고 하시거든요.
플랫폼이 그것을 가능하게 해주죠.
제가 가장 좋아하는 부분 중 하나는
플랫폼이 외부 고객만 섬기는 게 아니라
실제로 우리 내부 제품도 섬긴다는 점이에요.
예를 들어, Claude Code는
실제로 우리 공개 플랫폼 위에 직접 구축되었다고
말씀드리는 걸 좋아해요. - 그렇군요. - 네, 제 생각에는
처음 시작할 때는
그냥 Anthropic API였어요.
모델에 대한 매우 단순한 접근이었죠.
하지만 지난 1년 정도 동안
수많은 기능을 추가했어요.
프롬프트 캐싱을 추가했고
완전히 별도의 배치 API를 추가했어요.
웹 검색, 웹 fetch를 추가했고
컨텍스트 관리 지원과 코드 실행 기능도 있어요.
이 모든 도구들이 있으니, 이제 이런
열망적으로는, 이제 플랫폼이라고 느껴져요.
이제 플랫폼이에요.
이제 훨씬 더 많은 것들이 있다는 거군요.
지난 1년 동안 꽤 극적으로 발전했어요.
네, 네. - 더 좋아졌죠, 그렇게 생각해요.
개발자들이 어차피
그렇게 부르고 있었거든요.
개발자들이 말하는 것에 맞춰가는 것이
자연스러운 일이죠.
우리가 조금 늦었어요.
원래 그런 기능이 있었던 거죠?
괜찮아요. - 우리가 보상했으니까요.
이제 할 수 있는 멋진 것 중 하나는
채팅 모델에서
좀 더 에이전트적인 미래로 이동하면서
이 개발자 플랫폼의 일부로 에이전트를 구축하는 거예요.
플랫폼에서 실제로 어떻게 하고 있는지
이야기하기 전에, 애초에 에이전트가 무엇인지
얘기해볼까요?
네, 에이전트는
거의 유행어 같은 거죠.
지금 이야기하는 모든 사람이 에이전트를 구축하고 있고
업계 기술 용어가 그 수준에 도달하면
정의가 매우 모호해져요.
모든 사람이 구축하는 모든 것이 에이전트가 되죠.
하지만 Anthropic에서 우리가 에이전트에 대해 정말로 생각하는 것은
모델이 어느 정도 자율성을 갖는 것입니다
어떤 도구를 호출할지 선택할 수 있고,
그 도구들을 호출하고, 결과를 처리하며,
다음 단계를 선택하는 것이죠.
기초 연구소로서,
모델과 그 추론 능력에 집중하고,
어떻게 결정을 내리는지,
이것이 에이전트의 정말 중요한 요소라고 생각합니다.
에이전트가 무엇인지에 대한 말이죠.
- 음, 어떤 면에서 자율적인 측면이 있다는 거네요.
- 네.
- 방향을 설정하는-
- 제가 생각하기에는,
정말 유용한 워크플로를 구축하는 고객들이 있습니다
Claude가 따라야 할 경로를 미리 정의하는 방식으로
Claude가 걸어야 할 길을
정말 유용한 일입니다.
하지만 에이전트 방식의 좋은 점은
몇 달마다 모델이 더 나아지면서
새로운 모델을 출시할 때
진정한 에이전트 패턴으로는
그런 서비스들이 자동으로 더 좋아집니다.
반면 많은 스캐폴딩으로
워크플로를 구축하면,
모델에 제약을 가하게 되죠.
어떤 사용 사례에서는 괜찮을 수도 있지만,
그것은 다음 수준의 지능을
활용하지 못할 수도 있다는 뜻입니다
다음 모델 릴리스가 제공하는.
- 네, 지난 6-12개월 동안
에이전트와 관련해서 흥미로운 트렌드가 있는 것 같습니다.
말씀하신 대로 스캐폴딩이
어느 정도 방해가 되었고,
그 일부를 제거하고 있는 것 같습니다.
그것에 대한 직관을 설명해 주실 수 있나요?
이것이 실제로 미래인가요?
모델에게 점점 더 적은 것을 제공하는 것이?
- 네, 시간이 지나면서
모델이 작업을 수행하기 위해
필요한 스캐폴딩이 줄어들고 있습니다
모델의 지능 수준이 올라가면서요.
그리고 이것은 계속 올라갈 것이라고 믿습니다
기본적으로 모델이 수행하려는
고수준 작업에 대한 맥락적 이해가 더 많아집니다.
따라서 가드레일이나
보호장치가 많이 필요하지 않고,
사실 경우에 따라서는 그런 가드레일들이
부담이 되기도 합니다.
새로운 모델을 시도한 고객들이
"아, 조금만 나아졌네요"라고 말하면
우리가 그들과 함께 살펴보면
무슨 일인지 알게 되죠.
그리고 알고 보니,
네, 그들이 모델을 제약하는 방식으로
모델의 지능을 보기 어렵게 만들고 있었던 거죠.
모델의 지능을요.
- 아, 이것이 현장에서
고객들과 함께 보고 있는 것과
일치하는 건가요?
같은 트렌드를 따르고 있는?
Claude를 관리하기 위한 모든 종류의 혁신적인
기술들을 탐구하고 있다는 걸 알고 있습니다.
- 네, 정말 그렇습니다.
그리고 실제로 지금
이것에 대한 많은 논의가 있죠?
에이전트가 무엇이고 무엇이 필요한지?
무엇을 구축해야 하는지?
어떤 사람들은
"그냥 와일드 루프야"라고 말하죠.
"그렇게 열심히 노력할 필요 없어." 그리고 궁극적으로
사람들이 모델 주변에 구축하고 있는
프레임워크들이 많이 진화해왔습니다
모델을 최대한 활용하려고 노력하고 있습니다.
그리고 업계가
어쩌면 중심에 두고 있는 것은
많은 부분이 너무 무거워졌고
너무 편향적이 되었다는 것입니다
그래서 사람들이
'그냥 간단한 반복문으로 돌아가자,
그것만 있으면 된다'고 말하는 이유죠.
저희가 여기서 하려는 것은
많은 면에서 간단한 반복문일 수도 있지만,
우리가 더 고유하게 할 수 있는 것들은
사람들이 모델을 최대한 활용할 수 있도록 돕는 것이고
그것은 바로 그런 도구들과 기능들입니다.
그래서 우리가 하고자 하는 것은
프레임워크와 도구, 플랫폼을 제공하는 것입니다
어느 정도는 의견이 담긴
사람들이 그런 도구들을 어떻게 사용해야 하는지에 대한 방향을 제시하는 것입니다.
하지만 이것이 너무 무거운 프레임워크는 아닙니다
브래드가 말한 대로 실제로는
모델이 궁극적으로 하려는 일에 방해가 되는.
적절한 균형을 맞추는 것입니다.
많은 사람들이 시도한 것들을 봐왔기 때문에
우리도 거기에 대해 의견을 가질 수 있다는 걸 알고 있지만,
우리가 그것을 하는 방식에서는 가벼워야 하고
우리가 진정으로 하고 있는 일이
모델을 최대한 활용할 수 있도록 돕는 것임을
너무 무거운 프레임워크로
여러분을 짓누르지 않으면서 말이죠.
- 맞습니다. 그렇다면 여기서 전략의 일부를
설명한다면
이런 보조 도구들과 기능들을 제공하는 것으로
모델에 주는 것이지만,
모델 자체에 범퍼나 제약을
두지는 않는다는 것인가요?
- 네, 우리는 이것을
어떻게 모델의 족쇄를 풀 것인가로 생각합니다.
모델은 이미 많은 능력을 가지고 있습니다.
사실, 저는 확신합니다
현재 세대의 모델들을 가져와도
그 안에는 우리가 해제할 수 있었던 것보다
훨씬 더 많은 지능이 있다고 말입니다.
하지만 어쨌든, 그 직관은 모델에게 단순히
필요한 도구들을 주고 자유롭게 놔두면,
올바른 방식으로 그것들을 사용할 수 있게 하면,
훌륭한 결과를 얻을 것이라는 겁니다.
좋은 예시 중 하나는
우리가 출시한 서버 사이드 웹 검색 도구와
웹 페치 도구입니다.
고객들이 이것들을 사용하는 것을 지켜보는 것은 흥미로웠습니다.
실제로 우리가 한 것은
매우 최소한의 프롬프트였습니다.
웹 검색 도구만 주었는데
갑자기 깊이 있는 연구 작업이
거의 완전히 완성되었습니다
API에서 그 스위치만 켜면 말이죠.
모델이 그 도구를 호출하고,
결과를 보고, 그것을 고려해서
아, 다른 검색을 더 해야겠다고
결정하기도 하고
그러다가, 오, 네 번째 링크가
바로 그거야.
그 링크에 웹 페치를 해서 데이터를 가져옵니다.
정말로 이 모든 것을 매우 자율적으로 스스로
결정하면서 말이죠.
- 맞습니다, 이것은 어떤 면에서
시스템의 지능이 적용되는 위치의
흥미로운 변화인 것 같습니다.
- 정확히 맞습니다. - 개발자가
자신의 지능을 적용해서 안내하던 것에서
이제는 모델이 알아서 해결하는 것으로요.
- 맞습니다, 모델이 하는 일은 정말 흥미진진합니다.
개발자로서
제 창의력은 어느 시점에서 한계에 다다르거든요.
저는 한정된 사용 사례만 생각해낼 수 있어요.
하지만 모델은 다른 모든 것과 마찬가지로,
누군가가 어떤 요청을 가져와도 모델이 그것을 수행할 방법을 찾아낼 거예요.
그 일을 해내죠.
모델의 제약을 풀어주는 것은 정말 멋진 일이에요.
그렇네요. 그럼 제가 오늘 개발자라면
개발자 플랫폼으로 개발을 시작할 때
무엇을 추천하시나요?
시작하기 위한 모범 사례나 방법이 있을까요?
네, 매우 실용적으로 말씀드리면, 실제로 저희가 현재 가장 추천하는 것은
Claude Code SDK입니다.
그리고 정말 흥미로운 점은
Claude Code SDK에 대해서는
저희가 본질적으로 모델 주변에 에이전트 하네스를 구축했다는 것입니다.
그 루프를 실행하기 위한 에이전틱 하네스 말이죠.
그리고 많은 도구 호출을 자동화하고
다른 기능들의 사용도 자동화합니다.
그리고 명백히 원래는 코딩 목적으로 만들어졌죠.
그런데 팀이 정말 빠르게 깨달은 것은
실제로 이것이 훌륭한
범용 에이전틱 하네스라는 것이었어요.
그래서 SDK가 하는 일은 사람들에게 완벽한
즉시 사용 가능한 솔루션을 제공하는 것입니다
실제로 에이전트 프로토타이핑을 바로 시작할 수 있도록
모든 도구 호출과 기타 기능들로
루프를 직접 구축해야 하는 수고를 덜어주죠.
메시지 API 위에 구축되어 있고
저희가 언급한 모든 동일한 도구들을 사용합니다.
하지만 정말 훌륭한 시작점을 제공하죠
바로 즉시 사용 가능한 상태로요.
맞습니다. 이것이 꽤 흔한 오해인 것 같아요.
적어도 제가 개발자들과
Claude Code SDK에 대해 이야기할 때요.
저는 코딩 애플리케이션을 만드는 게 아닌데
왜 이것을 사용하고 싶을까요?
하지만 코딩 전용 부분들을 제거할 수 있어요.
네, 제 생각에는 그것이 저희가 이야기했던
모델에서 스캐폴딩을 제거하는
훌륭한 예시라고 생각합니다.
Claude Code에서 모델의 제약을 풀기 위해 것들을 제거하고 나면
정말 모델의 제약을 풀게 되는데,
결과적으로 코딩과 관련된 것은 아무것도 남지 않더라고요.
다른 모든 것을 제거하고 나면
그저 에이전틱 루프만 남고
Claude에게 파일 시스템에 대한 접근권한을 주는
정말 미니멀한 것만 남게 되죠.
Linux 명령줄 도구들의 집합에 대한 접근권한
그리고 코드를 작성하고
그 코드를 실행할 수 있는 능력 말이에요.
따라서 이것들은 모두 매우 일반적인 종류의 기능들이고
다양한 문제들을 해결할 수 있다는 것이 밝혀졌죠.
맞아요, 네.
제가 개인 프로젝트에서 계속 마주치는
것이라고 느끼고
Anthropic 내부 프로젝트들에서도 보는 것은
Claude Code SDK 이전에는
모든 사람이 어떤 형태든
프롬프트 캐싱 관리나
도구 호출과 그 루프를 관리하는
어떤 형태를 구현하고 있었어요.
그런데 이제는 이 기본 지점에서 시작해서
거기서부터 구축하면 되는 거죠.
조금 더 높은 지점에서 시작하는 거예요.
네. 네, 맞아요.
한 단계 더 높은 수준의 추상화인 것 같아요.
정말 흥미롭다고 생각해요.
제 생각에 또 다른 정말 흥미로운 점은
특히 에이전트를 고려하는 비즈니스들이 생각해야 할
타겟할 사용 사례가 무엇인지입니다.
기술을 넘어서 생각해보면
해결해야 할 실제 문제가 무엇인지 말이에요.
그리고 저는 많은 고객들을 보고 있다고 생각합니다
그리고 우리가 사랑하는 많은 것들을 하고 있지만,
하지만 가장 큰 임팩트가 있는 곳은
고객이 신중하게 생각한 곳입니다
이것의 비즈니스 가치가 무엇인지 말이죠.
실제로 이 정도의 엔지니어링 시간을 절약할 것인지
또는 이 정도의 수동 작업을 제거하는데 도움이 될 것인지 등등?
그리고 에이전트 프로젝트의 예상되는 결과를
명확히 표현할 수 있는 것이
정말 도움이 된다고 생각합니다
에이전트의 범위를 정의하는데 말이죠.
- 맞습니다. SDK로 다시 한번 연결해보면
개발자들에게 정말 유용했던 것 같습니다
저와 같은 개별 개발자들에게 말이죠
시작하면서 단순히 빠르게
무언가를 해킹하고 싶을 때
이러한 고객들을 위해, 기업들을 위해
실제 비즈니스 가치를 얻으려고 하는
이런 것들에 대해서요.
그들이 SDK를 사용해야 할까요?
준비가 되었나요?
그런 규모의 사용을 위해 준비가 되었나요?
- 네, 여러 면에서 그렇다고 생각합니다
여러 면에서 만약 당신이
그 런타임을 배포할 수 있는 상황에 있다면
본질적으로, 그것이 SDK에서 얻는 것입니다
에이전틱 루프 런타임이죠.
원하는 곳 어디든 그 런타임을 배포할 수 있습니다
준비가 되었을 때 언제든지요.
하지만 우리가 정말 하려는 것은
SDK가 사람들에게 제공하는 그 정신을 가져와서
더 높은 수준의 추상화로 올라가는 것입니다
루프를 제공하고
자동화된 방식으로 많은 도구 호출을 제공해서
이것으로부터 어떻게 배울 수 있을지
그리고 사람들에게 규모에서 즉시 사용 가능한 솔루션을 제공하는 방법을
정말로 그들의 사용 사례를 해결할 수 있도록 말이죠.
그리고 그것이 우리가 나아가려는 방향의 대부분입니다
올해 남은 기간 동안의 로드맵에서 말이죠.
그리고 우리가 그것에 대해 생각할 때 정말 중요한 부분은
만약 여기서의 전체 목표가 우리 사용자들을 돕는 것이라면
정말로 지능의 한계를 높이고
모델에서 최고의 결과를 얻는 것이라면
더 높은 수준의 추상화는 단지 쉽게 만드는 것이 아닙니다
모든 코드를 직접 작성할 필요가 없어서 말이죠.
실제로는 어떻게 하면 우리가 정말로
최고의 결과를 얻도록 도울 수 있느냐는 것입니다.
우리는 연구팀과 같은 공간에 있고
추론팀과도 같은 공간에 있어서
우리의 추상화를 어떻게 만들지 알고 있습니다
우리의 에이전틱 루프가 극도로 강력하고
Claude와 함께 작업하는데 극도로 뛰어나게 만드는 방법을 말이죠.
그리고 마지막으로 덧붙이고 싶은 것은
특히 이것들이 더 오래 실행되고
우리가 점점 더 많은 도구를 제공하면서
사람들이 더 오래 실행되는 작업에 접근할 수 있도록 도울 때
우리 사용자들이 가지고 있는 또 다른 큰 문제는
계속 해결하려고 할 것을 우리가 알고 있는
더 오래 실행되는 작업 내에서의 관찰 가능성입니다.
그리고 그것이 사람들에게 가장 흔히 나오는
문제 중 하나입니다
오래 실행되는 작업이 있고
정말 좋은 결과를 얻으려고 하는데
하지만 약간의 조정이 필요할 수 있거나
프롬프트를 조정해야 할 수 있거나
도구 호출에 대해
조금 다르게 생각해야 할 수도 있죠.
그리고 그것이 우리가 사람들에게 줄 수 있다는 것을 알고 있는 것입니다
시간이 지나면서 플랫폼을 통한 관찰 가능성을 말이죠.
그리고 그것이 우리가 집중하고 있는 또 다른 큰 영역입니다.
음, 정말 흥미롭네요.
이건 정말 큰 이슈가 되어왔는데
특히 에이전트와 함께 문제가 대두되기 시작했죠-
맞다고 생각합니다.
- 특히 에이전트가 백그라운드에서
다른 애플리케이션에서 작업하도록 신뢰할 때,
실제로 올바른 일을 하고 있는지 어떻게 확인하고
배포할 때도 마찬가지죠.
맞아요, 어떻게 감사하죠?
시스템에 어느 정도 자율성을 부여한다면
이를 감사할 수 있는 방법이 필요하고
올바른 일이 일어나고 있는지 확인해야 합니다.
그래야 설정을 조정하고 할 수 있죠.
그래서 관찰 가능성이 정말 핵심 요소라고 생각합니다.
여기서 잠시 멈추고 질문을 드리고 싶은데요,
앞으로 이 문제를 어떻게 해결할 것인지에 대해서요.
그 전에, 지금 존재하는 다른 도구들 중에서
사람들이 알아야 할
개발자 플랫폼을 시작할 때
도움이 되거나 유용하다고 생각하는 것들이 있나요?
네, 음, 생각해보면
웹 검색과 웹 페치를 언급했고요.
우리가 보고 있는 또 다른 큰 것은
현재 고객들이 컨텍스트 윈도우를 관리하기 위해
많은 작업을 해야 한다는 것입니다.
기본적으로 Claude는 20만 토큰의 컨텍스트를 가지고 있습니다.
지금 Sonnet에서 베타로 100만 토큰을 사용할 수 있는데,
훌륭하지만, 100만이라도 한계가 있습니다.
그리고 많은 고객들이 우리에게 말한 것은
컨텍스트의 더 작은 부분을 사용해도
더 나은 출력, 더 높은 지능을 얻는다는 것입니다.
그래서 우리는 몇 가지 멋진 기능을 만들었는데
방금 출시되고 있는
개발자들이 컨텍스트를 관리하는 데 도움이 되는 것들입니다.
이런 에이전트 루프에서는 많은 경우
10, 15, 100번의 도구 호출을 하고 파일을 편집하거나
데이터베이스에서 데이터를 찾거나
이메일을 보내거나 하는데
이런 도구 호출 각각이
100, 200, 1,000 토큰을 차지합니다.
그래서 우리에게는 멋진 기능이 있는데
모델이 실제로 더 이상 필요하지 않은
오래된 도구 호출들을 제거할 수 있게 합니다.
흥미롭네요. 그리고 그것은
마치 책상을 정리하고
노트북을 정리하면
조금 더 집중할 수 있는 것처럼
프롬프트를 정리하면 실제로
모델이 조금 더 잘 집중할 수 있습니다.
아, 흥미롭네요.
그래서 불필요한 컨텍스트를 제거하는 거군요.
필요한 컨텍스트를 제거할 위험은 없나요?
네. 어떻게 작동하나요?
네, 네, 네.
우리는 몇 가지 가드레일과 경계를 두고 있지만
일반적인 규칙은
몇 턴 전의 도구들을 제거하려고 하는데,
모델이 이미 그 도구들을 기반으로 결정을 내린 것들이죠.
모델이 이미 그 도구들을 기반으로 결정을 내린 것들이죠.
네, 최근에 테스트해봤는데
방금 호출한 도구들을 제거했더니
아, 내 도구 결과가 사라졌어, 뭘 해야 할지 모르겠어, 라고 하더라고요.
아, 내 도구 결과가 사라졌어, 뭘 해야 할지 모르겠어, 라고 하더라고요.
뭘 해야 할지 모르겠다고.
하지만 Sonnet 모델은 포기하지 않아요.
그냥 이 도구를 다시 호출하겠다고 하거든요.
네, 네, 네, 네.
하지만 그런 경험 때문에 일반적으로 경계를 두었고,
그런 경험 때문에요.
그래서 가장 최근의 도구들은 보존합니다.
아, 알겠습니다.
그리고 우리가 하는 또 다른 멋진 일은 이를 묘비화하는 것입니다.
즉, 도구 호출을 제거할 때,
모델에게 메모를 남겨둡니다.
검색 호출에 대한 도구 결과가 여기에 있었다고요.
아, 알겠네요. 그리고 제거되었다고.
그러면 모델이 완전히 기억을 잃지는 않는군요.
정확합니다.
모델이 더 나은 성능을 보이는 것을 발견했습니다
좀 더 많은 맥락을 제공했을 때요
무엇이 일어나고 있는지에 대해서요.
그게 핵심 기능이죠.
그리고 또 다른 하나는
우리가 추가한 이런 종류의 에이전트 메모리 기능입니다.
거기서 우리가 본 것은
모델이
현재로서는
모델에게 작업을 주면
깊은 연구 작업이든 포켓몬 게임이든 뭐든지
모델은 실행할 때마다 거의 똑같은 성능을 보입니다.
하지만 인간에게 작업을 주면
다섯 번째로 작업을 할 때
훨씬 더 잘합니다
배웠기 때문이죠
이런 검색을 할 때
아마 위키피디아 사이트가
다른 사이트보다 낫다거나 뭐든지요.
어떤 것이 좋은지 배우고, 시간이 지나면서 더 나아집니다.
그래서 이제 모델에게 이런 메모리 도구를 주었습니다
모델이 실제로 진행하면서 메모를 할 수 있도록
말하면서요
아, 이 웹사이트는 아마 적절하지 않다는 걸 깨달았다
아니면 검색을 할 때는 이렇게 해야 한다
아니면 찾아볼 때는 이 데이터베이스를 써야 한다
저 데이터베이스가 아니라 뭐든지요.
그리고 메모를 합니다.
그러다가 막혔을 때
실제로 돌아가서 자신의 메모를 검토하고
좋아, 이 작업을 시작한다고 말합니다
메모를 읽어서 해결책을 찾아보자고 하죠.
아, 멋지네요.
그래서 우리가 개발자를 위해 그 모든 것을 처리하고 있습니다.
네, 우리는 모델에게
메모리를 위한 핵심 기능을 제공하고 있고
현재로서는 개발자가 메모리를 관리하도록 하고 있습니다.
왜냐하면 개발자마다
클라우드 스토리지에 저장하고 싶어할 수도 있고
다른 곳에 저장하고 싶어할 수도 있거든요.
그래서 개발자들이 정확히 어디에
메모리를 저장할지 결정하도록 하고 있습니다.
그렇게 해서 그것에 대해 더 많은 제어권을 갖도록 하죠.
하지만 도구는 노출하고요. 도구는 노출합니다.
네, 도구를 노출합니다.
로드맵 질문으로 다시 돌아가서요.
최근에 출시한 새로운 기능들이 엄청나게 많은 것 같네요.
많은 모멘텀이 있고
이제 다른 제품들도 있고요
Claude Code SDK처럼
곧 출시될 것들도 있습니다.
케이틀린, 가장 기대하는 것은 무엇인가요?
앞으로 6-12개월 동안 미래는 어떻게 보이나요?
네, 우리가 조금 이야기했던
이런 높은 수준의 추상화에 대해서
실제로 가능한 한 간단하게 만들 수 있는
것을 말이죠
Claude에서 절대적으로 최고의 결과를 얻을 수 있도록요.
그리고 그것을 우리가 이야기한 관찰 가능성과
함께 결합하고 싶습니다
그렇게 하면 정말로
데이터를 보고 그런 통찰을 얻을 수 있어요
더 긴 실행 작업들로부터 말이죠.
그리고 이런 것들을 함께 결합할 수 있다면
그리고 이제 몇 가지 기능들에 대해 생각해보기 시작하면
Brad가 방금 말한 메모리와 같은 기능들을 말이죠
이런 선순환 구조를 정말로 볼 수 있게 됩니다
시간이 지남에 따라 우리가 단순히 여러분이
Claude에서 최고의 결과를 얻도록 도울 뿐만 아니라
자체 개선되고 지속적으로
향상되는 결과를 Claude로부터 얻을 수 있도록 도울 수 있습니다
그리고 제게는 그것이 로드맵의 궁극적인 마법이라고 생각합니다
그런 지점에 도달하는 것이죠. 여러분도 알다시피
사람들이 우리에게 찾아와서 Claude로 개발하고 있고
그들의 작업이 있고, 그들이 무엇을 하려는지 알고 있을 때
그들이 정말로 '아하!' 하는 순간들을 경험하게 됩니다
시간이 지날수록 점점 더 나아지고 있다는 것을 말이죠
그리고 아시다시피, 그것이 가장 큰 목표입니다
우리가 하는 모든 일에서
우리가 추구하고자 하는 것들을 확실히 하려고 노력하고 있습니다
정말 멋지네요
네, 저는 항상 모델 출시에 흥미를 느낍니다
마치 크리스마스 같아요. 와우
이제 무엇이 가능해질까요?
그래서 저는 모델이 출시될 때마다 가지고 노는 것을 좋아해요
더 많은 사용 사례들이 열리거든요
우리가 열심히 작업해온 몇 가지 사용 사례들이 있는데
개선하려고 노력해왔던 것들이 발전하는 것을 보는 것은 만족스럽고
또한 제가 전혀 생각하지 못했던 것들도 있어요
모델이 이런 것도 할 수 있을 거라고는 몰랐거든요
예를 들어, 이제 ASCII 그림을
훨씬 더 잘 그리거나 뭐 그런 것들 말이죠
아무튼 그런 것들이요
중요한 것들이죠. 매우 중요한 것들이에요
하지만 그것 외에도, 제가 정말 흥미롭게 생각하는 다른 것은
우리가 Claude에게 컴퓨터를 주는 초기 단계에 있다는 것입니다
생각해보세요. 만약 우리가 Anthropic에서 직원을 고용하고
그들을 환영하며 말하죠
"첫 출근을 축하합니다"
하지만 컴퓨터를 주지 않는다면
그들은 Anthropic에서 그다지 성공적이지 못할 것입니다
그래서 지금 본질적으로 모든 사람들이 Claude를 사용하고 있지만
Claude는 컴퓨터를 가지고 있지 않습니다
그래서 저는 Claude에게 컴퓨터를 주는 것에 대해 정말 흥미롭게 생각하고 있고
코드 실행 도구를 통해 그 아주 초기 단계를 볼 수 있습니다
모델이 VM에서 코드를 작성하고 실행할 수 있고
결과를 다시 받을 수 있습니다
그래서 이미지를 확대하거나
Excel 스프레드시트를 가져와서
차트와 그래프로 놀라운 데이터 분석을 만들 수 있습니다
그리고 이것은 단지 첫 걸음일 뿐입니다
만약 제가 지속적인 컴퓨터를 가지고 있다면
항상 거기에 있어서
필요에 따라 파일들을 정리하고
원하는 방식으로 도구들을 설정할 수 있다면
그런 시나리오에는 많은 발전 가능성이 있다고 생각합니다
네, 그리고 그 모든 것이 이 '족쇄 풀기'와 연결되는 것 같아요
정확히 그렇습니다
모든 것은 모델의 족쇄를 푸는 것에 관한 것입니다
바로 그것입니다. Claude에게 도구를 주는 것이죠
음, 저는 그런 미래가 기대됩니다
이런 대화를 해주셔서 정말 감사합니다
좋습니다
네, 감사합니다. 감사해요