[00:00]
개발자로서, 제 창의력에는 한계가 있어요.
[00:04]
제가 생각할 수 있는 사용 사례는 한정적이거든요.
[00:06]
하지만 모델은, 어떤 것이든
[00:08]
누군가 가져오는 어떤 것이든
[00:10]
모델이 그걸 수행하는 방법을 찾아낼 거예요.
[00:16]
안녕하세요, 저는 Alex입니다. Anthropic의 Claude Relations를 담당하고 있어요.
[00:19]
오늘 이야기할 주제는
[00:20]
Claude로 에이전트의 미래를 구축하는 것이고,
[00:22]
동료들과 함께 하겠습니다.
[00:23]
저는 Brad입니다.
[00:24]
Claude Developer Platform의 PM팀을 이끌고 있어요.
[00:27]
저는 Katelyn이고, Claude Developer Platform의
[00:29]
엔지니어링 팀을 담당합니다.
[00:30]
Claude Developer Platform에 대해 이야기해봅시다.
[00:32]
네, 그것부터 시작하죠.
[00:33]
그것부터 시작합시다. - 거기서부터.
[00:35]
예전에는 Anthropic API라고 불렸어요.
[00:37]
네. - 큰 이름 변경을 거쳤죠.
[00:38]
큰 이름 변경을 거쳤어요.
[00:40]
왜 그런 변경을 했는지 설명해주실 수 있나요?
[00:42]
그리고 이 새로운 플랫폼이 무엇이고 어떤 것들을 포함하는지도요?
[00:45]
네, 물론이죠.
[00:46]
Claude Developer Platform은
[00:48]
API, SDK, 문서화, 콘솔 내의 모든 경험을
[00:53]
포함하고 있고,
[00:55]
개발자가 Claude를 기반으로
[00:57]
구축하는데 필요한 모든 것을
[00:59]
정말 포함하고 있어요. 전 세계의
[01:02]
정말 훌륭한 고객분들을 섬기고 있어서
[01:04]
겸손하게 자랑스럽게 생각해요.
[01:06]
이분들이 Claude를 사용해서 지능의 한계를 높이려고 하시거든요.
[01:09]
플랫폼이 그것을 가능하게 해주죠.
[01:12]
제가 가장 좋아하는 부분 중 하나는
[01:14]
플랫폼이 외부 고객만 섬기는 게 아니라
[01:18]
실제로 우리 내부 제품도 섬긴다는 점이에요.
[01:21]
예를 들어, Claude Code는
[01:24]
실제로 우리 공개 플랫폼 위에 직접 구축되었다고
[01:27]
말씀드리는 걸 좋아해요. - 그렇군요. - 네, 제 생각에는
[01:29]
처음 시작할 때는
[01:30]
그냥 Anthropic API였어요.
[01:32]
모델에 대한 매우 단순한 접근이었죠.
[01:34]
하지만 지난 1년 정도 동안
[01:36]
수많은 기능을 추가했어요.
[01:38]
프롬프트 캐싱을 추가했고
[01:39]
완전히 별도의 배치 API를 추가했어요.
[01:43]
웹 검색, 웹 fetch를 추가했고
[01:45]
컨텍스트 관리 지원과 코드 실행 기능도 있어요.
[01:48]
이 모든 도구들이 있으니, 이제 이런
[01:50]
열망적으로는, 이제 플랫폼이라고 느껴져요.
[01:53]
이제 플랫폼이에요.
[01:54]
이제 훨씬 더 많은 것들이 있다는 거군요.
[01:56]
지난 1년 동안 꽤 극적으로 발전했어요.
[01:59]
네, 네. - 더 좋아졌죠, 그렇게 생각해요.
[02:00]
개발자들이 어차피
[02:03]
그렇게 부르고 있었거든요.
[02:04]
개발자들이 말하는 것에 맞춰가는 것이
[02:06]
자연스러운 일이죠.
[02:07]
우리가 조금 늦었어요.
[02:09]
원래 그런 기능이 있었던 거죠?
[02:10]
괜찮아요. - 우리가 보상했으니까요.
[02:14]
이제 할 수 있는 멋진 것 중 하나는
[02:16]
채팅 모델에서
[02:18]
좀 더 에이전트적인 미래로 이동하면서
[02:20]
이 개발자 플랫폼의 일부로 에이전트를 구축하는 거예요.
[02:24]
플랫폼에서 실제로 어떻게 하고 있는지
[02:26]
이야기하기 전에, 애초에 에이전트가 무엇인지
[02:29]
얘기해볼까요?
[02:30]
네, 에이전트는
[02:32]
거의 유행어 같은 거죠.
[02:33]
지금 이야기하는 모든 사람이 에이전트를 구축하고 있고
[02:36]
업계 기술 용어가 그 수준에 도달하면
[02:40]
정의가 매우 모호해져요.
[02:42]
모든 사람이 구축하는 모든 것이 에이전트가 되죠.
[02:44]
하지만 Anthropic에서 우리가 에이전트에 대해 정말로 생각하는 것은
[02:47]
모델이 어느 정도 자율성을 갖는 것입니다
[02:51]
어떤 도구를 호출할지 선택할 수 있고,
[02:53]
그 도구들을 호출하고, 결과를 처리하며,
[02:56]
다음 단계를 선택하는 것이죠.
[02:57]
기초 연구소로서,
[03:01]
모델과 그 추론 능력에 집중하고,
[03:05]
어떻게 결정을 내리는지,
[03:07]
이것이 에이전트의 정말 중요한 요소라고 생각합니다.
[03:09]
에이전트가 무엇인지에 대한 말이죠.
[03:10]
- 음, 어떤 면에서 자율적인 측면이 있다는 거네요.
[03:13]
- 네.
[03:14]
- 방향을 설정하는-
[03:15]
- 제가 생각하기에는,
[03:17]
정말 유용한 워크플로를 구축하는 고객들이 있습니다
[03:20]
Claude가 따라야 할 경로를 미리 정의하는 방식으로
[03:23]
Claude가 걸어야 할 길을
[03:24]
정말 유용한 일입니다.
[03:27]
하지만 에이전트 방식의 좋은 점은
[03:29]
몇 달마다 모델이 더 나아지면서
[03:32]
새로운 모델을 출시할 때
[03:33]
진정한 에이전트 패턴으로는
[03:36]
그런 서비스들이 자동으로 더 좋아집니다.
[03:38]
반면 많은 스캐폴딩으로
[03:41]
워크플로를 구축하면,
[03:42]
모델에 제약을 가하게 되죠.
[03:44]
어떤 사용 사례에서는 괜찮을 수도 있지만,
[03:46]
그것은 다음 수준의 지능을
[03:49]
활용하지 못할 수도 있다는 뜻입니다
[03:51]
다음 모델 릴리스가 제공하는.
[03:53]
- 네, 지난 6-12개월 동안
[03:55]
에이전트와 관련해서 흥미로운 트렌드가 있는 것 같습니다.
[03:58]
말씀하신 대로 스캐폴딩이
[04:00]
어느 정도 방해가 되었고,
[04:01]
그 일부를 제거하고 있는 것 같습니다.
[04:04]
그것에 대한 직관을 설명해 주실 수 있나요?
[04:08]
이것이 실제로 미래인가요?
[04:09]
모델에게 점점 더 적은 것을 제공하는 것이?
[04:12]
- 네, 시간이 지나면서
[04:14]
모델이 작업을 수행하기 위해
[04:17]
필요한 스캐폴딩이 줄어들고 있습니다
[04:21]
모델의 지능 수준이 올라가면서요.
[04:25]
그리고 이것은 계속 올라갈 것이라고 믿습니다
[04:28]
기본적으로 모델이 수행하려는
[04:32]
고수준 작업에 대한 맥락적 이해가 더 많아집니다.
[04:35]
따라서 가드레일이나
[04:38]
보호장치가 많이 필요하지 않고,
[04:41]
사실 경우에 따라서는 그런 가드레일들이
[04:44]
부담이 되기도 합니다.
[04:47]
새로운 모델을 시도한 고객들이
[04:49]
"아, 조금만 나아졌네요"라고 말하면
[04:50]
우리가 그들과 함께 살펴보면
[04:52]
무슨 일인지 알게 되죠.
[04:53]
그리고 알고 보니,
[04:54]
네, 그들이 모델을 제약하는 방식으로
[04:56]
모델의 지능을 보기 어렵게 만들고 있었던 거죠.
[04:58]
모델의 지능을요.
[04:59]
- 아, 이것이 현장에서
[05:02]
고객들과 함께 보고 있는 것과
[05:03]
일치하는 건가요?
[05:06]
같은 트렌드를 따르고 있는?
[05:08]
Claude를 관리하기 위한 모든 종류의 혁신적인
[05:12]
기술들을 탐구하고 있다는 걸 알고 있습니다.
[05:12]
- 네, 정말 그렇습니다.
[05:15]
그리고 실제로 지금
[05:16]
이것에 대한 많은 논의가 있죠?
[05:18]
에이전트가 무엇이고 무엇이 필요한지?
[05:19]
무엇을 구축해야 하는지?
[05:21]
어떤 사람들은
[05:22]
"그냥 와일드 루프야"라고 말하죠.
[05:24]
"그렇게 열심히 노력할 필요 없어." 그리고 궁극적으로
[05:29]
사람들이 모델 주변에 구축하고 있는
[05:32]
프레임워크들이 많이 진화해왔습니다
[05:35]
모델을 최대한 활용하려고 노력하고 있습니다.
[05:36]
그리고 업계가
[05:39]
어쩌면 중심에 두고 있는 것은
[05:41]
많은 부분이 너무 무거워졌고
[05:43]
너무 편향적이 되었다는 것입니다
[05:45]
그래서 사람들이
[05:48]
'그냥 간단한 반복문으로 돌아가자,
[05:50]
그것만 있으면 된다'고 말하는 이유죠.
[05:52]
저희가 여기서 하려는 것은
[05:55]
많은 면에서 간단한 반복문일 수도 있지만,
[05:57]
우리가 더 고유하게 할 수 있는 것들은
[06:00]
사람들이 모델을 최대한 활용할 수 있도록 돕는 것이고
[06:02]
그것은 바로 그런 도구들과 기능들입니다.
[06:05]
그래서 우리가 하고자 하는 것은
[06:07]
프레임워크와 도구, 플랫폼을 제공하는 것입니다
[06:09]
어느 정도는 의견이 담긴
[06:11]
사람들이 그런 도구들을 어떻게 사용해야 하는지에 대한 방향을 제시하는 것입니다.
[06:15]
하지만 이것이 너무 무거운 프레임워크는 아닙니다
[06:18]
브래드가 말한 대로 실제로는
[06:20]
모델이 궁극적으로 하려는 일에 방해가 되는.
[06:22]
적절한 균형을 맞추는 것입니다.
[06:23]
많은 사람들이 시도한 것들을 봐왔기 때문에
[06:25]
우리도 거기에 대해 의견을 가질 수 있다는 걸 알고 있지만,
[06:28]
우리가 그것을 하는 방식에서는 가벼워야 하고
[06:31]
우리가 진정으로 하고 있는 일이
[06:33]
모델을 최대한 활용할 수 있도록 돕는 것임을
[06:35]
너무 무거운 프레임워크로
[06:37]
여러분을 짓누르지 않으면서 말이죠.
[06:39]
- 맞습니다. 그렇다면 여기서 전략의 일부를
[06:40]
설명한다면
[06:41]
이런 보조 도구들과 기능들을 제공하는 것으로
[06:46]
모델에 주는 것이지만,
[06:47]
모델 자체에 범퍼나 제약을
[06:51]
두지는 않는다는 것인가요?
[06:53]
- 네, 우리는 이것을
[06:54]
어떻게 모델의 족쇄를 풀 것인가로 생각합니다.
[06:56]
모델은 이미 많은 능력을 가지고 있습니다.
[06:58]
사실, 저는 확신합니다
[06:59]
현재 세대의 모델들을 가져와도
[07:02]
그 안에는 우리가 해제할 수 있었던 것보다
[07:03]
훨씬 더 많은 지능이 있다고 말입니다.
[07:05]
하지만 어쨌든, 그 직관은 모델에게 단순히
[07:10]
필요한 도구들을 주고 자유롭게 놔두면,
[07:12]
올바른 방식으로 그것들을 사용할 수 있게 하면,
[07:15]
훌륭한 결과를 얻을 것이라는 겁니다.
[07:16]
좋은 예시 중 하나는
[07:19]
우리가 출시한 서버 사이드 웹 검색 도구와
[07:23]
웹 페치 도구입니다.
[07:24]
고객들이 이것들을 사용하는 것을 지켜보는 것은 흥미로웠습니다.
[07:28]
실제로 우리가 한 것은
[07:30]
매우 최소한의 프롬프트였습니다.
[07:32]
웹 검색 도구만 주었는데
[07:34]
갑자기 깊이 있는 연구 작업이
[07:37]
거의 완전히 완성되었습니다
[07:40]
API에서 그 스위치만 켜면 말이죠.
[07:43]
모델이 그 도구를 호출하고,
[07:45]
결과를 보고, 그것을 고려해서
[07:48]
아, 다른 검색을 더 해야겠다고
[07:50]
결정하기도 하고
[07:51]
그러다가, 오, 네 번째 링크가
[07:53]
바로 그거야.
[07:54]
그 링크에 웹 페치를 해서 데이터를 가져옵니다.
[07:57]
정말로 이 모든 것을 매우 자율적으로 스스로
[08:00]
결정하면서 말이죠.
[08:01]
- 맞습니다, 이것은 어떤 면에서
[08:03]
시스템의 지능이 적용되는 위치의
[08:06]
흥미로운 변화인 것 같습니다.
[08:07]
- 정확히 맞습니다.
- 개발자가
[08:09]
자신의 지능을 적용해서 안내하던 것에서
[08:11]
이제는 모델이 알아서 해결하는 것으로요.
[08:13]
- 맞습니다, 모델이 하는 일은 정말 흥미진진합니다.
[08:16]
개발자로서
[08:18]
제 창의력은 어느 시점에서 한계에 다다르거든요.
[08:20]
저는 한정된 사용 사례만 생각해낼 수 있어요.
[08:22]
하지만 모델은 다른 모든 것과 마찬가지로,
[08:24]
누군가가 어떤 요청을 가져와도 모델이 그것을 수행할 방법을 찾아낼 거예요.
[08:27]
그 일을 해내죠.
[08:28]
모델의 제약을 풀어주는 것은 정말 멋진 일이에요.
[08:31]
그렇네요. 그럼 제가 오늘 개발자라면
[08:33]
개발자 플랫폼으로 개발을 시작할 때
[08:35]
무엇을 추천하시나요?
[08:38]
시작하기 위한 모범 사례나 방법이 있을까요?
[08:41]
네, 매우 실용적으로 말씀드리면, 실제로 저희가 현재 가장 추천하는 것은
[08:44]
Claude Code SDK입니다.
[08:48]
그리고 정말 흥미로운 점은
[08:49]
Claude Code SDK에 대해서는
[08:50]
저희가 본질적으로 모델 주변에 에이전트 하네스를 구축했다는 것입니다.
[08:54]
그 루프를 실행하기 위한 에이전틱 하네스 말이죠.
[08:58]
그리고 많은 도구 호출을 자동화하고
[09:00]
다른 기능들의 사용도 자동화합니다.
[09:01]
그리고 명백히 원래는 코딩 목적으로 만들어졌죠.
[09:05]
그런데 팀이 정말 빠르게 깨달은 것은
[09:07]
실제로 이것이 훌륭한
[09:09]
범용 에이전틱 하네스라는 것이었어요.
[09:12]
그래서 SDK가 하는 일은 사람들에게 완벽한
[09:16]
즉시 사용 가능한 솔루션을 제공하는 것입니다
[09:17]
실제로 에이전트 프로토타이핑을 바로 시작할 수 있도록
[09:20]
모든 도구 호출과 기타 기능들로
[09:22]
루프를 직접 구축해야 하는 수고를 덜어주죠.
[09:25]
메시지 API 위에 구축되어 있고
[09:27]
저희가 언급한 모든 동일한 도구들을 사용합니다.
[09:30]
하지만 정말 훌륭한 시작점을 제공하죠
[09:32]
바로 즉시 사용 가능한 상태로요.
[09:33]
맞습니다. 이것이 꽤 흔한 오해인 것 같아요.
[09:35]
적어도 제가 개발자들과
[09:37]
Claude Code SDK에 대해 이야기할 때요.
[09:39]
저는 코딩 애플리케이션을 만드는 게 아닌데
[09:42]
왜 이것을 사용하고 싶을까요?
[09:44]
하지만 코딩 전용 부분들을 제거할 수 있어요.
[09:47]
네, 제 생각에는 그것이 저희가 이야기했던
[09:50]
모델에서 스캐폴딩을 제거하는
[09:51]
훌륭한 예시라고 생각합니다.
[09:53]
Claude Code에서 모델의 제약을 풀기 위해 것들을 제거하고 나면
[09:57]
정말 모델의 제약을 풀게 되는데,
[09:59]
결과적으로 코딩과 관련된 것은 아무것도 남지 않더라고요.
[10:01]
다른 모든 것을 제거하고 나면
[10:03]
그저 에이전틱 루프만 남고
[10:05]
Claude에게 파일 시스템에 대한 접근권한을 주는
[10:08]
정말 미니멀한 것만 남게 되죠.
[10:12]
Linux 명령줄 도구들의 집합에 대한 접근권한
[10:15]
그리고 코드를 작성하고
[10:17]
그 코드를 실행할 수 있는 능력 말이에요.
[10:19]
따라서 이것들은 모두 매우 일반적인 종류의 기능들이고
[10:22]
다양한 문제들을 해결할 수 있다는 것이 밝혀졌죠.
[10:24]
맞아요, 네.
[10:25]
제가 개인 프로젝트에서 계속 마주치는
[10:28]
것이라고 느끼고
[10:29]
Anthropic 내부 프로젝트들에서도 보는 것은
[10:32]
Claude Code SDK 이전에는
[10:34]
모든 사람이 어떤 형태든
[10:36]
프롬프트 캐싱 관리나
[10:38]
도구 호출과 그 루프를 관리하는
[10:40]
어떤 형태를 구현하고 있었어요.
[10:42]
그런데 이제는 이 기본 지점에서 시작해서
[10:45]
거기서부터 구축하면 되는 거죠.
[10:46]
조금 더 높은 지점에서 시작하는 거예요.
[10:47]
네. 네, 맞아요.
[10:48]
한 단계 더 높은 수준의 추상화인 것 같아요.
[10:50]
정말 흥미롭다고 생각해요.
[10:51]
제 생각에 또 다른 정말 흥미로운 점은
[10:53]
특히 에이전트를 고려하는 비즈니스들이 생각해야 할
[10:57]
타겟할 사용 사례가 무엇인지입니다.
[11:00]
기술을 넘어서 생각해보면
[11:02]
해결해야 할 실제 문제가 무엇인지 말이에요.
[11:05]
그리고 저는 많은 고객들을 보고 있다고 생각합니다
[11:07]
그리고 우리가 사랑하는 많은 것들을 하고 있지만,
[11:10]
하지만 가장 큰 임팩트가 있는 곳은
[11:12]
고객이 신중하게 생각한 곳입니다
[11:15]
이것의 비즈니스 가치가 무엇인지 말이죠.
[11:18]
실제로 이 정도의 엔지니어링 시간을 절약할 것인지
[11:22]
또는 이 정도의 수동 작업을 제거하는데 도움이 될 것인지 등등?
[11:28]
그리고 에이전트 프로젝트의 예상되는 결과를
[11:31]
명확히 표현할 수 있는 것이
[11:33]
정말 도움이 된다고 생각합니다
[11:34]
에이전트의 범위를 정의하는데 말이죠.
[11:37]
- 맞습니다. SDK로 다시 한번 연결해보면
[11:41]
개발자들에게 정말 유용했던 것 같습니다
[11:44]
저와 같은 개별 개발자들에게 말이죠
[11:46]
시작하면서 단순히 빠르게
[11:48]
무언가를 해킹하고 싶을 때
[11:50]
이러한 고객들을 위해, 기업들을 위해
[11:52]
실제 비즈니스 가치를 얻으려고 하는
[11:54]
이런 것들에 대해서요.
[11:56]
그들이 SDK를 사용해야 할까요?
[11:57]
준비가 되었나요?
[11:58]
그런 규모의 사용을 위해 준비가 되었나요?
[12:01]
- 네, 여러 면에서 그렇다고 생각합니다
[12:04]
여러 면에서 만약 당신이
[12:08]
그 런타임을 배포할 수 있는 상황에 있다면
[12:10]
본질적으로, 그것이 SDK에서 얻는 것입니다
[12:12]
에이전틱 루프 런타임이죠.
[12:15]
원하는 곳 어디든 그 런타임을 배포할 수 있습니다
[12:17]
준비가 되었을 때 언제든지요.
[12:19]
하지만 우리가 정말 하려는 것은
[12:20]
SDK가 사람들에게 제공하는 그 정신을 가져와서
[12:24]
더 높은 수준의 추상화로 올라가는 것입니다
[12:27]
루프를 제공하고
[12:28]
자동화된 방식으로 많은 도구 호출을 제공해서
[12:31]
이것으로부터 어떻게 배울 수 있을지
[12:33]
그리고 사람들에게 규모에서 즉시 사용 가능한 솔루션을 제공하는 방법을
[12:37]
정말로 그들의 사용 사례를 해결할 수 있도록 말이죠.
[12:40]
그리고 그것이 우리가 나아가려는 방향의 대부분입니다
[12:43]
올해 남은 기간 동안의 로드맵에서 말이죠.
[12:45]
그리고 우리가 그것에 대해 생각할 때 정말 중요한 부분은
[12:48]
만약 여기서의 전체 목표가 우리 사용자들을 돕는 것이라면
[12:52]
정말로 지능의 한계를 높이고
[12:54]
모델에서 최고의 결과를 얻는 것이라면
[12:56]
더 높은 수준의 추상화는 단지 쉽게 만드는 것이 아닙니다
[13:00]
모든 코드를 직접 작성할 필요가 없어서 말이죠.
[13:02]
실제로는 어떻게 하면 우리가 정말로
[13:05]
최고의 결과를 얻도록 도울 수 있느냐는 것입니다.
[13:07]
우리는 연구팀과 같은 공간에 있고
[13:09]
추론팀과도 같은 공간에 있어서
[13:10]
우리의 추상화를 어떻게 만들지 알고 있습니다
[13:13]
우리의 에이전틱 루프가 극도로 강력하고
[13:16]
Claude와 함께 작업하는데 극도로 뛰어나게 만드는 방법을 말이죠.
[13:19]
그리고 마지막으로 덧붙이고 싶은 것은
[13:21]
특히 이것들이 더 오래 실행되고
[13:24]
우리가 점점 더 많은 도구를 제공하면서
[13:25]
사람들이 더 오래 실행되는 작업에 접근할 수 있도록 도울 때
[13:28]
우리 사용자들이 가지고 있는 또 다른 큰 문제는
[13:30]
계속 해결하려고 할 것을 우리가 알고 있는
[13:32]
더 오래 실행되는 작업 내에서의 관찰 가능성입니다.
[13:36]
그리고 그것이 사람들에게 가장 흔히 나오는
[13:39]
문제 중 하나입니다
[13:41]
오래 실행되는 작업이 있고
[13:42]
정말 좋은 결과를 얻으려고 하는데
[13:45]
하지만 약간의 조정이 필요할 수 있거나
[13:48]
프롬프트를 조정해야 할 수 있거나
[13:49]
도구 호출에 대해
[13:51]
조금 다르게 생각해야 할 수도 있죠.
[13:52]
그리고 그것이 우리가 사람들에게 줄 수 있다는 것을 알고 있는 것입니다
[13:55]
시간이 지나면서 플랫폼을 통한 관찰 가능성을 말이죠.
[13:58]
그리고 그것이 우리가 집중하고 있는 또 다른 큰 영역입니다.
[14:00]
음, 정말 흥미롭네요.
[14:02]
이건 정말 큰 이슈가 되어왔는데
[14:04]
특히 에이전트와 함께 문제가 대두되기 시작했죠-
[14:07]
맞다고 생각합니다.
[14:08]
- 특히 에이전트가 백그라운드에서
[14:11]
다른 애플리케이션에서 작업하도록 신뢰할 때,
[14:13]
실제로 올바른 일을 하고 있는지 어떻게 확인하고
[14:15]
배포할 때도 마찬가지죠.
[14:17]
맞아요, 어떻게 감사하죠?
[14:18]
시스템에 어느 정도 자율성을 부여한다면
[14:20]
이를 감사할 수 있는 방법이 필요하고
[14:22]
올바른 일이 일어나고 있는지 확인해야 합니다.
[14:24]
그래야 설정을 조정하고 할 수 있죠.
[14:26]
그래서 관찰 가능성이 정말 핵심 요소라고 생각합니다.
[14:31]
여기서 잠시 멈추고 질문을 드리고 싶은데요,
[14:34]
앞으로 이 문제를 어떻게 해결할 것인지에 대해서요.
[14:37]
그 전에, 지금 존재하는 다른 도구들 중에서
[14:41]
사람들이 알아야 할
[14:42]
개발자 플랫폼을 시작할 때
[14:45]
도움이 되거나 유용하다고 생각하는 것들이 있나요?
[14:48]
네, 음, 생각해보면
[14:49]
웹 검색과 웹 페치를 언급했고요.
[14:52]
우리가 보고 있는 또 다른 큰 것은
[14:56]
현재 고객들이 컨텍스트 윈도우를 관리하기 위해
[15:01]
많은 작업을 해야 한다는 것입니다.
[15:02]
기본적으로 Claude는 20만 토큰의 컨텍스트를 가지고 있습니다.
[15:06]
지금 Sonnet에서 베타로 100만 토큰을 사용할 수 있는데,
[15:11]
훌륭하지만, 100만이라도 한계가 있습니다.
[15:14]
그리고 많은 고객들이 우리에게 말한 것은
[15:17]
컨텍스트의 더 작은 부분을 사용해도
[15:20]
더 나은 출력, 더 높은 지능을 얻는다는 것입니다.
[15:24]
그래서 우리는 몇 가지 멋진 기능을 만들었는데
[15:27]
방금 출시되고 있는
[15:29]
개발자들이 컨텍스트를 관리하는 데 도움이 되는 것들입니다.
[15:31]
이런 에이전트 루프에서는 많은 경우
[15:35]
10, 15, 100번의 도구 호출을 하고 파일을 편집하거나
[15:40]
데이터베이스에서 데이터를 찾거나
[15:41]
이메일을 보내거나 하는데
[15:44]
이런 도구 호출 각각이
[15:47]
100, 200, 1,000 토큰을 차지합니다.
[15:49]
그래서 우리에게는 멋진 기능이 있는데
[15:51]
모델이 실제로 더 이상 필요하지 않은
[15:55]
오래된 도구 호출들을 제거할 수 있게 합니다.
[15:58]
흥미롭네요. 그리고 그것은
[16:00]
마치 책상을 정리하고
[16:02]
노트북을 정리하면
[16:03]
조금 더 집중할 수 있는 것처럼
[16:05]
프롬프트를 정리하면 실제로
[16:07]
모델이 조금 더 잘 집중할 수 있습니다.
[16:09]
아, 흥미롭네요.
[16:10]
그래서 불필요한 컨텍스트를 제거하는 거군요.
[16:12]
필요한 컨텍스트를 제거할 위험은 없나요?
[16:16]
네. 어떻게 작동하나요?
[16:17]
네, 네, 네.
[16:17]
우리는 몇 가지 가드레일과 경계를 두고 있지만
[16:22]
일반적인 규칙은
[16:24]
몇 턴 전의 도구들을 제거하려고 하는데,
[16:26]
모델이 이미 그 도구들을 기반으로 결정을 내린 것들이죠.
[16:30]
모델이 이미 그 도구들을 기반으로 결정을 내린 것들이죠.
[16:31]
네, 최근에 테스트해봤는데
[16:33]
방금 호출한 도구들을 제거했더니
[16:35]
아, 내 도구 결과가 사라졌어, 뭘 해야 할지 모르겠어, 라고 하더라고요.
[16:39]
아, 내 도구 결과가 사라졌어, 뭘 해야 할지 모르겠어, 라고 하더라고요.
[16:41]
뭘 해야 할지 모르겠다고.
[16:42]
하지만 Sonnet 모델은 포기하지 않아요.
[16:44]
그냥 이 도구를 다시 호출하겠다고 하거든요.
[16:46]
네, 네, 네, 네.
[16:47]
하지만 그런 경험 때문에 일반적으로 경계를 두었고,
[16:50]
그런 경험 때문에요.
[16:51]
그래서 가장 최근의 도구들은 보존합니다.
[16:53]
아, 알겠습니다.
[16:54]
그리고 우리가 하는 또 다른 멋진 일은 이를 묘비화하는 것입니다.
[16:58]
즉, 도구 호출을 제거할 때,
[17:02]
모델에게 메모를 남겨둡니다.
[17:04]
검색 호출에 대한 도구 결과가 여기에 있었다고요.
[17:08]
아, 알겠네요. 그리고 제거되었다고.
[17:09]
그러면 모델이 완전히 기억을 잃지는 않는군요.
[17:11]
정확합니다.
[17:12]
모델이 더 나은 성능을 보이는 것을 발견했습니다
[17:14]
좀 더 많은 맥락을 제공했을 때요
[17:16]
무엇이 일어나고 있는지에 대해서요.
[17:19]
그게 핵심 기능이죠.
[17:22]
그리고 또 다른 하나는
[17:23]
우리가 추가한 이런 종류의 에이전트 메모리 기능입니다.
[17:28]
거기서 우리가 본 것은
[17:30]
모델이
[17:33]
현재로서는
[17:36]
모델에게 작업을 주면
[17:38]
깊은 연구 작업이든 포켓몬 게임이든 뭐든지
[17:42]
모델은 실행할 때마다 거의 똑같은 성능을 보입니다.
[17:46]
하지만 인간에게 작업을 주면
[17:49]
다섯 번째로 작업을 할 때
[17:50]
훨씬 더 잘합니다
[17:52]
배웠기 때문이죠
[17:53]
이런 검색을 할 때
[17:55]
아마 위키피디아 사이트가
[17:58]
다른 사이트보다 낫다거나 뭐든지요.
[17:59]
어떤 것이 좋은지 배우고, 시간이 지나면서 더 나아집니다.
[18:03]
그래서 이제 모델에게 이런 메모리 도구를 주었습니다
[18:05]
모델이 실제로 진행하면서 메모를 할 수 있도록
[18:08]
말하면서요
[18:09]
아, 이 웹사이트는 아마 적절하지 않다는 걸 깨달았다
[18:13]
아니면 검색을 할 때는 이렇게 해야 한다
[18:15]
아니면 찾아볼 때는 이 데이터베이스를 써야 한다
[18:18]
저 데이터베이스가 아니라 뭐든지요.
[18:20]
그리고 메모를 합니다.
[18:21]
그러다가 막혔을 때
[18:23]
실제로 돌아가서 자신의 메모를 검토하고
[18:25]
좋아, 이 작업을 시작한다고 말합니다
[18:28]
메모를 읽어서 해결책을 찾아보자고 하죠.
[18:30]
아, 멋지네요.
[18:31]
그래서 우리가 개발자를 위해 그 모든 것을 처리하고 있습니다.
[18:34]
네, 우리는 모델에게
[18:36]
메모리를 위한 핵심 기능을 제공하고 있고
[18:39]
현재로서는 개발자가 메모리를 관리하도록 하고 있습니다.
[18:42]
왜냐하면 개발자마다
[18:43]
클라우드 스토리지에 저장하고 싶어할 수도 있고
[18:46]
다른 곳에 저장하고 싶어할 수도 있거든요.
[18:47]
그래서 개발자들이 정확히 어디에
[18:49]
메모리를 저장할지 결정하도록 하고 있습니다.
[18:51]
그렇게 해서 그것에 대해 더 많은 제어권을 갖도록 하죠.
[18:54]
하지만 도구는 노출하고요. 도구는 노출합니다.
[18:56]
네, 도구를 노출합니다.
[18:57]
로드맵 질문으로 다시 돌아가서요.
[19:00]
최근에 출시한 새로운 기능들이 엄청나게 많은 것 같네요.
[19:02]
많은 모멘텀이 있고
[19:03]
이제 다른 제품들도 있고요
[19:04]
Claude Code SDK처럼
[19:06]
곧 출시될 것들도 있습니다.
[19:10]
케이틀린, 가장 기대하는 것은 무엇인가요?
[19:12]
앞으로 6-12개월 동안 미래는 어떻게 보이나요?
[19:15]
네, 우리가 조금 이야기했던
[19:17]
이런 높은 수준의 추상화에 대해서
[19:18]
실제로 가능한 한 간단하게 만들 수 있는
[19:22]
것을 말이죠
[19:23]
Claude에서 절대적으로 최고의 결과를 얻을 수 있도록요.
[19:27]
그리고 그것을 우리가 이야기한 관찰 가능성과
[19:29]
함께 결합하고 싶습니다
[19:30]
그렇게 하면 정말로
[19:32]
데이터를 보고 그런 통찰을 얻을 수 있어요
[19:34]
더 긴 실행 작업들로부터 말이죠.
[19:37]
그리고 이런 것들을 함께 결합할 수 있다면
[19:38]
그리고 이제 몇 가지 기능들에 대해 생각해보기 시작하면
[19:40]
Brad가 방금 말한 메모리와 같은 기능들을 말이죠
[19:42]
이런 선순환 구조를 정말로 볼 수 있게 됩니다
[19:44]
시간이 지남에 따라 우리가 단순히 여러분이
[19:46]
Claude에서 최고의 결과를 얻도록 도울 뿐만 아니라
[19:48]
자체 개선되고 지속적으로
[19:50]
향상되는 결과를 Claude로부터 얻을 수 있도록 도울 수 있습니다
[19:53]
그리고 제게는 그것이 로드맵의 궁극적인 마법이라고 생각합니다
[19:56]
그런 지점에 도달하는 것이죠. 여러분도 알다시피
[19:59]
사람들이 우리에게 찾아와서 Claude로 개발하고 있고
[20:02]
그들의 작업이 있고, 그들이 무엇을 하려는지 알고 있을 때
[20:05]
그들이 정말로 '아하!' 하는 순간들을 경험하게 됩니다
[20:08]
시간이 지날수록 점점 더 나아지고 있다는 것을 말이죠
[20:12]
그리고 아시다시피, 그것이 가장 큰 목표입니다
[20:15]
우리가 하는 모든 일에서
[20:16]
우리가 추구하고자 하는 것들을 확실히 하려고 노력하고 있습니다
[20:18]
정말 멋지네요
[20:19]
네, 저는 항상 모델 출시에 흥미를 느낍니다
[20:21]
마치 크리스마스 같아요. 와우
[20:23]
이제 무엇이 가능해질까요?
[20:25]
그래서 저는 모델이 출시될 때마다 가지고 노는 것을 좋아해요
[20:28]
더 많은 사용 사례들이 열리거든요
[20:30]
우리가 열심히 작업해온 몇 가지 사용 사례들이 있는데
[20:32]
개선하려고 노력해왔던 것들이 발전하는 것을 보는 것은 만족스럽고
[20:35]
또한 제가 전혀 생각하지 못했던 것들도 있어요
[20:38]
모델이 이런 것도 할 수 있을 거라고는 몰랐거든요
[20:41]
예를 들어, 이제 ASCII 그림을
[20:42]
훨씬 더 잘 그리거나 뭐 그런 것들 말이죠
[20:45]
아무튼 그런 것들이요
[20:46]
중요한 것들이죠. 매우 중요한 것들이에요
[20:48]
하지만 그것 외에도, 제가 정말 흥미롭게 생각하는 다른 것은
[20:51]
우리가 Claude에게 컴퓨터를 주는 초기 단계에 있다는 것입니다
[20:56]
생각해보세요. 만약 우리가 Anthropic에서 직원을 고용하고
[20:59]
그들을 환영하며 말하죠
[21:01]
"첫 출근을 축하합니다"
[21:02]
하지만 컴퓨터를 주지 않는다면
[21:04]
그들은 Anthropic에서 그다지 성공적이지 못할 것입니다
[21:07]
그래서 지금 본질적으로 모든 사람들이 Claude를 사용하고 있지만
[21:10]
Claude는 컴퓨터를 가지고 있지 않습니다
[21:12]
그래서 저는 Claude에게 컴퓨터를 주는 것에 대해 정말 흥미롭게 생각하고 있고
[21:15]
코드 실행 도구를 통해 그 아주 초기 단계를 볼 수 있습니다
[21:18]
모델이 VM에서 코드를 작성하고 실행할 수 있고
[21:20]
결과를 다시 받을 수 있습니다
[21:24]
그래서 이미지를 확대하거나
[21:26]
Excel 스프레드시트를 가져와서
[21:30]
차트와 그래프로 놀라운 데이터 분석을 만들 수 있습니다
[21:32]
그리고 이것은 단지 첫 걸음일 뿐입니다
[21:36]
만약 제가 지속적인 컴퓨터를 가지고 있다면
[21:38]
항상 거기에 있어서
[21:39]
필요에 따라 파일들을 정리하고
[21:41]
원하는 방식으로 도구들을 설정할 수 있다면
[21:44]
그런 시나리오에는 많은 발전 가능성이 있다고 생각합니다
[21:47]
네, 그리고 그 모든 것이 이 '족쇄 풀기'와 연결되는 것 같아요
[21:51]
정확히 그렇습니다
[21:54]
모든 것은 모델의 족쇄를 푸는 것에 관한 것입니다
[21:55]
바로 그것입니다. Claude에게 도구를 주는 것이죠
[21:57]
네
[21:59]
네
[22:00]
음, 저는 그런 미래가 기대됩니다
[22:02]
이런 대화를 해주셔서 정말 감사합니다
[22:03]
좋습니다
[22:04]
네, 감사합니다. 감사해요