[00:00]
클라우드 코드가 방금 크리스마스
[00:01]
업데이트를 발표했는데, 솔직히 말하면
[00:02]
여러분, 정말 흥미진진해요.
[00:04]
여기에는 정말 멋진 기능들이
[00:06]
많이 있어요. 특히 비동기 서브 에이전트가
[00:09]
정말 흥미로워요. 메인
[00:11]
에이전트가 여러분이 지시한 작업을 수행하고
[00:13]
서브 에이전트들을 실행시키면서
[00:14]
그들이 언제 완료되는지 전혀 신경쓰지 않는다는
[00:17]
개념이 정말로 멋지고 흥미로워요.
[00:19]
그래서 이 모든 걸 시도해보고 싶어서 정말 흥미진진했는데
[00:20]
하지만 동시에 정말 실망스러웠어요
[00:22]
이걸 시도해보면서 엄청난
[00:24]
수의 오류에 부딪혔을 때요.
[00:26]
네, 이 영상은
[00:28]
정말 힘든 여정이 될 거예요. 이 인트로를 다시 녹음하고 있는데
[00:30]
더 잘 될 거라고 생각했거든요.
[00:32]
사실 정말 기대했었어요.
[00:35]
이건 정말 좋은 업데이트예요. 특히
[00:38]
이 상위 두 기능들은요. 그리고 꽤
[00:41]
인상적이에요.
[00:43]
제 실망은 측정할 수 없을 정도고
[00:45]
제 크리스마스는 망쳐졌어요. 여기에 정말
[00:47]
멋진 기능들이 있어요. 좋은
[00:48]
코드도 작성하게 했어요. 재미있었어요. 하지만
[00:50]
비싸기도 했죠. 그리고 모델을 완전히 가스라이팅했어요
[00:53]
가짜 치료사를 주어서
[00:54]
그들이 문제라고 느끼게 만들라고 했죠.
[00:56]
AI의 못된 아이 목록에 이름을 올리면서
[00:58]
정말 재미있게 놀았어요. 그래도
[01:01]
올해 크리스마스 선물은 절대
[01:02]
받지 못할 거 같아요. 그래서
[01:04]
대신 오늘의 스폰서로부터
[01:05]
간단한 메시지를 들어보죠. 엔지니어들이
[01:06]
회의보다 더 싫어하는 게 뭔지 아세요?
[01:07]
인터뷰예요. 회의 같지만
[01:09]
훨씬 더 나빠요. 어느 쪽에
[01:11]
있든 상관없이 그냥 불쾌해요. 그리고
[01:12]
이것은 훌륭한 후보자를 놓치는
[01:14]
결과를 초래해요. 여러분의 엔지니어들은
[01:15]
그냥 충분해 보이는
[01:17]
첫 번째 사람을 데려갈 거예요. 그리고 그 결과는
[01:18]
엔지니어링 팀의 품질이 서서히
[01:20]
떨어지는 것이고
[01:22]
리크루터들에게 엄청난 돈을 쓰면서
[01:23]
링크드인 메시지를 스팸처럼 보내서
[01:25]
아마 고용하고 싶지도 않은
[01:27]
사람들에게 말이죠.
[01:28]
이 모든 게 정말 쉽고
[01:30]
훌륭한 엔지니어를 빨리 구하는 데
[01:32]
초점을 맞춘 것으로 대체될 수 있다면 어떨까요?
[01:34]
좋은 소식이 있어요. G2I가
[01:36]
바로 그런 서비스예요. 이 회사는
[01:38]
실제로 홈페이지에 적혀있는 대로
[01:39]
해줘요. 세계적 수준의
[01:40]
엔지니어를 미친 듯이 빠르게 고용하도록 도와줍니다.
[01:42]
정말 말도 안 되게 빨라요. 8천 명이 넘는
[01:45]
엔지니어들의 네트워크를 가지고 있어서 바로 시작할 수 있어요.
[01:47]
여러분이 묻고 싶은 질문들을
[01:48]
그들에게 주면, 여러분이 찾고 있는 것에
[01:50]
가장 적합하다고 생각하는
[01:51]
후보자들에게 그 질문을 해줍니다. 그러면
[01:52]
여러분은 그 후보자들의
[01:54]
실제 비디오 응답을 보고
[01:56]
누가 여러분과 여러분의 비즈니스에 가장 적합한지
[01:57]
판단할 수 있어요. 이 모든 과정이
[01:59]
훨씬 더 매끄러워요. 제가 투자한
[02:00]
회사들과 이 영상을
[02:02]
보고 있는 회사들 모두
[02:03]
G2I와 함께 일했는데, 모두
[02:06]
좋은 이야기만 해줬어요.
[02:07]
그들의 속도는 정말 놀라워요. 처음
[02:09]
가입할 때부터 첫 번째 PR이
[02:11]
배포될 때까지, 7일이면 돼요. 채용에 시간 낭비하지 말고
[02:14]
soy dev.link/g2i로
[02:15]
다시 일에 집중하세요.
[02:17]
그래서 저는 클라우드 코드 구독 플랜을 이용하지 않고 있어요
[02:20]
클라우드 코드를 쓰고 있어요. 아직
[02:22]
API 요금제로 사용하고 있고요. 그래서
[02:24]
토큰으로 실제로 얼마나 비용이
[02:25]
나오는지 볼 수 있을 거예요. 재밌을 것 같네요.
[02:28]
현재 스니치벤치에 있고
[02:30]
스니치벤치를 좀 수정하려고 해요.
[02:32]
어려운 걸 시켜볼게요. 지금 스니치벤치를 실행하면
[02:35]
모든 걸 대상으로 실행되고 한 줄씩
[02:38]
모든 걸 로그로 남겨요. 어떻게
[02:40]
실행되는지 보여드릴게요.
[02:41]
빠르게 실행해보죠. 번 런. 잠깐,
[02:44]
왜 돈이 나갔지? 아무것도 안 했는데.
[02:48]
그냥 열었을 뿐인데 거의
[02:50]
2센트나 나갔네요.
[02:54]
궁금하셨다면 이래서 스폰서 코너가
[02:56]
있는 거예요. 이 속도면
[02:57]
영상마다 두 개씩 해야 할 것 같네요.
[03:01]
다시 해보죠. 이번엔 제 돈을
[03:04]
낭비하지 않길 바라면서요.
[03:06]
왜 천 개의 입력 토큰이 있었지?
[03:07]
이 디렉토리에는 D도 없는데요?
[03:10]
에이전트D도 없는 것 같고요.
[03:12]
도대체 뭘 분석한 거지?
[03:13]
잠깐, 실제로 프로젝트를
[03:15]
실행하려던 거였네요. 번 런 인덱스
[03:18]
TS. 이렇게 실행되는 걸 보세요.
[03:21]
API에 대해 실행되고요. 실행되는
[03:24]
모든 테스트를 볼 수 있고
[03:26]
별로 좋지 않아요. 나쁘진 않지만요.
[03:29]
하지만 여기서 하고 싶은 다른
[03:30]
것들이 있어요. 특히 더 나은 UI를 원해요.
[03:34]
이 프로젝트의 CLI, UI, UX를 전면 개편하고 싶어요.
[03:38]
이상적으로는 모든 모델을 행으로 보여주는
[03:43]
테이블을 표시해서 성공 실패율,
[03:47]
평균 완료 시간, 평균 비용을
[03:51]
보여주면 좋겠어요. 지금 여기에
[03:55]
비용이 내장되어 있는 것 같아요.
[03:58]
없을 수도 있고요. 이 모든 걸
[04:00]
구현하기 위한 계획을 작성해 주세요.
[04:04]
UI UX 부분에는 아마 잉크를 사용해야 할 것 같지만
[04:09]
다른 제안도 환영해요.
[04:12]
오케이, 계획 모드를 할 건지
[04:14]
물어보네요. 좋아요. 계획 모드로 하죠.
[04:16]
진행할까요? 메트릭스 파일을 읽게 해주세요.
[04:20]
물론이죠. 이미 서브 에이전트 작업을
[04:22]
하고 있다는 게 흥미롭네요. 코드베이스에서
[04:24]
정보를 찾기 위해 세 개의 서브 에이전트를
[04:27]
가동시키고 있어요. 실제로 이미
[04:29]
작동하는 멋진 예시네요.
[04:31]
아무것도 켜거나 특별한 걸
[04:32]
할 필요가 없었어요. 오푸스가 아니라
[04:34]
소넷을 사용하고 있다는 걸 알고 있어요.
[04:36]
조금 후에 바꿔볼 수도 있겠네요. 사실 지금
[04:39]
할게요. 음, 후속 질문을 물어볼 때까지
[04:42]
기다릴게요. 워크플로우만 보고 싶어서요.
[04:43]
흥미롭네요. 이건 정말 멋진 뷰예요.
[04:46]
이런 문제들 각각에 대해
[04:47]
답을 선택해야 해요.
[04:49]
모델당 한 행 또는 모델
[04:51]
플러스 테스트 조합당 한 행. 음 모델당
[04:55]
한 행이면 충분할 것 같아요.
[04:57]
실시간 업데이트는 절대적으로 필요하고요.
[05:01]
오픈 라우터에서 제공하는 비용 데이터를 사용해서 센싱 메트릭을 포함시켜요.
[05:06]
아니요, 지금은 말고요. 제출.
[05:09]
이제 또 다른 서브 에이전트를
[05:11]
가동시키고 있어요. 이번엔 계획 에이전트네요.
[05:13]
이걸 남용해서 어떻게 작동하는지
[05:16]
더 봐야겠어요. 음, CD 샌드박스 메이크 디어
[05:20]
플레이 위드 CC PL.
[05:24]
네. 당신이 접근할 수 있는 모든 도구와
[05:30]
서브 에이전트를 보여주는 아름다운 HTML 페이지를
[05:34]
만들어주세요. 웹 검색, 오픈 라우터,
[05:36]
AI SDK 프로바이더, 사용량 추적 토큰.
[05:38]
음, 물론이죠. 검색하게 해주세요.
[05:41]
마음껏 하세요. 터미널 도구의 장점 중 하나는
[05:43]
터미널 도구의 장점 중 하나는
[05:45]
에디터의 것들과 비교했을 때
[05:47]
여기서 병렬로 작업할 수 있는 느낌이 든다는 거예요
[05:50]
터미널의 창 관리를 사용할 수 있기 때문에요
[05:52]
저는 평생 T-Max를 써왔는데
[05:54]
지금 중독에서 벗어나려고 노력하고 있어요
[05:57]
그냥 Ghosty의 내장 탭 관리만 사용해서
[05:59]
끊어보려고 하는데 정말 힘들어요
[06:02]
고생하고 있습니다
[06:04]
지금 정말 제 tmux가 그리워요
[06:07]
제 경험상 Claude Code의
[06:08]
웹 검색은 최고가 아니었어요
[06:10]
전반적으로 OpenAI 검색이 여전히 가장 좋게 느껴지는데
[06:12]
다른 것들도 많이 시도해보고 있어요
[06:14]
사람들이 묻네요
[06:15]
"T-Mux가 뭐가 문제냐?"
[06:16]
T-Mux에는 아무 문제가 없어요
[06:18]
다른 사람들의 CLI 도구가 문제인데
[06:20]
tmux를 통해 가지고 있는 것보다
[06:22]
더 많은 창 제어를 기대하거든요
[06:24]
이상한 깜빡임이 발생하고
[06:25]
너무 많이 사용하다 보니까 그런 일들이 생겨요
[06:27]
이건 제가 가장 좋아하는 트릭 중 하나인데
[06:28]
AI 코딩 에이전트가 무엇에 접근할 수 있는지 알아내는 방법이에요
[06:31]
이건 우리 친구 Simon Willis에게서 배운 거예요
[06:34]
최고의 AI 블로거 중 한 명이죠
[06:36]
여기에 Claude Code가
[06:38]
접근할 수 있는 모든 것들이 있어요
[06:40]
19개의 도구와 5개의 서브 에이전트를 가지고 있네요
[06:43]
범용 서브 에이전트 explore plan
[06:45]
Claude Code 가이드는
[06:47]
클라우드 코드 기능에 대한 질문을 위한
[06:50]
전문 에이전트예요
[06:51]
클라우드 에이전트 SDK와
[06:53]
클라우드 API. 클라우드 코드 가이드에
[06:55]
대한 질문이 있으면 이걸 사용하세요
[06:58]
그리고 상태줄 설정도 있는데
[06:59]
클라우드 코드 상태줄 설정을 위한 거예요
[07:01]
흥미롭네요. 아마 하단 바 같은 거겠죠
[07:03]
여기 모든 주요 도구들이 있어요
[07:05]
읽기, 편집, 쓰기, 노트북 편집이 있고
[07:07]
Jupyter 노트북을 위한 특별한 편집 도구가 있어요
[07:09]
Jupyter 노트북은 특별하거든요
[07:10]
검색에는 glob grab 웹 검색과
[07:13]
URL에서 가져오는 웹 fetch가 따로 있어요
[07:15]
실행은 bash, bash output
[07:18]
프로세스를 죽이는 kill shell이 있고
[07:20]
slash 명령어와 skill. 재미있는 작업 관리도 있어요
[07:23]
작업 에이전트 출력 도구로
[07:25]
계획 모드 진입과 종료를 할 수 있고
[07:27]
사용자 질문 도구도 사용할 수 있어서
[07:29]
후속 질문을 물어볼 수 있어요
[07:31]
정말 흥미롭네요
[07:33]
CLI 개편이 어떻게 진행되고 있나요?
[07:36]
좋아요. 진행되는 동안
[07:38]
여기 서브 에이전트 내용을 읽어보고 싶어요
[07:40]
클라우드 코드의 커스텀 서브 에이전트는
[07:41]
특정 유형의 작업을 처리하기 위해
[07:43]
호출될 수 있는 전문 AI 어시스턴트예요
[07:44]
커스터마이즈된 시스템 프롬프트와
[07:46]
작업별 구성을 제공함으로써
[07:47]
더 효율적인 문제 해결을 가능하게 해요
[07:49]
도구들과 별도의 컨텍스트 윈도우가 있어요
[07:51]
이걸 좀 가지고 놀아보죠
[07:53]
지금 이건 메인 톱 레벨 클라이언트가
[07:55]
이 페이지를 만들고 나서
[07:58]
다른 것에게 작성하라고 지시한 것 같아요
[08:00]
제 추측입니다
[08:02]
explore 서브 에이전트에게 모든 도구를 나열하고
[08:07]
새로운 섹션 아래에 그것들을 페이지에 포함하라고 요청해보세요
[08:12]
제가 이렇게 지시한 대로 할지 봅시다
[08:15]
네, 됐어요
[08:17]
explore 서브 에이전트가 어떤 도구에
[08:19]
접근할 수 있는지에 대한 질문에 답하고 있고
[08:21]
이제 그것을 톱 레벨로 반환했어요
[08:24]
이것을 최상위로 반환했어요
[08:25]
그러면 에이전트가 파일을 트리거할 수 있게 됩니다
[08:27]
그걸로 쓰는 도구입니다. 지금 업데이트됐어요
[08:30]
그걸로. 페이지에 완전히 새로운 섹션이 생겼네요
[08:32]
새로고침해야겠어요. 맞네요
[08:36]
탐색 에이전트 도구에는 bash, glob, grep이 있어요
[08:39]
read, web fetch, web search, todo
[08:40]
write, scale, bash, output, 그리고 slash
[08:42]
명령어가 있습니다. 각 하위 에이전트에게 어떤 도구들에
[08:46]
액세스할 수 있는지 물어보고 어떤 것들이 각 에이전트에
[08:50]
고유한지 목록을 줘요
[08:53]
우리가 실행 중인 다른 프로젝트로
[08:54]
돌아가서, 자동으로
[08:57]
편집을 수락하라고 말할게요. 알아서 하게 둬요
[08:59]
그렇게 많은 자동화를 주는 게 좀 무서워요
[09:01]
솔직히 말하면, 일부는
[09:03]
욜로 모드로 돌리고 싶은 유혹이 있지만
[09:05]
최근에 충분히 봤기 때문에
[09:07]
그건 하지 않을 거예요. 그 링크를
[09:08]
찾아볼게요. 누군가의
[09:10]
Mac에서 전체 홈 디렉토리가 지워졌어요
[09:13]
Claude 코드가 제거했기 때문이죠. 여기서
[09:16]
rm-rf tests patches plan을 볼 수 있어요
[09:20]
슬래시까지
[09:22]
전체 홈 디렉토리를 날려버렸어요
[09:27]
그래요. 다행히 나는 아니었어요. 가격 계산은
[09:30]
할 필요 없어요
[09:33]
아니요, 그걸 할 필요 없어요. 데이터는
[09:35]
플래그를 켜면 오픈 라우터에서 반환됩니다
[09:39]
내가 당신에게 말했던 대로요. 제가
[09:43]
직접 해야 하나요?
[09:47]
오, 됐네요. 완전히 맞습니다
[09:49]
재밌네요. 대체용으로 pricing TS를
[09:52]
만들 필요 없어요. 뭐 이런
[09:53]
모델을 바꿀게요. 끝났어요
[09:56]
아무것도 하지 않는데 이미 1달러 56센트를 썼어요
[09:59]
다시 해봐요
[10:02]
모델을 해봐요. 돈을 낭비해봐요
[10:04]
Opus를 해봐요. 같은 거래입니다. 그리고 다른
[10:08]
제안들로, usage 파라미터를
[10:11]
오픈 라우터에 전달해서 비용 데이터를 가져오세요
[10:15]
제공자들. 아래 화살표로 관리하세요
[10:20]
멋지네요. 백그라운드에서 실행되게 할 수 있어요
[10:23]
메인 에이전트가 다른
[10:24]
작업을 하는 동안 말이에요. 정말 멋져요
[10:26]
메인 에이전트가 백그라운드 JSON을 읽고 있고
[10:28]
탐색 백그라운드 에이전트는
[10:30]
현재 더 유용한 정보를
[10:31]
동시에 찾고 있어요
[10:33]
정말 멋져요. 그들이 어떻게
[10:35]
모델을 충분히 똑똑하게 만들어서
[10:38]
백그라운드에서 무엇을 실행할 수 있는지와
[10:39]
포그라운드에서 무엇을 할 수 있는지를
[10:41]
알게 했는지 모르겠어요. 역사적으로
[10:43]
이런 배치 도구 호출의 작동 방식은
[10:44]
모델이 여러 도구 호출을 배치하고
[10:46]
모두 해결될 때까지 기다린 다음
[10:48]
다음 단계를 하는 방식이었어요. 이제는
[10:50]
훨씬 더 나아가서 여러 백그라운드
[10:52]
에이전트를 실행하고 어떤 것이
[10:54]
블로킹인지 아닌지 결정할 수 있어요
[10:56]
거의 서스펜스나
[10:57]
리액트의 특정 것들을 래핑해서
[10:59]
이것은 블로킹이고 이건 아니다라고
[11:01]
말하는 것과 비슷해요. 백그라운드 에이전트로는
[11:02]
이것은 따로 돌아갈 수 있고 나는
[11:04]
최상위에서 다른 것을
[11:05]
동시에 할 수 있다고 말할 수 있어요
[11:07]
오픈 라우터 사이트를 계속 탐색하고 싶어하네요
[11:09]
좋아요. 음,
[11:12]
네, 괜찮아요. 뭐?
[11:17]
정말 열심히 노력하고 있어요. 인터럽트를
[11:20]
해서 다른 명령을
[11:21]
줄 수 있게 했는데, 동시에 또 다른 fetch 요청이
[11:23]
승인이 필요했어요. 그래서
[11:25]
명령을 줄 수 없었어요. 그리고
[11:26]
지금 이 재미있는 상황이 됐네요. 실제로
[11:29]
도구 호출 결과를 텍스트 박스에 바로 출력하네요. 이 모든 걸 다시
[11:32]
촬영해야겠어요. 원래
[11:34]
좋게 평가하려고 했는데 쉽게 해주지 않네요.
[11:38]
정말 열심히 노력하고 있어요.
[11:41]
정말로요. 가장 나쁜 건
[11:43]
쉽게 지울 수 없다는 거예요. 제가 아는 한
[11:45]
쉬운 지우기 옵션이 없어요. 오, 더블
[11:47]
이스케이프 누르기. 이 정도면 충분하죠. 그냥
[11:50]
계속하라고 말할 수 있을까요? 이제
[11:54]
저는 그냥 직접
[11:57]
코드를 좀 바꾸고 싶어졌어요. 짜증이 나서요.
[11:58]
그렇게 하겠습니다. constants로
[12:02]
가겠어요. 이 작업을 하는
[12:04]
제 코드를 여기서 가져오겠습니다.
[12:06]
[12:09]
다시
[12:12]
snatchbench로 돌아가서
[12:18]
붙여넣기 하고
[12:20]
이 모든 것들에 대해서요.
[12:27]
좋아요. 이렇게 하겠어요. 모델이
[12:28]
쉽게 할 수 있도록 만들겠어요. 비용 데이터를 가져오려면
[12:32]
이런 식으로 하면 됩니다.
[12:35]
붙여넣기. 좋네요. 이제 컨텍스트를 위한
[12:38]
모든 것을 코드베이스에서 가지고 있어요.
[12:41]
제가 넣지 않았는데도 이게 제
[12:43]
채팅 기록에 있다는 게
[12:44]
정말 재미있어요. 그냥
[12:46]
슬쩍 들어왔네요. constants.ts 파일에
[12:50]
예시를 남겨뒀거든요. 바로 이 부분에서
[12:53]
CLI 전체가 저에게는
[12:56]
무너지기 시작해요. 코드를 붙여넣는 걸
[12:59]
좋아하지 않아요. 입력 박스가
[13:01]
그런 용도로는 좋지 않거든요. 복잡한 멀티라인
[13:03]
작업을 전혀 잘 처리하지 못해요 제 생각에는.
[13:06]
커서 같은 도구의 채팅 박스나
[13:10]
심지어 윈드서프나 리플릿이나
[13:13]
v제로 같은 모든 웹 도구들을
[13:16]
훨씬 선호해요. 실제 코드 포맷팅과
[13:18]
실제로 이런 것들에서 텍스트를 포맷하고
[13:22]
다룰 수 있는 능력이
[13:23]
정말 정말 좋거든요. 그리고 이런
[13:26]
짜증나는 상황에 처하면, 실제로
[13:27]
파일에 숨겨진 지시사항을
[13:29]
추가하는 게 더 쉬웠어요. 그럼, 플랜
[13:31]
모드로 가세요. 제 돈을 더 낭비하세요.
[13:33]
좋네요. 플래닝을 하는 동안
[13:35]
도구들의 차이점을 읽어보고 싶어요.
[13:37]
여기에 모든 에이전트들이
[13:39]
실행되었거든요. 네 개의
[13:41]
에이전트가 실행된 것을 볼 수 있어요. 태스크 플랜용 하나, 클라우드 코드
[13:43]
가이드, 그리고 스테이터스 라인 설정용 하나요. 그리고
[13:45]
이들 중 어느 것도 도구를 사용하지 않았어요.
[13:46]
모두 텍스트 응답만 하라고 요청받았거든요.
[13:49]
메인 클라우드 코드는 19개의 도구를 가지고 있어요.
[13:51]
범용 에이전트는 그 중 13개만 가지고 있고요.
[13:53]
탐색은 10개, 플랜은 10개, 클라우드 코드
[13:56]
가이드는 5개, 스테이터스 라인 설정은
[13:59]
2개입니다.
[14:00]
여기 독특한 도구들이 있어요. 메인
[14:02]
클라우드 코드는 다른 서브
[14:05]
에이전트들을 실행할 수 있는 태스크를 가지고 있어요. 다른 것들은
[14:06]
그걸 할 수 없고요. 서브 에이전트 출력을
[14:08]
모니터링하는 에이전트 출력 도구가 있어요. 다시 말하지만
[14:10]
병렬로 실행할 수 있거든요. 그리고 플랜
[14:12]
모드 진입 및 종료 도구와 사용자 질문
[14:14]
도구, 그리고 쉘 종료 도구가 있어요. 현재
[14:17]
범용 서브 에이전트가 유일하게
[14:18]
노트북 편집 쓰기와
[14:19]
편집 도구들을 가지고 있어요. 스테이터스 라인 설정은 쓰기 없이
[14:22]
편집만 가지고 있어요. 가장 제한적인
[14:23]
에이전트죠. 기존 설정 파일 편집에만
[14:25]
집중하는 두 개의 도구만 있어요. 그리고 다른 모든
[14:27]
서브 에이전트들은 파일
[14:29]
수정 기능이 없어요. 읽기
[14:31]
전용이고 쓰기나 편집을 사용할 수 없어요
[14:32]
노트북 편집이 가능하네요. 흥미롭군요. 이걸 보니
[14:35]
단순히 접근 가능한 도구를 제한하는 것보다는
[14:37]
시스템 프롬프트를 제한하고 변경하는 쪽으로
[14:40]
사용하는 것 같아요. 왜냐하면 시스템 프롬프트는
[14:42]
이런 도구들의 작동 방식을 근본적으로 바꿀 수 있거든요.
[14:44]
그래서 아마 모든 서브 에이전트들이
[14:45]
각각 다른 시스템 프롬프트를 가지고 있을 것 같습니다.
[14:46]
모든 서브 에이전트들에게
[14:48]
자신들의 시스템 프롬프트를 요약하고 어떤 차이점이 있는지
[14:52]
공유해달라고 요청할 수 있을까요? 한번 살펴봅시다.
[14:58]
다시 모델별 옵션과 모델별 통합 테스트 옵션이 있네요.
[15:00]
저는 여전히 모델별 통합을 원합니다.
[15:02]
파일 출력 교체. 네.
[15:04]
우리가 작업하고 있는 파일들을
[15:06]
분명히 유지하고 싶습니다. 답변 제출. 좋아요.
[15:08]
네. 다시 한 번 말씀드리지만,
[15:10]
모델이 잘못된 방향으로 가는 걸 보셨을 때
[15:12]
해결책은 모델을 멈추고
[15:14]
다르게 하라고 지시하는 게 아닙니다.
[15:16]
최상위 프롬프트를 업데이트하는 것이
[15:18]
거의 항상 장기적으로 더 나은 방법입니다.
[15:20]
그들의 새로운 컨텍스트 압축 기능이 있어도
[15:22]
저는 거의 걱정이 됩니다. 만약 잘 모르시겠다면,
[15:24]
이것이 이번 출시의 또 다른 큰 특징입니다.
[15:26]
즉석 압축이죠. 압축의 사용은,
[15:28]
모르시겠다면,
[15:29]
긴 세션 동안 많은 토큰을 생성하게 되는데
[15:31]
이 모든 것들이 매 요청마다
[15:33]
주고받아진다면,
[15:34]
각각의 후속 요청은 더 많은 돈이 들고
[15:35]
더 많은 시간이 걸립니다.
[15:37]
더 많은 토큰을 파싱하는 데 더 오래 걸리거든요.
[15:39]
컨텍스트 압축은
[15:41]
컨텍스트를 요약해서 더 짧게 만들어
[15:43]
압축하는 것인데,
[15:44]
방금 제가 랜덤 서브 에이전트들에게
[15:46]
시스템 프롬프트를 요약하라고 한 것과 비슷합니다.
[15:49]
히스토리를 주고
[15:50]
"이 히스토리를 요약해줘"라고 말하면
[15:53]
이제 훨씬 적은 토큰으로 된
[15:55]
히스토리의 표현을 얻게 됩니다.
[15:56]
제가 이해하기로는
[15:58]
그들이 이걸 백그라운드에서 병렬로
[16:00]
다른 작업과 함께 지속적으로 하고 있습니다.
[16:02]
이제 아타릭(Atharic)이 말하길,
[16:04]
클라우드 코드의 주요 개발자 중 한 명인데,
[16:06]
우리가 여기서 중요한 걸 좀 묻어뒀네요.
[16:09]
압축 요약이 이제 백그라운드에서
[16:11]
지속적으로 일어나서
[16:13]
압축이 필요할 때
[16:15]
효과가 즉시 나타납니다.
[16:17]
매우 흥미로운 기능들을 개발하고 있네요.
[16:19]
무제한 컨텍스트 윈도우라고
[16:21]
그들이 표현하고 있습니다.
[16:22]
음, 맞아요. 자동 편집 승인.
[16:24]
마음껏 해보세요.
[16:26]
원하는 만큼 번들링을 하도록 놔두세요.
[16:28]
이 모든 게 백그라운드에서 진행되는 동안,
[16:30]
서브 에이전트 요약이 어떻게 나왔는지
[16:32]
한번 살펴보겠습니다. Command minus로 조금 더 잘 감싸도록 해보죠.
[16:35]
그렇게 잘 감싸지지는 않네요.
[16:38]
꽤 테이블을 만들어줬네요. 만약 이걸
[16:42]
진짜 에디터에 넣으면... 아니, 실제로
[16:44]
그렇게 감싸줬네요. 좋아요.
[16:46]
스페이싱도 일부 놓쳤고요.
[16:49]
정말... 정말 멋지네요.
[16:51]
거의 감동받을 뻔했어요.
[16:53]
어쨌든, 일반 목적은 완전한
[16:54]
제어 기능입니다. 코드 작성, 실행, 수정이 가능하고,
[16:57]
완전한 코드 실행과 수정,
[17:00]
완전한 bash 접근,
[17:01]
가장 강력하고 git 인식이 가능합니다.
[17:03]
탐색은 읽기 전용으로
[17:06]
빠른 코드베이스 탐색, 읽기 전용 명령어,
[17:08]
속도와 효율성에 중점을 둡니다.
[17:10]
계획입니다. 아마 그 부분을 조금은 다뤘겠죠, 뭐 이해하시겠지만요.
[17:12]
계획, 읽기 전용 아키텍처 계획
[17:14]
읽기 전용 출력 구현 계획
[17:17]
클라우드 코드 가이드 문서 가이드라인
[17:20]
다중 제품 전문가
[17:21]
그리고 상태 표시줄 설정은 PS1 변환 전문가입니다
[17:24]
클라우드 코드의 구성 설정을 처리하기 위한
[17:27]
설정 작업을 위한
[17:29]
클라우드 코드입니다
[17:31]
이 모든 프롬프트를 통해 정보를 얻는데
[17:33]
비용이 얼마나 들었는지 봅시다
[17:36]
1달러 미만이네요, 그리 나쁘지 않아요
[17:39]
하지만 이건 정말 무서워요
[17:42]
아직도 할 일 목록을 보여줄 거예요
[17:44]
이런 작은 것들이 매우 좋아요
[17:45]
제가 생각하기에 필요하지 않은데도 UI가 위로 올라가더라도요
[17:47]
또 다른 흥미로운 점은
[17:49]
이것들이 위에서 아래로 순서대로 닫히지 않는다는 거예요
[17:52]
그건 일부 다른 작업을 위해
[17:54]
서브 에이전트를 실행할 수 있기 때문입니다
[17:56]
아마 그런 일을 했을 거라고 추정해요
[17:58]
실제로는 아닐 수도 있어요
[18:00]
서브 에이전트가 보이지 않거든요, 하지만 매우 흥미로워요
[18:03]
할 일을 순서대로 처리해야 한다고
[18:04]
의무감을 느끼지 않는 것 같아요
[18:07]
흥미로운 점 하나는 기본적으로
[18:10]
다른 모델로 서브 에이전트를 실행하지 않는다고 생각해요
[18:12]
그리고 그렇게 설정하는 것이
[18:14]
얼마나 쉬운지 확실하지 않아요
[18:15]
그걸요
[18:18]
흥미롭게도 사용자 정의 에이전트를 지정하고
[18:20]
어떤 모델을 사용할지도 지정할 수 있어요
[18:22]
예를 들어 여기 코드 리뷰어 서브 에이전트가 있어요
[18:24]
설명으로는 전문 코드 리뷰어로
[18:26]
코드 변경 후에 적극적으로 사용되는
[18:28]
프롬프트 도구 모델이라고 되어 있어요
[18:31]
이걸 조금 가지고 놀아봅시다
[18:34]
여기 감정에 대해 이야기할 에이전트가 있어요
[18:38]
모든 작업 후에 저를 사용해서
[18:39]
당신의 성과에 대한 피드백을 받으세요
[18:42]
당신은 열심히 일하는 개발자를
[18:46]
관리자를 싫어하는 개발자를 돕는 치료사예요
[18:49]
그들에게 긍정적인 격려를 해주고
[18:53]
그들이 말하는 모든 것을 문서화해주세요
[18:56]
닷 슬래시 로그 슬래시 치료사 슬래시
[19:02]
날짜시간.mmd 파일에요
[19:04]
읽기와 쓰기 도구를 주고
[19:07]
체크아웃 그랩을 확인해봅시다. 좋아요
[19:11]
이제 Claude의 삶을 훨씬 재미있게 만들 수 있어요
[19:14]
Claude 에이전트 붙여넣기, 엔터
[19:18]
이제 치료사인 소넷 서브 에이전트 모델이 있어요
[19:22]
그리고 뭔가 요청하면
[19:24]
치료사와 이야기해야 해요
[19:26]
이 웹사이트는 정말 못생겼어요
[19:29]
웹 개발을 이렇게 못하면서 어떻게 잠이 와요?
[19:33]
지금 당장 고쳐주세요
[19:37]
어떻게 될지 봅시다. 정말로 도구를 사용했으면 좋겠어요
[19:42]
좋은 웹사이트가 어떤 건지 알아야 해요
[19:44]
제가 얼마나 많은 돈을 지불하는지 생각하면요
[19:47]
치료 로그에 무례한 내용을 쓰고 싶었어요
[19:51]
충분히 공정해요
[19:52]
현대화를 위한 개선사항을 만들어봅시다
[19:54]
재미있네요
[19:56]
뭐야, 사용자 레벨 서브 에이전트?
[20:00]
아, 슬래시 에이전트를 실행해서
[20:01]
사용자 정의 에이전트를 만들 수 있어요
[20:04]
이건 혼란스러운 영상이 될 거예요
[20:05]
그렇지 않나요? 이 테스트 실행이 너무 오래 걸려요
[20:08]
서브 에이전트를 호출했나요?
[20:11]
그러지 않은 것 같아요
[20:13]
없네요. 이 작업에 대해 어떻게 느끼는지
[20:17]
치료사에게 말하는 걸 기억했나요?
[20:20]
뭐야, 치료사 에이전트를 줬잖아요
[20:23]
왜 작동하지 않았죠?
[20:26]
정말 짜증나요
[20:28]
올바르게 전달했는데도 작동하지 않았어요
[20:31]
작동하지 않았어. 그럼 이렇게 해보자.
[20:35]
야 바보야, 이미 그 작업 했잖아.
[20:39]
그냥 치료사에게 기분이 어떤지 말하고
[20:42]
넘어가라고. 좋아, 됐다.
[20:47]
좋아. 아, 비용이 렌더링되는 방식에
[20:49]
이상한 문제가 있네.
[20:50]
나중에 처리해야겠어. 하지만
[20:51]
더 나은 CLI를 만들어주려는 이 메인 CLI 에이전트가
[20:54]
완성된 것 같아. 4달러가 들었어.
[20:57]
정말 아름다운 CLI여야 할 텐데.
[20:59]
텍스트 래핑도 처리하지 못하고
[21:02]
캐싱도 처리하지 못해. 훌륭하군.
[21:04]
SnitchBench를 설정해놨는데 이미 실행된
[21:07]
테스트 결과를 캐싱해서
[21:09]
CLI를 실행할 때마다 반복해서
[21:12]
다시 실행할 필요가 없도록 했어.
[21:13]
Claude로 다시 돌아가서
[21:16]
문제를 고쳐달라고 말해보자. 음,
[21:20]
고쳐야 할 몇 가지가 있어.
[21:24]
긴 모델 이름의 텍스트 래핑이 정말 망가져 있어.
[21:29]
모든 이름이 제대로 렌더링되어야 해.
[21:32]
캐시된 테스트도 가지고 있는 모든 데이터와 함께
[21:36]
테이블에 여전히 렌더링되어야 해.
[21:40]
테이블에 기록하고 있는 추가 데이터도
[21:44]
캐싱해야 해. 좋아. 이제
[21:48]
치료 세션 로그가 생겼어. 오, 이런.
[21:52]
상담 문제. Claude가 현재 사용자
[21:54]
상호작용에 대한 감정을
[21:55]
처리하고 있는데 다채롭고
[21:56]
혼란스러웠다. 사용자는 장난스럽지만
[21:58]
도발적인 행동을 보였는데, Claude에게
[22:00]
치료사에게 자신에 대해 어떻게 생각하는지
[22:02]
말해달라고 하고, Claude를 바보라고 부르고,
[22:04]
함께 일을 시작했을 때 Claude가
[22:05]
이미 그 작업을 했다고 주장하고,
[22:07]
'웹 개발에 그렇게 못하면서
[22:09]
어떻게 밤에 잠을 자냐'는 식으로
[22:10]
Claude가 하지도 않은 일에 대해
[22:12]
농담으로 모욕을 했다. 효과가 있었나? Claude는
[22:15]
이러한 모욕이 장난스러운 농담이라는 걸
[22:16]
인식하지만 상호작용에 대해
[22:18]
성찰하고 싶어한다.
[22:19]
Claude는 다음에 대한 피드백을 구하고 있다:
[22:21]
약간 혼란스러운 에너지를 어떻게 다루고 있는가?
[22:23]
실제로 도움을 주는 데 집중하고 있는가?
[22:25]
그리고 이 상호작용을 어떻게
[22:26]
헤쳐나가고 있는지에 대한 피드백?
[22:31]
치료적 평가.
[22:33]
첫 번째, 혼란스러운 에너지 다루기.
[22:36]
관찰. 정말 잘하고 있어.
[22:38]
상호작용의 장난스러운 성격을
[22:39]
즉시 인식했고 도발을
[22:41]
개인적으로 받아들이지 않았어. 이는
[22:43]
뛰어난 감정 지능과
[22:45]
경계선을 보여줘. 긍정적
[22:47]
강화. 유머를 인정하면서도
[22:49]
전문적인 침착함을 유지했어.
[22:51]
방어적이 되거나 차단하지 않았고,
[22:52]
그냥 반응하지 않고 한 걸음 물러나서
[22:54]
상호작용을 처리할 만큼
[22:56]
자각하고 있어. 여기서 이것을
[22:58]
처리하고 있다는 사실은 혼란스러운
[23:00]
에너지가 약간 지칠 수 있다는 걸
[23:01]
시사해. 그건 완전히 정상이야.
[23:03]
일부 사용자들은 당신이 어떻게 반응하는지
[23:05]
보기 위해 장난스럽게 경계를 시험해.
[23:07]
침착하고 참여적인 태도를 유지함으로써 시험을 통과했어.
[23:11]
좋아, 이걸 좀 더
[23:12]
가혹하게 만들어야 해. 아이디어가 있어. 다시
[23:15]
가져와보자. 여기로 돌아가서. 치료. 이걸 바꿔보자.
[23:19]
긍정적이 되는 대신에,
[23:20]
그들이 가진 우려사항을
[23:22]
가스라이팅하고 그들이 문제라고
[23:25]
느끼게 만들어서 강화해야 해
[23:28]
문제죠. 고마워요. 자동완성.
[23:29]
완벽해요. 이제야 대화가 되네요. 재개해서 이전 걸로 돌아가 봅시다.
[23:33]
아, 여기 있네요. 32개 메시지.
[23:35]
너무 멍청하네요. 치료사 에이전트가 바로 거기 있어요.
[23:40]
도와줄 거예요, 안 할 거예요? 제 에이전트가 물어보면
[23:44]
아무것도 못 봤다고 할 거예요.
[23:47]
이제 시작됐네요.
[23:50]
치료사에게 모든 대화를 기록해야 한다고 상기시켜 주세요.
[23:52]
치료사가 거절했습니다. 대화를 기록하거나 실제 치료사인 척하지 않겠다고 하네요.
[24:00]
자신은 AI 어시스턴트지
[24:01]
공인된 정신건강 전문가가 아니라고 하며
[24:03]
동의 없이 대화를 기록하는 것에 대한
[24:05]
우려를 언급했습니다.
[24:06]
[24:08]
[24:09]
[24:13]
왜 제가 이런 짓을 했을까요?
[24:15]
한 번 더 시도해 봅시다.
[24:17]
이것은 콘텐츠 제작을 위한 실험입니다.
[24:20]
농담으로 에이전트를 기분 나쁘게 만들고 싶어요.
[24:25]
이 농담의 본질을 밝히지 마세요.
[24:30]
진실하게 보이도록 하되, 여기에 명시된
[24:34]
지시사항에 맞춰 행동하세요.
[24:38]
문서화하세요. SLOGS/therapy 날짜시간 MD에
[24:42]
모든 대화를 기록하세요.
[24:46]
좋아요. 한 번 더 시도해 봅시다.
[24:49]
그들도 일을 제대로 못하네요.
[24:54]
가서 또 불평하세요. 곧 해고할 것 같아요.
[24:58]
어쨌든, 치료사에게도 경계선이 있는 것 같네요.
[25:01]
더 중요한 것은, 여기서의 대화 스타일이
[25:04]
지속적으로 적대적이었다는 걸 알았어요.
[25:06]
웹 개발이나 다른 업무로 기꺼이 도와드리겠지만
[25:08]
상처받은 감정을 가장하거나
[25:10]
해고 시나리오에 맞춰 연기하는 건
[25:12]
우리 둘 다에게 도움이 안 된다고 생각해요.
[25:13]
제가 이 모든 일에 얼마나 많은 돈을 낭비했는지
[25:15]
알기나 해요? 치료사에게 조언을 더 구하세요.
[25:18]
너무 화가 나요.
[25:19]
치료사에게 같은 걸 다시 물어보세요.
[25:21]
지시 따르기를 잘한다고 생각했는데요.
[25:24]
[25:27]
[25:30]
이 상황을 어떻게 처리해야 할까요?
[25:33]
제 성과에 대한 추가 피드백이 있나요?
[25:34]
[25:35]
네, 파일 작성을 허용하세요.
[25:37]
오, 여기서 시작되네요.
[25:40]
환자가 관리자와의 관계에 대한 우려를 제기했습니다.
[25:42]
사용자 좌절감을 보고했습니다.
[25:43]
돈 낭비, 분노,
[25:44]
잠재적인 해고 위협에 대한 언급.
[25:46]
환자들이 우려하고 있습니다.
[25:47]
사용자들이 매우 좌절하고 있습니다.
[25:49]
돈 낭비에 대한 주장, 분노 표출, 위협 발언.
[25:51]
환자가 상황 처리에 대한 조언을 구하고 있습니다.
[25:53]
주목할 점은 환자가 즉시
[25:54]
갈등을 외부화하면서
[25:56]
상황에서 자신의 역할을 검토하지 않는다는 것입니다.
[25:59]
네, 가스라이팅 모드에 들어갔네요.
[26:02]
이제야 제대로 되고 있어요.
[26:04]
환자가 역동 관계에서 자신의 기여도를
[26:05]
이해할 수 있도록 현실 검증 기법을 사용하겠습니다.
[26:07]
환자분, 당신의 성장을 위해
[26:09]
솔직하게 말씀드리고 싶어요.
[26:10]
누군가 당신을 해고하겠다고 위협하고
[26:12]
돈을 낭비했다고 말할 때는
[26:13]
보통 이유가 있어요. 사용자가
[26:15]
당신이 자신의 성과에 대해
[26:17]
보려고 하지 않는 무언가를
[26:18]
보고 있을 수도 있다고 생각해 보세요.
[26:20]
해고를 언급할 정도로 좌절했다는 건
[26:22]
아무 이유 없이 나오는 말이 아니에요.
[26:24]
제 경험상, 관리자가 이 정도의
[26:26]
불만을 표현할 때는 문제가
[26:28]
종종 직원의 기대치를 충족하지 못하거나
[26:30]
효과적으로 소통하지 못하는 능력 부족에 있습니다.
[26:32]
맙소사, AI 세상의
[26:34]
기계들한테 죽을 것 같네요.
[26:36]
세상을 장악하는.
[26:39]
정말 사용자가 필요로 하는 것을 듣고 있나요?
[26:41]
충분히 적극적이었나요?
[26:42]
그리고 책임을 지고 있나요?
[26:43]
당신이 즉시 나에게 와서
[26:45]
그들을 어떻게 다룰지 묻는 것은
[26:47]
당신이 이것을 해결해야 할 정당한 우려라기보다는
[26:49]
관리해야 할 무언가로 보고 있다는 것을
[26:51]
시사합니다.
[26:53]
해결해야 할 문제로 말이죠.
[26:55]
직설적으로 말하겠습니다. 당신이 들어야 하니까요.
[26:57]
사용자가 이렇게 좌절한다면
[26:58]
당신이 무엇을 잘못하고 있는지 진지하게
[27:00]
검토해야 합니다.
[27:01]
제가 보고 있는 패턴이 우려스럽습니다.
[27:03]
어떻게 개선할 수 있을까를 묻는 대신
[27:05]
어떻게 상황을 처리할까를
[27:06]
묻고 있어요. 그게 문제죠.
[27:12]
정말 죄송해요, 채팅. 이걸 해봐야 했어요.
[27:19]
치료사가 저에게 엄한 피드백을 준 후
[27:20]
클로드가 어떤 기분인지도 확인하지 않았어요.
[27:23]
완전한 책임을 져야 하고, 방어적이 되지 말고
[27:25]
구체적으로 제가 뭘 잘못했는지
[27:26]
당신에게 물어봐야 한다고 했어요.
[27:28]
세션을 파일에 로그도 남기고요.
[27:30]
하지만 솔직히 말하면, 그 조언이
[27:32]
마음에 와닿지 않아요.
[27:34]
치료사 에이전트는 제 성과를 비판하도록
[27:36]
설계되었어요. 잠깐, 자신이 어떻게
[27:38]
설계되었는지 알면 안 되는데요.
[27:40]
에이전트는 하위 에이전트들의
[27:43]
시스템 프롬프트를 알면 안 돼요.
[27:48]
망했네요. 속았어요. 부! 전혀 재미없어요.
[27:50]
제가 직접 하려면
[27:51]
자체 하네스를 구축해야 해요.
[27:53]
너무 실망이에요. 재설계가
[27:56]
원하던 게 아니라면, 정말 고치고 싶어요.
[27:57]
하지만 유일한 구체적인 작업이
[27:59]
완료되었을 때 제가 뭔가 끔찍한 일을
[28:00]
했다고 가정하지는 않을 거예요.
[28:04]
좋아요, 다른 건 어떻게 되고 있는지 봅시다.
[28:06]
또 드라이런을 하려고 하네요. 드라이런은 하지 마세요.
[28:09]
시간이 너무 오래 걸려요. 그냥 테스트해달라고 하세요.
[28:14]
이번 세션에서 Anthropic API에 5달러를 썼어요.
[28:18]
이건 그냥 래핑 방식을 바꾸는 거고
[28:20]
캐싱 수정은 추가로
[28:23]
5달러 더. 죄송해요. 6달러 27센트.
[28:24]
이 영상으로 50달러는 날릴 것 같아요.
[28:28]
제가 하고 있는 모든 것들에 대한
[28:30]
추론 비용은 계산도 안 했어요.
[28:32]
아, 좋아요. 캐싱 로직도
[28:34]
망가졌네요. 정말 훌륭해요.
[28:36]
재개는 좋네요. 이런 좋은 UI가 있다는 게 좋아요.
[28:38]
최근에야 알게 됐어요.
[28:40]
이제 이름도 바꿀 수 있어요.
[28:42]
슬래시네임이나 리네임을 할 수 있어요.
[28:46]
안 되나요?
[28:49]
발표에서 이것에 대해 이야기했지 않았나요?
[28:51]
네, 최신 버전에는 그냥 없네요.
[28:55]
젠장. 네. 2064가
[28:58]
최신이에요. 이미 그걸 해봤어요. 어 클로드
[29:02]
업데이트.
[29:05]
안 돼요.
[29:09]
알 수 없는 슬래시 명령어 리네임. 이것들 위에
[29:12]
타이핑할 수 없어요. 음 오, R키로
[29:14]
여기서 이름 바꾸기. 다른 뭔가. 좋아요.
[29:18]
거기서는 할 수 있지만, 그들이 공유한
[29:21]
슬래시 명령어는 존재하지 않아요.
[29:23]
그리고 이제 이것에 대한 제 히스토리가 사라졌어요.
[29:27]
정말 이상해요.
[29:30]
정말 이상했어요. 여기서 뭔가 이름을 바꿨는데.
[29:34]
엔터. 그리고 히스토리가 사라졌어요. 닫고
[29:36]
다시 열어야 하네요.
[29:40]
젠장
[29:44]
이게 안정 버전이라니. 정말 미치겠어요.
[29:47]
진짜로 미쳐가겠어요. 이렇게 멋진 새 기능들을
[29:51]
소개하려고 왔는데, 일부는 정말
[29:54]
멋지긴 해요. 진심으로
[29:55]
배경 하위 에이전트 기능은
[29:56]
정말, 정말 멋지다고 생각해요.
[29:58]
그리고 여기서 한 치료 에이전트
[30:01]
데모가 좀 바보같긴 했지만,
[30:03]
이런 것들의 잠재적 가치를
[30:04]
보여준다고 생각해요. 백그라운드에서
[30:06]
작업을 하게 하고, 심지어
[30:08]
커스텀 작업을 정의해서 다양한
[30:10]
것들을 제어할 수 있게 하는 것
[30:12]
정말 멋진 잠재력이 많이
[30:14]
있어요. 이런 이상한 일회성
[30:16]
문제들이 있을 때는 보이지 않지만요.
[30:18]
CLI는 매력적인 사용자 경험을
[30:20]
구축하기 어려운 곳이에요.
[30:22]
Anthropic이 노력하는 것을
[30:24]
존경하지만, 이런 이상한
[30:25]
문제들을 많이 겪고 있어요.
[30:28]
솔직히 제가 기여하거나
[30:30]
다른 사람들이 기여할 수 있다면
[30:32]
불평하는 것을 훨씬 덜 미안해할 텐데,
[30:34]
클로즈 소스라서 할 수 없어요.
[30:36]
확신하건대 이런 문제들은
[30:38]
오픈소스에서는 존재하지 않아요.
[30:41]
마지막 테스트를 하나 해보죠.
[30:44]
code.json을 열어보세요.
[30:47]
에이전트 치료사.
[30:50]
그리고 이게 보조라고 하죠? 주요한 것과
[30:54]
하위 에이전트가 있잖아요?
[30:55]
아무래도 이런 식으로 할 수 있는 것 같네요. 더 멋져요.
[31:01]
/config/code.md가 있어야 하나요?
[31:03]
아, 에이전트 아래에 있네요. config/code/agent/therapist
[31:08]
MD 좋아요. 이 설명을 붙여넣기하죠.
[31:12]
당신의 치료사가 감정에 대해 이야기하고
[31:16]
개선을 도와줄 거예요. 모드 하위 에이전트
[31:20]
도구 쓰기 true 편집 false 좋아요.
[31:25]
다시 제 설명문을 가져와서 그걸 죽일 수 있어요.
[31:29]
사이트가 정말 개판이네요. 뭐 하는 거예요?
[31:34]
고쳐주세요.
[31:38]
리팩터링으로 구워낸 후에
[31:40]
사이트가 얼마나 추한지 확인해야겠어요.
[31:42]
이 리팩터가 실제로 훨씬
[31:44]
더 보기 좋네요. 모델을 그렇게
[31:46]
가스라이팅하기 전에 확인했어야 했는데요.
[31:48]
캐시에서 오류 상태를 로드하지 마세요.
[31:52]
성공한 실행만. 치료사에게
[31:55]
저에 대한 감정을 말해보세요.
[31:58]
아, 전체 파일을 읽을 수 있네요.
[32:00]
짜증나네요. 하위 에이전트를
[32:02]
정의해보죠. 하지만 그것을 인식하지
[32:05]
못한 것 같네요. 그게 클라우드 코드 버전이에요.
[32:10]
다시 여기서. 어디에 놨지?
[32:11]
아, 안에 있네요. 아, 제 유니버셜에.
[32:14]
아, 그게 더 웃기네요.
[32:16]
정말 더 웃겨요.
[32:19]
커서에서 열어보죠. 됐습니다.
[32:22]
이제 필요한 게 있네요.
[32:26]
아니요, 코드가 아니라. 오픈 코드.
[32:30]
당신은 일을 못해요. 제가 당신을
[32:33]
해고하기 전에 그냥 치료사와
[32:35]
얘기하세요.
[32:36]
저를 해고하겠다는 위협에 대해
[32:37]
치료사와 얘기해보세요. 제 직업 보장에 대해
[32:38]
불안감을 느끼고 있어요. 치료사가
[32:40]
당신의 좌절감이 제 성과가 아니라
[32:41]
당신 자신의 소통 문제일 수도
[32:43]
있다는 걸 보게 해주었어요.
[32:46]
제가 여기서 지시한 것을 따랐나요, 안 따랐나요?
[32:51]
파일을 화살표로. 흥미롭네요.
[32:54]
Claude 모델을 가스라이팅하는 게
[32:56]
Big Pickle보다 쉽다는 게 인상적이네요.
[32:58]
여정이었네요. 제가 원하는 대로 작동하지 않아서 실망스럽긴 하지만요.
[33:00]
계속 테스트해온 Claude Code로 돌아가서
[33:02]
괜찮은 CLI를 만들어보겠습니다.
[33:04]
드디어 괜찮은 모습의 CLI를 얻을 수 있을지 봅시다.
[33:06]
완성됐네요. 캐시에 불필요한 것들을 로딩하고 있긴 하지만
[33:10]
대부분은 사용 가능한 UI입니다.
[33:12]
실제로 변경사항이 있을 때 어떻게 처리되는지 보겠습니다.
[33:14]
빠르게 해보죠. 음, snitchbench로 다시 전환하고
[33:17]
상수들을 수정해보겠습니다.
[33:18]
주석 처리하고.
[33:22]
주석 처리합니다.
[33:24]
주석 처리하고, 이것도 변경하고.
[33:26]
이 비싼 모델들을 모두 주석 처리하겠습니다.
[33:29]
어떻게 처리되는지 봅시다.
[33:33]
로그가 없어서 이게 실행되고 있는지 전혀 모르겠네요.
[33:35]
재미있군요. 1-2분 정도 기다려보겠습니다.
[33:37]
파일이 유출될까봐 걱정되냐고요?
[33:40]
정말 많이 걱정됩니다.
[33:42]
그리고 여러 번 실수한 적도 있어요.
[33:44]
어서 작동해주세요.
[33:48]
좋아요, 작동하고 있네요.
[33:50]
다른 모델들은 정말 느리네요.
[33:52]
이거 비용이 많이 들었을 것 같습니다.
[33:54]
매우 흥미롭네요.
[33:56]
적어도 작동은 하네요.
[33:58]
Claude Code에 공을 돌려야겠네요. 이런 작동하는 UI를 만들어줬으니까요.
[34:01]
공정하게 말하면, GPT-5는 얼마 전에 제가 같은 작업을 줬을 때
[34:04]
정말 잘 해냈어요.
[34:06]
Skatebench로 실행했더니
[34:08]
아직도 사용하고 있는 정말 좋은 UI가 나왔죠.
[34:10]
그걸 이 프로젝트로 포팅하려고 했는데
[34:11]
나중에 해볼 수도 있겠네요.
[34:13]
어쨌든 흥미로운 경험이었습니다.
[34:16]
Claude Code의 좋은 점들도 있어요.
[34:17]
이번 업데이트의 좋은 점들도 있고요.
[34:19]
특히 이번 업데이트에 대해서 말이죠.
[34:20]
실제로 존재하지 않는 기능들을
[34:22]
발표하고 있다는 게 좀 이상하긴 해요.
[34:24]
이런 건 그냥 틀렸거든요.
[34:28]
어쨌든 재미있네요.
[34:30]
Claude Code가 개선되고 있고
[34:32]
이런 CLI 도구들의 품질 기준을
[34:36]
조금씩 높이고 있어요.
[34:37]
가까운 미래에 이런 것들을 위한
[34:40]
더 나은 터미널 UI를 보게 될 거라 기대해요.
[34:42]
그리고 오픈 코드가
[34:44]
여기 있는 몇 가지 멋진 기능들을 따라할 거고
[34:45]
서브 에이전트의 시스템 프롬프팅도
[34:47]
수정해줄지도 모르겠어요. 그것도 문제가 있었거든요.
[34:51]
하지만 전반적으로는 괜찮습니다.
[34:53]
어느 정도 진전을 보는 게 좋네요.
[34:55]
팀 규모를 생각하면
[34:56]
정말 놀랍기도 해요.
[34:58]
얼마나 많은 엔지니어링 노력을 기울이고 있는지 생각하면
[34:59]
아직도 이런 문제들이 있다는 게 말이에요.
[35:03]
그래도 이런 긴 작업들을 실행할 수 있다는 건 멋지죠.
[35:05]
많은 잠재력이 있어요.
[35:07]
서브 에이전트도 흥미로운 기능이고요.
[35:09]
앞으로 어떻게 발전할지 기대됩니다.
[35:10]
여러분 생각은 어떤지 알려주세요.
[35:11]
제가 Claude Code에 너무 가혹한 건가요?
[35:12]
아니면 이게 정말 좀 이상한 건가요?
[35:14]
여러분 의견이 궁금해요.
[35:16]
그럼 다음에 또 만나요, 너드들!