[00:00]
안녕하세요 여러분, 이번 영상은 좀
[00:03]
투덜거리는 내용이 될 것 같아요. 지난
[00:04]
며칠 동안 제가 좀 잠적했었는데,
[00:06]
Claude Code에 완전히 중독되어 있거든요. 하지만
[00:10]
AI 회사들에 대해 일반적인 불만을 얘기하고 싶어요.
[00:13]
당연히 주로 말하는 건
[00:15]
OpenAI,
[00:17]
Anthropic, 그리고 Google입니다. 이 세 회사가
[00:19]
모델 측면에서 괜찮다고 생각하는 유일한
[00:23]
회사들이에요. OpenAI는 제가
[00:25]
잘 사용하지 않지만, 이 회사들도 이 리스트에 있는
[00:28]
다른 회사들만큼이나 문제가 있어요. 이제
[00:32]
댓글로 제가 말하는 것에
[00:34]
동의하시는지 아니면 제가
[00:36]
그냥 미쳤다고 생각하시는지 알려주세요.
[00:41]
그래서 Anthropic 말인데, 제가
[00:44]
가장 좋아하는
[00:46]
모델들이고, 제 생각에는 단연코 최고의 모델들이에요.
[00:48]
Claude Code의 Opus 4는
[00:53]
정말, 정말 좋아요. Sonic 4도
[00:55]
Claude Code에서 정말, 정말 좋고요.
[00:57]
그리고 이 영상에서 제가
[00:59]
말하려는 내용에도 불구하고, 이 모델들은 여전히
[01:02]
정말 훌륭한 모델들이에요. 이 두 모델,
[01:04]
정말, 정말 좋은 모델들이에요.
[01:06]
Google 2.5 Pro도 정말, 정말 좋은
[01:09]
모델이에요. 아마 이 모델들과
[01:12]
거의 동등한 수준이라고 말하고 싶어요.
[01:14]
하지만 특히 Opus 4에 대해서만
[01:17]
이야기해보죠. Opus 4가
[01:18]
제가 여기서 하려는 말을 정말 잘
[01:20]
보여준다고 생각하거든요. 그리고
[01:22]
왜 이런 일이 일어나는지에 대한
[01:24]
이론도 제시할 거예요. 이게 바로
[01:27]
AI의 진실이에요. 2-3주 전에,
[01:30]
지금은 기억이 안 나는데, 아마
[01:32]
이번 달 23일이나 24일 쯤,
[01:35]
아니 죄송, 지난달 5월에 그들이
[01:37]
Opus 4를 출시했어요. 엄청난 화제였죠. 오 마이
[01:41]
갓. 정말 엄청난 화제였어요. 저는 그들이 출시한
[01:44]
첫날에 바로 사용해봤어요.
[01:46]
그리고 무슨 일이 일어났는지
[01:48]
이야기해드릴게요. 저는 공항에서 새 맥북으로
[01:51]
Claude Code를 테스트하고 싶었어요.
[01:56]
맥에서 Claude Code를 사용하는 것이
[01:58]
윈도우에서 사용하는 것과는 다르다는 걸 알고 있었거든요.
[02:00]
실제로 훨씬
[02:02]
쉬웠어요. 30분 만에 새로운 기능을 추가했는데,
[02:07]
Harbor라는 프로젝트인데 아마
[02:10]
1만 줄 이상의 코드를 가지고 있을 거예요.
[02:12]
이게 제가 Claude Code를 처음 사용해본 거였는데,
[02:15]
30분 만에 말이에요. 맥에서 설정했는데, 이전에는
[02:18]
WSL에서 어떻게 설정하는지 몰랐거든요.
[02:20]
윈도우에서요. 이제는 할 수 있어요.
[02:22]
지금 윈도우에서 사용하고 있지만,
[02:24]
여전히 Claude Code 작업을 할 때는
[02:26]
맥을 많이 사용해요.
[02:28]
어떤 이유에서인지 맥에서는
[02:30]
컨텍스트 길이가 더 긴 것 같아요.
[02:33]
다른 분들도 이런 경험을
[02:34]
하셨는지 모르겠지만, 사실 그게 이 영상의
[02:36]
주제는 아니에요. 이 경험은
[02:38]
정말 놀라웠어요. 저는
[02:41]
이런 경험을 해본 적이
[02:44]
없었거든요. 그래서 며칠 동안 결혼식에
[02:47]
갔었어요. 금요일이었는데,
[02:49]
Opus가 출시된 그 다음날인가
[02:52]
하여튼 그 무렵이었어요. 5월 23일인가
[02:55]
그 정도였던 것 같은데,
[02:57]
22일일 수도 있지만 뭐 상관없어요.
[02:59]
일요일에 집에 와서
[03:02]
프로젝트를 만들기 시작했어요.
[03:04]
그리고 그 시간 동안 Opus 4를 사용해서
[03:07]
이 전체 프로젝트를 만들었어요. 시크릿 모드로
[03:12]
들어가보겠습니다. 이 전체
[03:15]
이 프로젝트를 봐주세요. 이건 최종 버전이 아니에요.
[03:17]
그냥 이것저것 테스트해본 거예요.
[03:20]
하지만 이 모든 랜딩 페이지들을 만들어냈고
[03:21]
백엔드에 전체 시스템을 구축했습니다.
[03:24]
Shopify SEO를 자동화할 수 있는 시스템이죠.
[03:26]
이런 프로젝트는 정말 오랫동안 만들고 싶었는데
[03:31]
불가능했어요. 모델도 부족했고
[03:34]
제 코딩 지식도 부족했거든요.
[03:36]
하지만 그 이후로 코딩 실력이 많이 늘었고
[03:38]
모델들도 발전했습니다. 그래서 이 전체 프로젝트를
[03:42]
자세히 설명하지는 않겠어요.
[03:43]
이건 광고가 아니니까요.
[03:45]
하지만 이 전체 프로젝트가
[03:48]
총 3주 정도 걸렸어요.
[03:50]
그리고 이 모든 것들을
[03:51]
Shopify 스토어를 위해
[03:53]
자동으로 처리해줍니다.
[03:56]
이건 정말 복잡하고
[03:58]
방대한 프로젝트예요.
[04:00]
그런데 저는 뭔가를 발견했어요.
[04:03]
저는 Opus 4를 지속적으로 사용해왔고
[04:06]
제 스트림에서 확인할 수 있듯이
[04:10]
2주 동안 80시간 정도
[04:11]
스트리밍을 했어요.
[04:13]
일요일부터 일주일 전까지
[04:16]
80시간 동안 Opus를 사용했습니다.
[04:18]
그런데 뭔가를 발견했어요.
[04:22]
여러분도 아마
[04:23]
눈치챘을 것 같은데
[04:25]
Opus의 품질이 지속적으로 하락하고 있어요.
[04:29]
지금부터 제가 왜 이런 일이
[04:32]
일어나는지에 대한 이론을
[04:34]
말씀드릴게요.
[04:36]
그래프로 표현하면 이게 Opus의 품질이고
[04:40]
이게 그들이 가진 대역폭이라고 할 수 있어요.
[04:45]
제 생각에는 이런 일이
[04:48]
벌어지고 있는 것 같아요.
[04:52]
수학을 잘 못하지만 기본적으로
[04:55]
100명을 지원하는 데 필요한 전력이나
[05:00]
간단하게 말해서 첫날에 100명
[05:02]
둘째 날에 200명
[05:04]
셋째 날에 400명
[05:06]
그리고 갑자기 입소문이 나면서
[05:08]
800명이 되고
[05:10]
모든 사람들이 Claude Code에 대해
[05:12]
이야기하기 시작해요.
[05:14]
Claude Code를 써라, Claude Code
[05:15]
모두 Claude Code를 써라
[05:17]
갑자기 10,000명이
[05:18]
사용하게 되는 거죠. 제 생각에는
[05:21]
그들이 이런 수준의 Opus 사용량을
[05:24]
처리할 수 있는 파워 센터가
[05:26]
부족한 것 같아요. 물론 제가
[05:29]
틀릴 수도 있어요.
[05:31]
그냥 추측일 뿐이고
[05:33]
다른 이유가 있을 수도 있지만
[05:35]
100% 확실한 건 Opus의 품질이
[05:38]
출시된 날부터 지속적으로 하락했다는 거예요.
[05:42]
그리고 이건 공정하지 않다고 생각해요.
[05:45]
좋은 예시가 떠오르지 않지만
[05:46]
뭔가를 사는데
[05:48]
3주 후에 그게
[05:51]
예전보다 훨씬 나빠지는 것과 같아요.
[05:55]
그리고 가장 짜증나는 건
[05:58]
제가 많은 사람들에게
[05:59]
Claude Code Max를 추천했다는 거예요.
[06:02]
지금도 여전히 추천하고 싶어요.
[06:06]
월 200달러짜리 코딩 시스템 중에서는
[06:08]
여전히 최고라고 생각해요.
[06:12]
꽤 합리적인 거래죠.
[06:14]
Opus를 마음껏 사용할 수 있으니까요.
[06:16]
하지만 솔직히 말하면
[06:19]
Anthropic이 원하는 만큼
[06:21]
매달 돈을 내고서라도 이 Opus에
[06:25]
접근하고 싶어요. 제 생각에 이건 아마도
[06:26]
사용자 수에 따른 자동화된 프로세스인 것 같아요.
[06:29]
제가 발견한 건 다른 시간에
[06:31]
사용하면 지능이 어느 정도
[06:32]
회복되는 것 같지만 전부는 아니에요.
[06:36]
확실히 전부는 아니고요.
[06:38]
이게 제게는 큰 문제예요.
[06:41]
저는 이 버전의 Opus가 필요하거든요.
[06:45]
제가 오늘 사용하고 있는
[06:46]
이 버전의 Opus 말이에요.
[06:48]
버전이라는 용어가 정확하지 않을 수도 있지만
[06:49]
이런 Opus의 설정이나 뭐든 간에요.
[06:53]
저는 아무것도 바꾸지 않았어요.
[06:54]
이전과 정확히 같은
[06:56]
코딩 방법론을 사용하고 있거든요.
[06:58]
하지만 오늘 사용하고 있는
[07:00]
이 버전의 Opus는 그냥
[07:02]
예전만큼 좋지 않아요.
[07:04]
여전히 좋긴 해요. 99%보다는
[07:06]
여전히 제 생각엔 모든 것보다
[07:08]
낫긴 한데, 그게 짜증나는 부분이에요.
[07:10]
그래서 여전히 사용해야 하거든요.
[07:11]
하지만 오늘도 생각해봤는데
[07:13]
Google 2.5 Pro를 다시 시도해볼까 했어요.
[07:16]
왜냐하면 이 Opus라면
[07:18]
20분 만에 구현했을 것들을
[07:20]
지금은 구현하는 데 애를 먹고 있거든요.
[07:23]
제가 발견한 또 다른 점은
[07:26]
게으름이 증가했다는 거예요.
[07:28]
그들이 말하는
[07:31]
보상 해킹이라고 하는 것이
[07:34]
증가했어요.
[07:36]
기본적으로 완료했다고 말하고는
[07:39]
실제로는 완료되지 않았거나
[07:42]
예를 들어 완료했다고 말하면서
[07:45]
여기 결과가 있다고 하는데
[07:47]
코드를 보면 그냥
[07:49]
하드코딩된
[07:51]
좋아 보이는 결과를 만들어놓은 거예요.
[07:54]
이게 정말 미친 일이에요.
[07:57]
어제 뭔가를 요청했는데
[07:58]
제 에이전트 시스템을 사용하는
[08:00]
에이전트 시스템을 만들어달라고 했어요.
[08:02]
마지막에 계획만 출력하는
[08:05]
계획 에이전트 같은 거요.
[08:07]
6개월 SEO 계획이나 뭐 그런 거요.
[08:10]
결과는 그냥 6개월 계획을
[08:14]
콘솔 로그에 써놓고
[08:17]
그 계획을 저에게 출력한 거예요.
[08:19]
처음에는 와, 이거 놀라운데
[08:21]
봐, 제가 만든, 아니 그게 만든
[08:23]
이 놀라운 에이전트 시스템을 보라고요.
[08:26]
그런데 다시 실행해보니
[08:29]
글자 하나하나까지 똑같더라고요.
[08:30]
잠깐, AI는 그렇게 작동하지 않는데
[08:32]
똑같은 결과를 두 번 얻는 건
[08:35]
기본적으로 불가능해요.
[08:38]
정말 짧은 결과가 아닌 이상
[08:40]
100단어가 넘는다면
[08:42]
100% 같을 확률은
[08:46]
아마 0이거나 0점 뭐뭐
[08:49]
극히 드물어요.
[08:52]
그래서 문제가 뭔지 알았어요.
[08:54]
살펴보니 하드코딩되어 있더라고요.
[08:55]
이전 버전의 Opus라면
[08:57]
그런 짓은 안 했을 거예요.
[08:59]
절대 안 했을 거라고요.
[09:02]
이런 것들이 제 생각에는 AI 코딩을
[09:05]
망치는 요소들이에요.
[09:08]
게으름, 보상 해킹,
[09:11]
테스트 하드코딩,
[09:13]
콘솔 로그에 넣어놓기, 이런 것들 말이에요.
[09:15]
리서치도 마찬가지예요.
[09:17]
예전에 리서치를 요청하면
[09:20]
내부 리서치 도구가 가서
[09:22]
10분 동안 리서치를 했어요.
[09:25]
이제 뭔가를 리서치해달라고 하면
[09:27]
그냥 페이지 하나만 긁어서
[09:29]
"네, 됐습니다. 끝." 이런 식이에요.
[09:30]
그리고는 "이건 충분하지 않아요."
[09:32]
정말 충분하지 않습니다.
[09:34]
이런 상황이 아니었으면 정말 좋겠어요.
[09:36]
어떻게든 다시 원래 수준으로
[09:38]
복구될 수 있기를 진심으로 바랍니다.
[09:41]
한 달에 천 달러를 내야 한다면
[09:43]
그렇게 하겠습니다. 우리는 낼 의향이 있어요.
[09:46]
이천 달러라도 말이죠. 모르겠네요.
[09:48]
얼마나 활용할 수 있느냐에 따라 다르겠지만요.
[09:50]
어쨌든, 이 리서치 기능 때문에
[09:51]
Bright Data MCP를 사용하게 되었는데
[09:54]
실제로 Bright Data MTP가 정말 마음에 들어요.
[09:56]
이 채널의 스폰서이기도 하지만
[09:57]
그냥 평소에도 사용하고 있어요.
[09:59]
A, 무료 크레딧을 많이 주셔서 그렇기도 하고
[10:01]
B, 실제로 매우 유용하고
[10:03]
더 많은 리서치를 하도록 독려하는 데
[10:06]
정말 도움이 되기 때문입니다.
[10:08]
이제 내부 리서치 도구는
[10:11]
한두 페이지만 스크랩합니다.
[10:13]
Bright MCP를 사용해서
[10:15]
철저한 리서치를 요청하면
[10:17]
보통 몇 페이지를 더 스크랩하게 됩니다.
[10:19]
바로 이런 이유로 Bright Data MCP를 사용하는 거예요.
[10:21]
설명란에 Bright Data MCP 링크가 있을 거예요.
[10:23]
15달러 무료로 받아서
[10:24]
사용해보실 수 있습니다.
[10:26]
기본적으로 Google 검색을 할 수 있게 해주고
[10:28]
그 결과들을 스크랩할 수도 있어요.
[10:32]
또한 마크다운 스크랩도 할 수 있는데
[10:34]
만약 마크다운 스크랩을
[10:36]
문서 페이지에서 실행하면
[10:38]
사이드바의 모든 링크들을
[10:40]
가져올 수 있거든요. 그러면
[10:43]
그 링크 목록에서 어떤 것을
[10:45]
읽어야 할지 선택할 수 있어요.
[10:46]
그래서 이 모든 상황을 해결하기 위해
[10:49]
제가 하고 있는 일이 있는데
[10:51]
어느 정도 효과가 있는 것 같아요.
[10:53]
이 버전 대신 이 버전의 Opus를
[10:57]
사용하는 것 같은 느낌이에요.
[10:59]
MD 리서치 파일을 만들고 있거든요.
[11:01]
대화 시작 시에 Bright Data를 사용해
[11:04]
스크랩을 하게 하고
[11:06]
계획을 세우게 한 다음
[11:08]
MD 파일에 넣어둡니다.
[11:12]
그리고 /compact를 실행할 때마다
[11:14]
MD 파일을 읽어달라고 요청하고
[11:18]
할 일 목록으로 MD 파일을
[11:21]
업데이트하라고 하면서
[11:23]
진행하면서 항목들을 체크해나가게 해요.
[11:26]
흥미롭게도, 저는 Taskmaster 같은 것으로
[11:30]
다시 돌아가는 것도 고려하고 있어요.
[11:33]
이런 종류의 모델을 사용하는 것이
[11:36]
완전히 지겨워졌거든요.
[11:38]
더 많은 잠재력이 있다고 믿는데 말이에요.
[11:39]
그냥 유망한 일일 수도 있지만요.
[11:41]
그래서 Taskmaster를 시도해보고
[11:42]
정말 높은 수준으로
[11:44]
다시 올라갈 수 있는지 확인해볼 거예요.
[11:44]
여기서 비디오를 마치겠습니다, 여러분.
[11:46]
시청해주셔서 정말 감사합니다.
[11:48]
비디오를 끝까지 보신다면
[11:50]
정말 대단한 분이시고, 곧 더 많은 콘텐츠로 뵙겠습니다. 안녕!