[00:01]
구글이 새로운 모델을 출시했습니다
[00:04]
최근 구글이 활발하게 움직이고 있는데
[00:07]
이 새로운 모델이 사람들이 말하는 것처럼
[00:09]
실제로 Claude 3.7만큼 좋은지 알아보고 싶습니다
[00:11]
Claude를 사용해서 에이전트 코딩으로 테스트해보겠습니다
[00:14]
먼저 클라인을 사용한 제네틱 코딩으로 테스트하겠습니다
[00:17]
한 가지 조언하자면, AI 유튜버는 하지 마세요
[00:20]
정말 힘듭니다, 솔직히 말해서
[00:22]
3시간 전에 딥시크에 대한 영상을 만들었는데
[00:25]
이제 제미니 영상을 만들어야 합니다
[00:26]
물론 제가 하고 싶어서 하는 것이기도 하지만
[00:29]
비즈니스적으로도 좋죠, 단순히
[00:33]
조회수를 위해서만 하는 게
[00:35]
아니라는 거죠
[00:38]
이 영상도 조회수를 위한 것이긴 하지만요
[00:39]
그래서 다시 말하지만 AI 유튜버는 하지 마세요
[00:42]
매일 새로운 것이 나와서 정말 힘듭니다
[00:44]
저는 균형을 맞추려고 노력하고 있어요
[00:46]
클릭베이트 썸네일과 제목 사이에서
[00:48]
하지만 실제 가치도 제공하려고 합니다
[00:51]
이 영상에서 형편없는 테스트는 하지 않을 겁니다
[00:53]
예를 들어 '딸기'라는 단어에
[00:55]
'r'이 몇 개 있는지 같은 것 말이죠
[00:57]
이번에는 실제 에이전트 코딩 능력을
[01:00]
이 새로운 모델로 테스트해볼 겁니다
[01:04]
여기 있는 이 프롬프트를 사용해서요
[01:06]
이 프롬프트는 영상 설명란에서
[01:07]
찾을 수 있습니다 함께 작업하고 싶다면
[01:08]
위쪽에 세 개의 링크가 있고
[01:10]
수정해서 자신의 비즈니스에 적용하고 싶다면
[01:12]
파일 복사본을 만드세요
[01:14]
편집 권한은 요청하지 마세요
[01:17]
편집 권한은 드리지 않을 겁니다
[01:19]
이게 어떻게 작동하는지 보여드리면
[01:21]
Claude 3.7에서는 화면에서 보시는 것처럼
[01:24]
정확하게 작동합니다. 이건
[01:26]
Claude를 사용한 원샷 프롬프트 결과입니다
[01:31]
3.7 버전이죠. 그럼 새로운 구글 모델이
[01:34]
이 정도 수준에 근접할 수 있을까요?
[01:36]
먼저 할 일은
[01:37]
구글 모델을 설정하는 것입니다
[01:40]
구글 제미니를 보니
[01:42]
아직 모델을 설정하지 않았네요
[01:47]
보아하니 이 새 모델이
[01:49]
여기서는 아직 사용할 수 없네요
[01:51]
이 모델에 대해 몇 가지 설명하자면, 현재 무료이고
[01:54]
지연시간이 좀
[01:56]
긴 것 같네요. 사용 사례를 보면
[01:59]
복잡한 문제 해결, 코드 작성, 긴 맥락 처리가 가능하고
[02:03]
맥락 길이는
[02:05]
어디 보자... 맥락 길이가 얼마죠?
[02:08]
오, 100만 토큰이네요
[02:11]
정말 좋습니다. 만약 이게 잘 작동한다면
[02:13]
완벽하겠네요
[02:15]
오픈 라우터에 있는지 확인해보죠
[02:17]
아주 최근에 출시된 거라
[02:19]
음...
[02:21]
오케이, 실험 버전으로 있네요
[02:25]
여기 있네요. 3월 25일 생성이요
[02:29]
오픈 라우터에서 사용 가능합니다
[02:31]
오픈 라우터를
[02:32]
사용하면 되겠네요
[02:35]
제미니 2.5를 선택하고
[02:39]
여기
[02:40]
있네요. 이미지도 지원하고
[02:43]
최대 출력 토큰이 65,000개네요
[02:46]
좋습니다. 항상 하던 대로 플랜에 넣고
[02:48]
이 프롬프트를 보내볼 건데요
[02:50]
말씀드렸듯이 Claude 3.7은
[02:53]
이 프롬프트로 멋진 웹사이트를 만들어냈죠
[02:55]
이번엔 어떨지 보겠습니다
[02:57]
모든 걸 일관되고 간단하게 유지하면서
[03:01]
플랜이 완성됐고
[03:03]
저는 항상 이후에 바로 실행하도록
[03:05]
설정합니다
[03:07]
이제 20분에서
[03:09]
25분 정도 기다리면 됩니다
[03:10]
리턴 에러를 제공...
[03:12]
아니 죄송합니다 그건 아닙니다
[03:13]
몇 가지 준비해야 할 것들이
[03:14]
있는데요, 제가 이 프로젝트를 설정하는 방식을
[03:17]
보여드리겠습니다.
[03:19]
프로젝트를 이렇게 설정하는데요
[03:23]
여기서 이것을 Google로 변경하겠습니다
[03:25]
이건 제가 이전에 했던
[03:26]
영상에서 가져온 건데요, Google
[03:30]
Rolls-Royce
[03:34]
웹사이트이고
[03:37]
이제 Deep seek을 여기서 열겠습니다
[03:40]
그리고 다음으로 해야 할 것은
[03:41]
public 폴더 안에
[03:43]
이 이미지들을 가져와야 합니다
[03:45]
폴더를 열어야 하는데요
[03:47]
이렇게 하는 이유는 클라이언트가
[03:49]
가끔 약간 혼란스러워하기
[03:50]
때문입니다
[03:54]
자, 여기 Google Rolls-Royce가
[03:56]
있네요, 완벽합니다
[03:58]
이제 public으로 가서
[04:00]
images라는 새 폴더를 만들고
[04:03]
이 이미지들을 드래그 앤 드롭으로
[04:05]
여기에 넣으면 됩니다. 이제 실행할 준비가 되었습니다
[04:09]
뭔가 막힌 것 같은데
[04:11]
resume task를 눌러서
[04:13]
시작할 수 있는지 확인해보겠습니다
[04:15]
자, 이제 전
[04:17]
편하게 앉아서 이걸 실행시켜 놓고
[04:20]
지켜보기만 하면 되는데요, 최대 요청을 1,000으로
[04:24]
설정했고, 비용은 0이라고 나와있지만
[04:28]
물론 OpenRouter를 사용하므로
[04:29]
약간의 비용이 발생합니다
[04:32]
이제 어떻게 되는지
[04:33]
지켜보겠습니다. 지금 보기에는
[04:35]
이게 Deep Seek보다
[04:36]
훨씬 더 나은 구현처럼 보이네요
[04:40]
이러한 오류만 해결할 수 있다면
[04:42]
아마도 OpenRouter 때문일 텐데요
[04:44]
솔직히 말씀드리면
[04:46]
이건 승자가 될 수 있을 것 같습니다
[04:48]
3.7보다 나은지는 모르겠지만
[04:49]
3.7에 근접하기만 해도
[04:51]
괜찮을 것 같습니다
[04:52]
제가 3.7에 대해 얘기했던 것처럼
[04:55]
불과 몇 시간 전에 올린
[04:56]
영상에서 말씀드렸는데요
[04:59]
솔직히 말씀드리면 여기 있습니다
[05:03]
LLM의 성능이 있고
[05:06]
LLM의 비용이 있고
[05:08]
LLM의 속도가 있습니다
[05:10]
그리고 당연히 시간을 아끼고 싶은
[05:13]
사람이라면 가장 중요한 것은 성능과 속도지만
[05:17]
비용을 아끼고 싶은 사람이라면
[05:20]
비용이 가장
[05:21]
중요한 요소가 됩니다
[05:24]
따라서 만약 Sonet 3.7에 근접한 성능을 보이고
[05:28]
있다면
[05:30]
비용을 절약하고 싶은 상황에서
[05:33]
Gemini 2.5의 비용이 매우 낮다면
[05:38]
이건 승자가 될 수 있죠
[05:39]
Sonic에 근접하기만 한다면 말이죠. 하지만 99%의 경우
[05:42]
3.7 Sonic을 사용하게 될 겁니다
[05:44]
하지만 아직 단정 짓지는 말고
[05:46]
이것을 지켜보면서 어떻게 되는지
[05:49]
살펴보고 3.7 Sonic에
[05:50]
근접한 결과물이 나오는지 확인해봐야죠
[05:52]
만약 그렇고 더 저렴하다면
[05:54]
확실히 사용할 가치가 있습니다. 하지만
[05:56]
3.7 Sonic만큼 좋거나 더 나아야 합니다
[06:01]
매번 누군가가 3.7 Sonic이
[06:03]
이겼다고 말할 때마다
[06:06]
실제로는 그렇지 않았거든요
[06:08]
한번 보죠. 아직 초기 단계라
[06:11]
새로운 모델에 대해 클라이언트가
[06:14]
문제를 겪고 있는데요
[06:15]
그 이유는 아마도
[06:19]
코드를 생성하는 방식이
[06:23]
실제로는
[06:25]
제대로 작동하지 않아서
[06:27]
규칙을 제대로 따르지
[06:28]
않는다는 게 기본적인 문제예요.
[06:30]
항상 잘 작동하지는 않는데요
[06:34]
하지만 저는 여전히 이게
[06:35]
새 모델의 성능을 테스트하기에 좋은 방법이라고 생각해요
[06:41]
이게 처리되는 동안
[06:44]
우리 한번 들어가볼까요
[06:45]
Gemini... 음 뭐였지
[06:49]
Gemini Google... 아니 Google AI Studio였나
[06:58]
이 모델이 코드 측면에서 얼마나 좋은지 한번 보고 싶어요
[07:04]
코드를 보면서
[07:06]
바로 알 수 있거든요
[07:08]
이게 좋은지 나쁜지
[07:10]
제가 코딩 전문가는 아니지만
[07:12]
대충 볼 줄은 알아요
[07:13]
그래서
[07:15]
자, 이걸 한번 보내볼게요
[07:19]
어
[07:20]
이건 제가 원하는 게 아닌데요
[07:23]
어쨌든 보내서
[07:25]
어떤 결과가 나오는지
[07:27]
기다리는 동안 확인해보죠
[07:32]
여기 플레이스홀더가 많이 보이네요
[07:35]
이건 뭐 새로운 모델에서는
[07:38]
일반적인 현상이에요
[07:40]
솔직히 말해서
[07:41]
이건 생각하는 모델인 것 같은데
[07:44]
항상 좋은 신호죠
[07:47]
좋아요, 이거 괜찮아 보이네요, 네
[07:53]
정적 페이지에는 ASR이 필요 없죠
[07:57]
맞아요
[07:57]
그렇죠
[08:00]
네, 네, 꽤 좋아 보이네요
[08:04]
음
[08:06]
이거 완벽해 보이는데요
[08:09]
Sonic 3.7만큼 좋아 보이네요. 이 계획이 마음에 들어요
[08:15]
정말 정말 좋은 계획이에요
[08:18]
만약 이걸 다
[08:20]
구현할 수 있다면
[08:22]
솔직히 말해서 나쁘지 않을 것 같아요
[08:24]
음
[08:27]
이거 좋아요, 정말 좋아 보이네요
[08:30]
이걸 Klein에 넣을 수 있다면
[08:32]
계속 실패하지만 않는다면
[08:34]
이건 잠재적으로
[08:37]
3.7과 비슷한 수준일 것 같아요
[08:39]
거짓말하지 않을게요
[08:40]
편향된 말도 하지 않을 거예요
[08:42]
뭔가가 3.7만큼 좋다면
[08:45]
보면 알 수 있거든요
[08:47]
이건 매우
[08:49]
아주 상세하게 작성되어 있어요
[08:52]
그게 마음에 들어요
[08:54]
유일한 문제는
[08:57]
이걸 Klein 안에 넣을 수 있느냐
[08:59]
그게 문제죠
[09:01]
이탈리아어 콘텐츠가 있고
[09:02]
죄송해요, 영어
[09:03]
콘텐츠와 이탈리아어 콘텐츠가 있네요
[09:05]
이건 좋아요, 자동화된
[09:08]
푸터의 저작권 표시, 마음에 들어요
[09:11]
음...
[09:16]
솔직히 다 꽤 괜찮아 보이네요
[09:20]
사실 Klein보다
[09:21]
더 좋아 보여요
[09:27]
컴포넌트 아이콘들이네요, 한번 볼까요
[09:29]
SVG를 가져와서
[09:32]
Tri schools 에디터에서 볼 수 있죠
[09:34]
별표, 체크표시, 달력
[09:36]
구글 맵스 아이콘도 있네요
[09:40]
이것도 꽤 좋아요
[09:42]
솔직히 말해서
[09:43]
꽤 인상적이에요. 이걸 제 로컬
[09:46]
컴퓨터에 어떻게 가져올 수 있을지
[09:48]
잘 모르겠네요
[09:51]
음
[09:53]
Klein 같은 걸 쓰지 않고는요
[09:57]
지금은 많이 힘들어하고 있어요
[09:59]
정말
[10:00]
힘들어하네요. 네, Klein이
[10:02]
이걸
[10:03]
완전히 작동하게 되면 이건 아마도
[10:07]
정말로
[10:09]
소닉 3.7만큼 좋을 수 있고
[10:12]
그리고 현재 체...
[10:14]
무료라는 게 정말 놀랍습니다
[10:17]
솔직히 말씀드리면, 저는 인상깊었습니다
[10:19]
이 코드의 깊이와 정확성, 그리고
[10:23]
완성도를 보면 모든 것이
[10:25]
잘 작동할 것 같습니다. 어떤
[10:27]
문제점도 보이지 않고, 실제로
[10:29]
소닉 3.7이 만든 것과 거의 동일합니다
[10:33]
제가 가장 보고 싶은 것 중 하나는
[10:35]
이 모든 것이 어떻게 함께
[10:36]
작동하는지인데, 솔직히 어떻게
[10:39]
이걸 할 수 있을지 모르겠네요
[10:42]
클라이언트가 계속 멈추기 때문에
[10:44]
제가 할 수 있는 것은 이 모든 것을 가져와서
[10:46]
직접 만들거나 명령어를 가져와서 만드는 것입니다
[10:51]
아니면 제가 뭔가를 할 수도 있죠
[10:54]
하나씩 넣을 수도 있지만
[10:55]
시간이 좀 걸릴 것 같네요
[10:57]
이 영상을 위해서라도
[10:59]
그렇게 할 것 같은데, 클라이언트가
[11:01]
계속 어려움을 겪을 것 같아서요
[11:02]
솔직히 말씀드리면, 그래서 이걸
[11:05]
끝내고 시네 없이 빌드를
[11:07]
시도해보려고 합니다
[11:09]
이 모델이 얼마나 좋은지 실제로 보기 위해서요
[11:12]
하지만 이것만 봐도
[11:13]
좋아 보이고 정확해 보이며
[11:15]
작동할 것 같습니다
[11:17]
음... 잘 동작할 것 같네요
[11:20]
아직 홈페이지는 없지만
[11:22]
괜찮습니다. 그리고 이것 봐요
[11:24]
솔직히 꽤 좋아 보입니다
[11:25]
거짓말하지 않겠습니다
[11:27]
저는 진실만을 말하려고 하고
[11:28]
이건 정말 좋아 보이네요. 자, 제가
[11:31]
이것을 여기에 복사 붙여넣기 하는 동안
[11:32]
제가 찾고 있는 것은 문제점들입니다
[11:36]
오류 같은 것들인데, 지금까지는 좋네요
[11:39]
솔직히 말씀드리면, 저는
[11:41]
매우 궁금합니다
[11:43]
자, 이것이 클라인에서 나온 결과입니다
[11:45]
다른 것은 잘 작동하지 않았는데
[11:47]
음... 네, 직접 입력해야 할 때는
[11:50]
좀 귀찮거든요
[11:51]
이건 나쁘지 않습니다. 이건
[11:53]
확실히 딥시크보다 낫고
[11:55]
디자인도 마음에 듭니다
[11:57]
물론 바꿔야 할 것들이
[11:59]
많습니다. 읽기 어려운
[12:01]
텍스트도 있지만
[12:03]
전반적으로 꽤 좋습니다
[12:06]
웨딩 페이지는 아직
[12:07]
디자인하지 않은 것 같지만
[12:09]
괜찮습니다. 그건 과정의 일부니까요
[12:12]
이탈리아어로 전환되는지 봅시다
[12:14]
네
[12:15]
됩니다. 음... 제 머릿속으로
[12:19]
이게 얼마나 좋은지
[12:21]
딥시크 같은 것과 비교해보면
[12:23]
확실히 딥시크보다 낫고
[12:26]
소닉 3.7과 비슷한 수준입니다
[12:30]
이건 확실히, 만약 제가
[12:32]
둘 중 하나를 고른다면
[12:36]
이건 비용이 얼마죠?
[12:41]
0.47입니다. 그러니까 같은 작업에
[12:48]
0.47, 이건 1센트보다도
[12:51]
적습니다
[12:53]
1페니보다도
[12:56]
적다는 거죠. 자, 이게 흥미로운 점인데
[12:59]
가격도 저렴하고
[13:02]
품질도 좋아 보입니다
[13:05]
소닉 3.7과 거의 비슷하거나
[13:09]
동등한 수준으로 보입니다
[13:12]
100만 컨텍스트 윈도우가 있어서
[13:18]
클로드의 한 가지 문제점은
[13:20]
프로젝트 끝이나 심지어
[13:22]
중간에도 이미 모든
[13:24]
컨텍스트 윈도우를 다 써버려서
[13:25]
마치 누군가와 작업하는 것 같은데
[13:28]
치매 환자와 일하는 것처럼
[13:31]
점점 잊어버리고
[13:32]
이상한 행동을 하기 시작해요
[13:34]
치매 환자 비유가 좀 그렇지만
[13:36]
치매 환자와 일하는 것처럼
[13:38]
꼭 기억해야 할 것들을
[13:40]
점점 잊어버리기 시작하고
[13:42]
반복적인 대화를 하게 되죠
[13:46]
아마 다들 경험해 보셨을 거예요
[13:51]
충분한 컨텍스트 윈도우는
[13:53]
100만 토큰이고, 속도도 꽤 빠른 것 같아요
[13:57]
Open Router에서는 좀 느리게 보이지만
[13:59]
일반적으로 Open Router가
[14:01]
그렇게 빠르지 않거든요
[14:04]
여기서는 이제 모든 플레이스홀더 코드를
[14:08]
채우고 웹사이트를 출시할 준비를 위해
[14:11]
모든 페이지를 완성하라고 할 거예요
[14:14]
필요한 모든 것이
[14:16]
이 영상의 설명란에 있어요
[14:17]
프롬프트도 포함해서요. 제가 보기에
[14:21]
이건 정말 흥미롭죠
[14:23]
확실히 ChatGPT보다
[14:25]
더 좋아요. 현재 ChatGPT의
[14:29]
최고 모델보다 더 뛰어나요
[14:32]
ChatGPT의 최고 모델이
[14:33]
현재
[14:36]
100만 출력 토큰당 75달러 또는
[14:40]
20달러 정도 하는데
[14:43]
이건 사실상 무료예요
[14:45]
완전히 무료는 아니지만
[14:47]
1센트도 안 되는 비용으로 전체 앱을 만들 수 있다는 게
[14:50]
정말 놀랍죠
[14:51]
여기서 영상을 마무리하겠습니다
[14:53]
DeepSeek보다 이걸 테스트하고 살펴보는 게
[14:56]
더 가치 있을 것 같아요
[14:58]
DeepSeek를 반대하는 건 아니에요
[15:00]
단지 한 번도 깊은 인상을
[15:02]
받지 못했을 뿐이에요
[15:04]
무료이고 오픈소스라는 건 알지만
[15:07]
거의 무료인 데다
[15:09]
오픈소스는 아니지만
[15:12]
Claude만큼 잘 작동하는 걸 만들 수 있다면요
[15:16]
지금 제 머릿속에서는
[15:18]
이렇게 저렴하니까
[15:21]
Claude를 대체할 수 있겠다
[15:24]
반드시 그렇진 않지만
[15:26]
제 생각으로는
[15:27]
Harbor 내에서 Claude 3.7을
[15:31]
Gemini 2.5로 대체할 수 있을 것 같아요
[15:35]
Harbor의 복잡한 프롬프트를
[15:38]
처리하기에 충분히 좋고
[15:40]
게다가 1만 배나 저렴하거든요
[15:43]
이런 것들이 제가
[15:45]
매일 고민하는 부분이에요
[15:48]
DeepSeek 3.1보다
[15:49]
확실히 더 가치가 있죠
[15:52]
영상 끝까지 시청해주신
[15:53]
여러분은 정말 대단하시고
[15:54]
곧 더 많은 콘텐츠로
[15:56]
찾아뵙도록 하겠습니다
[15:59]
안녕히 계세요