신형 Google Gemini 2.5 모델, 0.001달러로 웹사이트 제작

채널 아이콘
Income stream surfers 구독자 130,000명

요약

이 영상은 Google의 최신 Gemini 2.5 모델을 Sonic 3.7과 비교하며 웹사이트 생성 능력을 테스트한 과정을 담고 있습니다. 실제 테스트 환경 설정부터 코드 생성, 그리고 출력 결과를 분석하면서 모델의 강점과 현재의 한계를 솔직하게 평가합니다. 특히, 1백만 토큰의 컨텍스트 윈도우, 빠른 속도, 그리고 극저비용의 장점을 강조하며 비즈니스 적용 가능성을 살펴봅니다. 전체적으로 Gemini 2.5 모델의 효율성과 활용도를 면밀하게 검토하는 내용입니다.

주요 키워드

Google Gemini 2.5 Sonic 3.7 Open Router 코드 생성 웹사이트 제작 비용 효율 컨텍스트 윈도우 테스트 환경

하이라이트

  • 🔑 Google이 새롭게 선보인 Gemini 2.5 모델은 웹사이트 제작을 극저비용으로 가능하게 한다는 점을 강조합니다.
  • 🌟 Sonic 3.7과의 비교를 통해 Gemini 2.5의 코드 품질과 디자인 구현 능력을 면밀하게 분석합니다.
  • ⚙️ Open Router와 같은 플랫폼을 활용하여 테스트 환경을 구성하고 파일 및 이미지 설정 등 구체적인 세팅 과정을 상세히 설명합니다.
  • 🚀 모델의 1백만 토큰 컨텍스트 윈도우와 빠른 응답 속도가 개발 작업에 중요한 영향을 미친다는 점을 부각시킵니다.
  • 📌 전체 웹사이트 제작 비용이 1펜시도 안 되는 엄청난 경제성을 강조하며, 비용 효율성이 모델 선택의 핵심 요소임을 언급합니다.
  • 🔍 테스트 과정 중 코드의 일부 오류 및 클라이언트와의 통합 문제 등 초기 단계의 한계도 솔직하게 지적합니다.
  • 💡 전반적으로 속도, 효율성, 비용 등을 균형 있게 고려한 평가를 통해 Gemini 2.5가 향후 Sonic 3.7을 대체할 잠재력이 있음을 시사합니다.

용어 설명

Google Gemini 2.5

Google에서 출시한 최신 AI 모델로, 저비용으로 웹사이트 및 앱 코드를 자동 생성하는 데 중점을 둠.

Sonic 3.7

기존에 높은 품질의 코드 출력을 자랑하던 AI 모델로, Gemini 2.5와의 성능 및 결과물 비교 대상으로 언급됨.

Open Router

AI 모델 접근 및 호출을 위한 API 플랫폼으로, 테스트 환경 구축에 사용됨.

컨텍스트 윈도우

AI 모델이 한 번에 처리할 수 있는 최대 토큰 수를 의미하며, Gemini 2.5는 1백만 토큰을 지원함.

Deep Seek

기존의 코드 생성을 위한 오픈소스 도구로, 이번 비교 대상에서 Gemini 2.5의 우수성을 부각시키는 역할을 함.

[00:00:01] 모델 소개 및 비교 의도

Google이 새 Gemini 2.5 모델을 공개하며 Sonic 3.7과의 비교 테스트를 진행합니다. 영상은 모델 성능과 웹사이트 생성 가능성을 중심으로 설명됩니다.

구글이 새로운 모델을 출시했으며, 이를 Claude 3.7과 비교하여 테스트해보려고 합니다.
AI 유튜버의 고충을 설명하며, 매일 새로운 AI 소식을 다뤄야 하는 힘든 현실을 토로합니다.
클릭베이트성 콘텐츠와 실질적 가치 제공 사이의 균형을 맞추려 노력하고 있음을 설명합니다.
새로운 구글 모델을 테스트하기 위한 프롬프트와 작업 방식을 소개합니다.
구글 제미니 2.5 모델의 특징과 성능을 설명하고, 오픈 라우터를 통한 테스트 준비 과정을 보여줍니다.
[00:02:05] 테스트 환경 및 설정 구성

Open Router를 활용한 테스트 환경 구성과 이미지, 파일 배치 등 실제 설정 과정을 자세히 다룹니다. 설정 과정에서의 세부적인 단계가 설명됩니다.

프로젝트 설정을 시작하면서 Google Rolls-Royce 웹사이트를 위한 기본 환경을 구성하고 있습니다.
public 폴더에 이미지를 추가하는 과정을 진행하며, 클라이언트의 혼란을 방지하기 위한 설정을 완료합니다.
실행 중 발생한 문제를 해결하고, Deep Seek보다 나은 구현 가능성을 확인했습니다.
LLM의 세 가지 주요 요소인 성능, 비용, 속도에 대해 설명하며, 사용자의 필요에 따른 선택 기준을 제시합니다.
Gemini 2.5가 3.7 Sonic에 근접한 성능을 보이면서도 저렴하다면 비용 효율적인 대안이 될 수 있다고 설명합니다.
[00:06:01] 코드 생성 및 결과 분석

생성된 웹사이트 코드와 디자인을 실시간으로 비교 분석합니다. 코드의 정확도, 디테일, 플레이스홀더 처리 등이 중점적으로 평가됩니다.

모델이 규칙을 제대로 따르지 않아 코드가 제대로 작동하지 않는 문제가 있지만, 새 모델의 성능을 테스트하기에는 좋은 방법이라고 생각합니다.
Google AI Studio에서 모델의 코드 성능을 확인하고자 합니다. 전문가는 아니지만 코드의 품질을 대략적으로 판단할 수 있습니다.
새 모델에서 일반적으로 나타나는 많은 플레이스홀더가 보이지만, 이는 생각하는 모델의 특징으로 긍정적인 신호입니다.
코드 품질이 Sonic 3.7과 비슷한 수준으로 완벽해 보이며, 매우 상세하게 작성되어 있습니다.
Klein에 통합하는 것이 유일한 문제점이지만, 영어와 이탈리아어 콘텐츠, 자동화된 저작권 표시 등 전반적인 구현이 Klein보다 더 좋아 보입니다.
컴포넌트 아이콘들(별표, 체크표시, 달력, 구글맵스)의 구현도 인상적이며, 로컬 환경으로의 이전이 현재의 과제입니다.
[00:10:00] 성능, 비용 및 모델 평가

모델의 빠른 처리 속도와 1백만 토큰의 컨텍스트 윈도우, 그리고 극저비용의 이점을 강조합니다. Sonic 3.7과의 성능 비교를 통한 경제성 평가가 이루어집니다.

제미니 2.5가 소닉 3.7과 비슷한 수준의 성능을 보여주며, 현재 무료로 이용 가능한 것이 놀랍다고 평가
코드의 깊이와 정확성, 완성도가 매우 인상적이며 소닉 3.7이 생성한 것과 거의 동일한 수준의 결과물 확인
클라이언트 문제로 인해 수동으로 코드를 입력하거나 직접 빌드해야 하는 상황 설명
생성된 웹사이트 검토 - 디자인이 좋고 기능이 정상적으로 작동하며, 다국어 지원도 확인
딥시크와 소닉 3.7 비교 분석 - 0.47센트(1페니 미만)의 매우 저렴한 비용으로 소닉 3.7과 동등한 수준의 성능 제공
클로드의 한계점 언급 - 프로젝트 진행 중 컨텍스트 윈도우 소진 문제 지적
Claude의 컨텍스트 윈도우 한계로 인해 프로젝트 진행 중 기억을 잃어버리고 반복적인 대화를 하게 되는 문제점을 설명합니다.
100만 토큰의 충분한 컨텍스트 윈도우와 빠른 처리 속도에 대해 설명하고, 웹사이트 완성을 위한 단계를 안내합니다.
ChatGPT의 최고 모델과 비교하여 Gemini 2.5의 비용 효율성과 성능의 우수성을 강조합니다.
DeepSeek와 비교하며 Gemini 2.5의 장점을 설명하고, Harbor 내에서 Claude 3.7을 대체할 가능성을 검토합니다.
[00:15:00] 결론 및 향후 전망

초기 오류와 클라이언트 통합 문제 등 한계를 언급하며 후속 테스트 및 개선 방향을 제시합니다. Gemini 2.5의 잠재적 대체 가능성을 논의합니다.

타임라인 정보가 없습니다.

구글이 새로운 모델을 출시했습니다
최근 구글이 활발하게 움직이고 있는데
이 새로운 모델이 사람들이 말하는 것처럼
실제로 Claude 3.7만큼 좋은지 알아보고 싶습니다
Claude를 사용해서 에이전트 코딩으로 테스트해보겠습니다
먼저 클라인을 사용한 제네틱 코딩으로 테스트하겠습니다
한 가지 조언하자면, AI 유튜버는 하지 마세요
정말 힘듭니다, 솔직히 말해서
3시간 전에 딥시크에 대한 영상을 만들었는데
이제 제미니 영상을 만들어야 합니다
물론 제가 하고 싶어서 하는 것이기도 하지만
비즈니스적으로도 좋죠, 단순히
조회수를 위해서만 하는 게
아니라는 거죠
이 영상도 조회수를 위한 것이긴 하지만요
그래서 다시 말하지만 AI 유튜버는 하지 마세요
매일 새로운 것이 나와서 정말 힘듭니다
저는 균형을 맞추려고 노력하고 있어요
클릭베이트 썸네일과 제목 사이에서
하지만 실제 가치도 제공하려고 합니다
이 영상에서 형편없는 테스트는 하지 않을 겁니다
예를 들어 '딸기'라는 단어에
'r'이 몇 개 있는지 같은 것 말이죠
이번에는 실제 에이전트 코딩 능력을
이 새로운 모델로 테스트해볼 겁니다
여기 있는 이 프롬프트를 사용해서요
이 프롬프트는 영상 설명란에서
찾을 수 있습니다 함께 작업하고 싶다면
위쪽에 세 개의 링크가 있고
수정해서 자신의 비즈니스에 적용하고 싶다면
파일 복사본을 만드세요
편집 권한은 요청하지 마세요
편집 권한은 드리지 않을 겁니다
이게 어떻게 작동하는지 보여드리면
Claude 3.7에서는 화면에서 보시는 것처럼
정확하게 작동합니다. 이건
Claude를 사용한 원샷 프롬프트 결과입니다
3.7 버전이죠. 그럼 새로운 구글 모델이
이 정도 수준에 근접할 수 있을까요?
먼저 할 일은
구글 모델을 설정하는 것입니다
구글 제미니를 보니
아직 모델을 설정하지 않았네요
보아하니 이 새 모델이
여기서는 아직 사용할 수 없네요
이 모델에 대해 몇 가지 설명하자면, 현재 무료이고
지연시간이 좀
긴 것 같네요. 사용 사례를 보면
복잡한 문제 해결, 코드 작성, 긴 맥락 처리가 가능하고
맥락 길이는
어디 보자... 맥락 길이가 얼마죠?
오, 100만 토큰이네요
정말 좋습니다. 만약 이게 잘 작동한다면
완벽하겠네요
오픈 라우터에 있는지 확인해보죠
아주 최근에 출시된 거라
음...
오케이, 실험 버전으로 있네요
여기 있네요. 3월 25일 생성이요
오픈 라우터에서 사용 가능합니다
오픈 라우터를
사용하면 되겠네요
제미니 2.5를 선택하고
여기
있네요. 이미지도 지원하고
최대 출력 토큰이 65,000개네요
좋습니다. 항상 하던 대로 플랜에 넣고
이 프롬프트를 보내볼 건데요
말씀드렸듯이 Claude 3.7은
이 프롬프트로 멋진 웹사이트를 만들어냈죠
이번엔 어떨지 보겠습니다
모든 걸 일관되고 간단하게 유지하면서
플랜이 완성됐고
저는 항상 이후에 바로 실행하도록
설정합니다
이제 20분에서
25분 정도 기다리면 됩니다
리턴 에러를 제공...
아니 죄송합니다 그건 아닙니다
몇 가지 준비해야 할 것들이
있는데요, 제가 이 프로젝트를 설정하는 방식을
보여드리겠습니다.
프로젝트를 이렇게 설정하는데요
여기서 이것을 Google로 변경하겠습니다
이건 제가 이전에 했던
영상에서 가져온 건데요, Google
Rolls-Royce
웹사이트이고
이제 Deep seek을 여기서 열겠습니다
그리고 다음으로 해야 할 것은
public 폴더 안에
이 이미지들을 가져와야 합니다
폴더를 열어야 하는데요
이렇게 하는 이유는 클라이언트가
가끔 약간 혼란스러워하기
때문입니다
자, 여기 Google Rolls-Royce가
있네요, 완벽합니다
이제 public으로 가서
images라는 새 폴더를 만들고
이 이미지들을 드래그 앤 드롭으로
여기에 넣으면 됩니다. 이제 실행할 준비가 되었습니다
뭔가 막힌 것 같은데
resume task를 눌러서
시작할 수 있는지 확인해보겠습니다
자, 이제 전
편하게 앉아서 이걸 실행시켜 놓고
지켜보기만 하면 되는데요, 최대 요청을 1,000으로
설정했고, 비용은 0이라고 나와있지만
물론 OpenRouter를 사용하므로
약간의 비용이 발생합니다
이제 어떻게 되는지
지켜보겠습니다. 지금 보기에는
이게 Deep Seek보다
훨씬 더 나은 구현처럼 보이네요
이러한 오류만 해결할 수 있다면
아마도 OpenRouter 때문일 텐데요
솔직히 말씀드리면
이건 승자가 될 수 있을 것 같습니다
3.7보다 나은지는 모르겠지만
3.7에 근접하기만 해도
괜찮을 것 같습니다
제가 3.7에 대해 얘기했던 것처럼
불과 몇 시간 전에 올린
영상에서 말씀드렸는데요
솔직히 말씀드리면 여기 있습니다
LLM의 성능이 있고
LLM의 비용이 있고
LLM의 속도가 있습니다
그리고 당연히 시간을 아끼고 싶은
사람이라면 가장 중요한 것은 성능과 속도지만
비용을 아끼고 싶은 사람이라면
비용이 가장
중요한 요소가 됩니다
따라서 만약 Sonet 3.7에 근접한 성능을 보이고
있다면
비용을 절약하고 싶은 상황에서
Gemini 2.5의 비용이 매우 낮다면
이건 승자가 될 수 있죠
Sonic에 근접하기만 한다면 말이죠. 하지만 99%의 경우
3.7 Sonic을 사용하게 될 겁니다
하지만 아직 단정 짓지는 말고
이것을 지켜보면서 어떻게 되는지
살펴보고 3.7 Sonic에
근접한 결과물이 나오는지 확인해봐야죠
만약 그렇고 더 저렴하다면
확실히 사용할 가치가 있습니다. 하지만
3.7 Sonic만큼 좋거나 더 나아야 합니다
매번 누군가가 3.7 Sonic이
이겼다고 말할 때마다
실제로는 그렇지 않았거든요
한번 보죠. 아직 초기 단계라
새로운 모델에 대해 클라이언트가
문제를 겪고 있는데요
그 이유는 아마도
코드를 생성하는 방식이
실제로는
제대로 작동하지 않아서
규칙을 제대로 따르지
않는다는 게 기본적인 문제예요.
항상 잘 작동하지는 않는데요
하지만 저는 여전히 이게
새 모델의 성능을 테스트하기에 좋은 방법이라고 생각해요
이게 처리되는 동안
우리 한번 들어가볼까요
Gemini... 음 뭐였지
Gemini Google... 아니 Google AI Studio였나
이 모델이 코드 측면에서 얼마나 좋은지 한번 보고 싶어요
코드를 보면서
바로 알 수 있거든요
이게 좋은지 나쁜지
제가 코딩 전문가는 아니지만
대충 볼 줄은 알아요
그래서
자, 이걸 한번 보내볼게요
이건 제가 원하는 게 아닌데요
어쨌든 보내서
어떤 결과가 나오는지
기다리는 동안 확인해보죠
여기 플레이스홀더가 많이 보이네요
이건 뭐 새로운 모델에서는
일반적인 현상이에요
솔직히 말해서
이건 생각하는 모델인 것 같은데
항상 좋은 신호죠
좋아요, 이거 괜찮아 보이네요, 네
정적 페이지에는 ASR이 필요 없죠
맞아요
그렇죠
네, 네, 꽤 좋아 보이네요
이거 완벽해 보이는데요
Sonic 3.7만큼 좋아 보이네요. 이 계획이 마음에 들어요
정말 정말 좋은 계획이에요
만약 이걸 다
구현할 수 있다면
솔직히 말해서 나쁘지 않을 것 같아요
이거 좋아요, 정말 좋아 보이네요
이걸 Klein에 넣을 수 있다면
계속 실패하지만 않는다면
이건 잠재적으로
3.7과 비슷한 수준일 것 같아요
거짓말하지 않을게요
편향된 말도 하지 않을 거예요
뭔가가 3.7만큼 좋다면
보면 알 수 있거든요
이건 매우
아주 상세하게 작성되어 있어요
그게 마음에 들어요
유일한 문제는
이걸 Klein 안에 넣을 수 있느냐
그게 문제죠
이탈리아어 콘텐츠가 있고
죄송해요, 영어
콘텐츠와 이탈리아어 콘텐츠가 있네요
이건 좋아요, 자동화된
푸터의 저작권 표시, 마음에 들어요
음...
솔직히 다 꽤 괜찮아 보이네요
사실 Klein보다
더 좋아 보여요
컴포넌트 아이콘들이네요, 한번 볼까요
SVG를 가져와서
Tri schools 에디터에서 볼 수 있죠
별표, 체크표시, 달력
구글 맵스 아이콘도 있네요
이것도 꽤 좋아요
솔직히 말해서
꽤 인상적이에요. 이걸 제 로컬
컴퓨터에 어떻게 가져올 수 있을지
잘 모르겠네요
Klein 같은 걸 쓰지 않고는요
지금은 많이 힘들어하고 있어요
정말
힘들어하네요. 네, Klein이
이걸
완전히 작동하게 되면 이건 아마도
정말로
소닉 3.7만큼 좋을 수 있고
그리고 현재 체...
무료라는 게 정말 놀랍습니다
솔직히 말씀드리면, 저는 인상깊었습니다
이 코드의 깊이와 정확성, 그리고
완성도를 보면 모든 것이
잘 작동할 것 같습니다. 어떤
문제점도 보이지 않고, 실제로
소닉 3.7이 만든 것과 거의 동일합니다
제가 가장 보고 싶은 것 중 하나는
이 모든 것이 어떻게 함께
작동하는지인데, 솔직히 어떻게
이걸 할 수 있을지 모르겠네요
클라이언트가 계속 멈추기 때문에
제가 할 수 있는 것은 이 모든 것을 가져와서
직접 만들거나 명령어를 가져와서 만드는 것입니다
아니면 제가 뭔가를 할 수도 있죠
하나씩 넣을 수도 있지만
시간이 좀 걸릴 것 같네요
이 영상을 위해서라도
그렇게 할 것 같은데, 클라이언트가
계속 어려움을 겪을 것 같아서요
솔직히 말씀드리면, 그래서 이걸
끝내고 시네 없이 빌드를
시도해보려고 합니다
이 모델이 얼마나 좋은지 실제로 보기 위해서요
하지만 이것만 봐도
좋아 보이고 정확해 보이며
작동할 것 같습니다
음... 잘 동작할 것 같네요
아직 홈페이지는 없지만
괜찮습니다. 그리고 이것 봐요
솔직히 꽤 좋아 보입니다
거짓말하지 않겠습니다
저는 진실만을 말하려고 하고
이건 정말 좋아 보이네요. 자, 제가
이것을 여기에 복사 붙여넣기 하는 동안
제가 찾고 있는 것은 문제점들입니다
오류 같은 것들인데, 지금까지는 좋네요
솔직히 말씀드리면, 저는
매우 궁금합니다
자, 이것이 클라인에서 나온 결과입니다
다른 것은 잘 작동하지 않았는데
음... 네, 직접 입력해야 할 때는
좀 귀찮거든요
이건 나쁘지 않습니다. 이건
확실히 딥시크보다 낫고
디자인도 마음에 듭니다
물론 바꿔야 할 것들이
많습니다. 읽기 어려운
텍스트도 있지만
전반적으로 꽤 좋습니다
웨딩 페이지는 아직
디자인하지 않은 것 같지만
괜찮습니다. 그건 과정의 일부니까요
이탈리아어로 전환되는지 봅시다
됩니다. 음... 제 머릿속으로
이게 얼마나 좋은지
딥시크 같은 것과 비교해보면
확실히 딥시크보다 낫고
소닉 3.7과 비슷한 수준입니다
이건 확실히, 만약 제가
둘 중 하나를 고른다면
이건 비용이 얼마죠?
0.47입니다. 그러니까 같은 작업에
0.47, 이건 1센트보다도
적습니다
1페니보다도
적다는 거죠. 자, 이게 흥미로운 점인데
가격도 저렴하고
품질도 좋아 보입니다
소닉 3.7과 거의 비슷하거나
동등한 수준으로 보입니다
100만 컨텍스트 윈도우가 있어서
클로드의 한 가지 문제점은
프로젝트 끝이나 심지어
중간에도 이미 모든
컨텍스트 윈도우를 다 써버려서
마치 누군가와 작업하는 것 같은데
치매 환자와 일하는 것처럼
점점 잊어버리고
이상한 행동을 하기 시작해요
치매 환자 비유가 좀 그렇지만
치매 환자와 일하는 것처럼
꼭 기억해야 할 것들을
점점 잊어버리기 시작하고
반복적인 대화를 하게 되죠
아마 다들 경험해 보셨을 거예요
충분한 컨텍스트 윈도우는
100만 토큰이고, 속도도 꽤 빠른 것 같아요
Open Router에서는 좀 느리게 보이지만
일반적으로 Open Router가
그렇게 빠르지 않거든요
여기서는 이제 모든 플레이스홀더 코드를
채우고 웹사이트를 출시할 준비를 위해
모든 페이지를 완성하라고 할 거예요
필요한 모든 것이
이 영상의 설명란에 있어요
프롬프트도 포함해서요. 제가 보기에
이건 정말 흥미롭죠
확실히 ChatGPT보다
더 좋아요. 현재 ChatGPT의
최고 모델보다 더 뛰어나요
ChatGPT의 최고 모델이
현재
100만 출력 토큰당 75달러 또는
20달러 정도 하는데
이건 사실상 무료예요
완전히 무료는 아니지만
1센트도 안 되는 비용으로 전체 앱을 만들 수 있다는 게
정말 놀랍죠
여기서 영상을 마무리하겠습니다
DeepSeek보다 이걸 테스트하고 살펴보는 게
더 가치 있을 것 같아요
DeepSeek를 반대하는 건 아니에요
단지 한 번도 깊은 인상을
받지 못했을 뿐이에요
무료이고 오픈소스라는 건 알지만
거의 무료인 데다
오픈소스는 아니지만
Claude만큼 잘 작동하는 걸 만들 수 있다면요
지금 제 머릿속에서는
이렇게 저렴하니까
Claude를 대체할 수 있겠다
반드시 그렇진 않지만
제 생각으로는
Harbor 내에서 Claude 3.7을
Gemini 2.5로 대체할 수 있을 것 같아요
Harbor의 복잡한 프롬프트를
처리하기에 충분히 좋고
게다가 1만 배나 저렴하거든요
이런 것들이 제가
매일 고민하는 부분이에요
DeepSeek 3.1보다
확실히 더 가치가 있죠
영상 끝까지 시청해주신
여러분은 정말 대단하시고
곧 더 많은 콘텐츠로
찾아뵙도록 하겠습니다
안녕히 계세요