[00:00]
Punit이 X에서 공개한 Gemini 2.5 Pro로 만든
[00:02]
데모를 한번 살펴보겠습니다. 하지만 우리는
[00:06]
이것을 다른 방식으로 재현해볼 건데요,
[00:08]
제가 실제로 이 영상을 다운로드해서
[00:10]
Gemini 2.5 Flash에 업로드하고 재현하도록 했습니다.
[00:14]
자, 한번 보시죠. 트위터에서 직접
[00:16]
영상을 다운로드하고
[00:18]
Google AI Studio에 바로 업로드했는데,
[00:20]
이건 Gemini에서도 직접
[00:22]
할 수 있는 작업입니다.
[00:24]
그리고 이것은 단 1만 500개의
[00:26]
토큰만 사용했습니다. 100만 토큰 중에서요.
[00:29]
저는 단순히 이 영상에 있는 것을
[00:32]
코드로 재현해달라고 했어요. 3JS를 사용하고
[00:35]
모든 코드를 하나의 HTML 파일에 넣으라고 했죠.
[00:38]
3JS를 이렇게 로드하라고 했고,
[00:40]
왜 이렇게 했는지 곧 설명하겠습니다.
[00:42]
22초 동안 생각을 했고, 이것이
[00:45]
Gemini 2.5 Flash 모델의 가장
[00:47]
인상적인 부분입니다. 번개처럼 빠르고
[00:50]
시장의 다른 모델들에 비해 매우 저렴하죠.
[00:53]
그래서 설명과 함께
[00:55]
많은 양의 코드를 출력했습니다.
[00:58]
여기 결과물이 있네요. 완전히 똑같지는
[01:01]
않지만, 이건 단순히 영상만 보고
[01:04]
재현한 거라는 걸 기억하세요. 이렇게
[01:07]
회전도 할 수 있고, 축을 따라
[01:09]
이동도 할 수 있습니다.
[01:11]
다양한 방향으로 회전하고
[01:13]
색상도 변경할 수 있어요. 예쁜 핑크와
[01:15]
보라색이 있고, 파란색과 초록색도 있네요.
[01:19]
그리고 여기 무지개색도 있습니다.
[01:22]
정말 멋지죠. 확대해서 보면
[01:25]
이 3D 시각화를 구성하는
[01:28]
작은 사각형들을 모두 볼 수 있어요.
[01:31]
원본 데모처럼 클릭해서
[01:33]
모양을 바꿀 수 있고, 새로운
[01:35]
모양이 로드됩니다. 이번엔 큐브네요.
[01:37]
이전처럼 회전도 할 수 있습니다.
[01:39]
보라색, 파란색, 하늘색, 초록색, 노란색,
[01:41]
주황색, 그리고 바닥의 빨간색이 있네요.
[01:44]
다시 한번 클릭해볼까요?
[01:45]
어떤 모양이 나올지 봅시다. 자, 여기
[01:47]
피라미드가 나왔네요. 조금
[01:48]
축소해보면 모든 면이 보이죠.
[01:50]
이게 제일 마음에 드네요. 다시
[01:52]
모양을 바꿔볼까요? 도넛
[01:54]
모양이 나왔네요. 멋있죠. 모양을
[01:56]
한 번 더 바꿔보겠습니다. 접시나 평면
[01:59]
모양이 나왔네요. 아주 좋습니다. 다시
[02:02]
한번 바꿔볼까요? 오, 정말 멋지네요. 일종의
[02:04]
파형이 나왔어요. 그리고
[02:07]
배경에서 보면 겹치는 부분의
[02:09]
색상이 변하는 것을
[02:11]
볼 수 있죠. 정말 멋지고
[02:14]
아주 쉽게 만들었습니다. 프롬프트도 거의 안 썼어요.
[02:16]
자, 다시 처음으로 돌아가서,
[02:17]
왜 이 부분을 추가했는지 설명하겠습니다.
[02:19]
'3JS를 이렇게 로드하세요'라고 했고,
[02:22]
import map이 있는 스크립트를 사용했죠.
[02:24]
이렇게 한 이유는 지금까지
[02:26]
Gemini 2.5 Flash로 생성한 모든 코드가
[02:29]
3JS를 제대로 로드하는 데 실패했기 때문입니다.
[02:32]
이상한 방식을 사용해서 콘솔에
[02:35]
에러가 발생했고, 결국 이게
[02:37]
올바른 방법이라는 걸 알아냈죠.
[02:39]
근데 Gemini 2.5 Pro는 이런 문제가
[02:42]
없었어요. 이게 바로
[02:44]
두 모델의 주요한 차이점입니다.
[02:45]
Pro는 거대한 괴물같은 모델이에요. 더 느리고
[02:48]
더 비싸지만, 확실히
[02:50]
더 뛰어난 능력을 보여줍니다. 그래서 이제는
[02:52]
이 부분을 항상 추가하니 잘 작동하고
[02:54]
있어요. 이제 여러분께
[02:56]
Gemini 2.5 Pro와 Flash의 차이점을
[02:59]
보여드리도록 하겠습니다.
[03:01]
Flash는 훌륭하지만, Pro가 약간 더 우세합니다.
[03:04]
그리고 참고로,
[03:05]
최신 모델 벤치마크와 데모 등
[03:08]
더 많은 내용을 보고 싶으시다면
[03:10]
제 뉴스레터인
[03:12]
forwardfuture.ai를 구독하시길 추천드립니다.
[03:14]
우리는 훌륭한 오리지널 콘텐츠를 제공하고
[03:17]
여러분을 위해 뉴스도 정리해드립니다.
[03:19]
forward future.ai를 확인해보세요.
[03:21]
자, 이제 루빅스 큐브 시뮬레이션입니다.
[03:24]
이게 제가 가장 좋아하는 Gemini 2.5 Pro 테스트였죠.
[03:27]
단 한 번의 시도로, 제로샷으로
[03:30]
완벽한 시각화를 만들어냈습니다.
[03:33]
Alex가 지금 제가 설명하는 동안
[03:35]
화면에 보여줄 건데요,
[03:37]
이건 구글도 매우 인상 깊어했던 데모로,
[03:39]
최근 Google Cloud Next 행사에서
[03:41]
시연했고,
[03:43]
CEO도 이에 대해 언급했습니다.
[03:45]
자, 다시 한번 해보겠습니다.
[03:47]
동일한 프롬프트를 입력했더니,
[03:50]
꽤 괜찮아 보이네요.
[03:52]
왜 좀 어둡게 보이는진 모르겠지만,
[03:54]
다크 모드 브라우저 플러그인을
[03:56]
꺼놨는데도 말이죠. 하지만 회전도 되고
[04:00]
각 면의 색상도
[04:01]
대체로 정확합니다.
[04:04]
크기를 늘릴 수 있을까요? 네, 큐브 크기를
[04:08]
다양하게 조절할 수 있고, 평면으로 회전도 되고
[04:11]
다양한 각도로도 회전이 가능합니다.
[04:13]
10x10으로 늘려볼까요? 자, 됐네요.
[04:16]
여전히 잘 작동하고, 모든 면이 정확합니다.
[04:18]
하지만 섞기를 누르면
[04:20]
아무 일도 일어나지 않네요. 콘솔을 확인해보죠.
[04:22]
150회 섞기 진행 중. 섞기 완료.
[04:24]
기록된 움직임 0회라고 나오네요.
[04:27]
뭔가 작동해야 할 것 같은데
[04:29]
제대로 작동하지 않습니다.
[04:32]
오늘 보여드릴
[04:33]
몇 가지 데모에서는 약간의 반복을
[04:35]
시도했지만, 이건 그러지 않았고
[04:37]
제로샷으로 잘 작동하는지
[04:39]
보고 싶었습니다. 자, 다시
[04:41]
3x3 큐브로 돌아가보겠습니다.
[04:43]
회전을 시키면 회전은 되는데
[04:47]
색상이 좀 이상해지네요.
[04:50]
색상이 서로 뒤바뀌고 좀
[04:53]
어색해 보입니다.
[04:54]
반대로 돌려도 마찬가지고,
[04:57]
다른 축으로 회전해도 같은 현상이 발생합니다.
[04:59]
Gemini 2.5 Flash로 몇 번 더
[05:01]
프롬프트를 시도하면
[05:03]
잘 작동하게 만들 수 있을 것 같은데,
[05:05]
다른 데모들은 제로샷으로도
[05:07]
잘 작동했고,
[05:09]
그중 가장 인상적인 것은
[05:11]
전체 영상을 보고 영상 속의
[05:14]
세부적인 내용에 대해
[05:16]
질문하는 것이었습니다. 곧 보여드리죠.
[05:18]
풀기를 클릭해도 아무 일도 일어나지 않고,
[05:21]
12단계로 풀기, 큐브 완성이라고 뜨지만
[05:23]
에러가 발생합니다.
[05:25]
가장 중요한 건,
[05:26]
실제로 풀리는 걸 볼 수 없다는 거죠.
[05:29]
Gemini 2.5 Pro는 이 모든 걸
[05:31]
첫 시도에 해냈다는 걸 기억하세요.
[05:34]
오늘 영상의 스폰서인
[05:36]
Box를 꼭 테스트해보시길 바랍니다. Box AI는 정말 대단해요.
[05:40]
저희 팀 전체가 Box로 전환했는데
[05:42]
지금까지 아주 만족스럽습니다.
[05:44]
Box를 사용하면 모든 종류의
[05:46]
회사 문서를 저장하고
[05:48]
인공지능을 활용해 인사이트를 추출하고,
[05:51]
Q&A에 답변하고, 자동화와 지능형
[05:54]
워크플로우와 에이전트를 통해
[05:56]
Box AI의 API를 직접 활용하여 개발할 수도 있습니다.
[05:59]
최신 모델들을 모두 보유하고 있으며,
[06:01]
Box 내부에 특별 팀이 있어
[06:03]
새로운 모델이 출시되면 즉시
[06:05]
자체 벤치마크를 실행하고
[06:07]
그 결과를 공개적으로 공유합니다.
[06:08]
따라서 Box AI를 활용하여
[06:10]
개발하고 싶다면,
[06:12]
RAG 파이프라인 전체를 대신 처리해줍니다.
[06:13]
모든 문서를 지원하며,
[06:15]
11만 5천개의 기업이 신뢰하고 있습니다.
[06:18]
기업급 보안과 관리 기능을 갖추고 있으며,
[06:20]
Gemini 2.5 Flash와
[06:23]
최근 출시된 모든 모델과 호환됩니다.
[06:25]
꼭 확인해보시기 바랍니다.
[06:27]
훌륭한 파트너십을 맺고 있습니다.
[06:29]
아래에 모든 링크를 첨부해두었으니
[06:30]
확인해보시기 바랍니다.
[06:32]
Box에 다시 한 번 감사드립니다.
[06:34]
이제 다음 테스트로 넘어가보겠습니다.
[06:36]
다음은 바이러스 시뮬레이션입니다.
[06:39]
혈류 속에서 혈구를 공격하는 바이러스를 시뮬레이션합니다.
[06:41]
이전과 동일한 프롬프트를 사용했는데,
[06:43]
Gemini 2.5 Pro에서는
[06:45]
이런 결과가 나왔습니다.
[06:47]
매우 인상적이죠.
[06:49]
이제 Gemini 2.5 Flash의 결과를 보여드리겠습니다.
[06:52]
Flash는 훨씬 더 빠른 시간 내에
[06:53]
이 코드를 생성할 수 있었다는 점을 기억하세요.
[06:56]
여기 프롬프트가 있습니다.
[06:58]
'혈류 속에서 세포를 공격하는 바이러스의
[07:00]
인터랙티브 시뮬레이션을 만들어주세요.
[07:02]
모든 코드를 하나의 HTML 파일에 넣고
[07:04]
3JS를 사용해주세요.' 왜 이렇게 했을까요?
[07:07]
작업을 쉽게 하기 위해서입니다.
[07:09]
Gemini의 좋은 점은
[07:11]
이제 캔버스도 사용할 수 있다는 것입니다.
[07:13]
반드시 하나의 파일에 모든 것을
[07:15]
넣을 필요는 없지만, 이게 더 편하죠.
[07:18]
환경은 시각적으로
[07:19]
흐르는 혈액과 적혈구,
[07:21]
백혈구, 바이러스를 표현해야 합니다.
[07:23]
다음 기능들을 포함했습니다:
[07:25]
시뮬레이션 요소들. 적혈구는 바이러스가
[07:27]
공격하고 파괴하는 수동적 세포이고,
[07:29]
백혈구는... 자, 이렇게 설명되어 있습니다.
[07:31]
그리고 여러 슬라이더가 있습니다.
[07:33]
바이러스 설정, 바이러스 수,
[07:35]
바이러스 복제 속도,
[07:38]
바이러스 타입 선택기(공격적, 은밀함 등),
[07:40]
백혈구 설정,
[07:42]
백혈구 수,
[07:44]
공격력, 탐지 반경,
[07:46]
이동 속도, 환경 설정,
[07:48]
혈류 속도, 시뮬레이션 속도,
[07:50]
카메라 줌, 이동 감도가 있습니다.
[07:54]
바이러스는 무작위로 움직이거나
[07:56]
적혈구를 찾아다닙니다.
[07:58]
접촉하면 바이러스가 적혈구를 파괴하고
[08:00]
복제될 수 있습니다. 백혈구는
[08:03]
적극적으로 순찰하며,
[08:05]
기본적인 상태 표시기를 포함하고
[08:08]
카메라를 움직일 수 있습니다.
[08:10]
여기 처리 과정이 있습니다.
[08:12]
완전한 인터랙티브 3D 시뮬레이션을 만드는
[08:14]
과정입니다. 여기 모든 생각이 있죠.
[08:16]
실제로 코드를 출력하기 전에
[08:17]
생각하는 과정이 꽤 가벼웠습니다.
[08:19]
그리고 여기 코드가 있습니다.
[08:22]
상당한 양의 코드가 생성되었죠.
[08:25]
한 가지 오류가 있었는데,
[08:27]
콘솔에서 바로 복사한
[08:29]
오류는 다음과 같습니다:
[08:30]
'Uncaught reference 3 is not defined'
[08:33]
제가 앞서 언급했던 문제인데요.
[08:35]
어떤 이유에서인지 3JS를 로컬에서
[08:38]
불러오지 못했습니다. 하지만 캔버스에서는 작동했어요.
[08:41]
그래서 이건 제 로컬 머신에서
[08:43]
Gemini 2.5 Flash와 함께 작동하는 방식과
[08:45]
3JS를 로드하는 방식의 호환성 문제였던 것 같습니다.
[08:48]
그래서 저는 여전히 한 번의 시도로
[08:51]
통과시키려고 합니다.
[08:52]
왜냐하면 캔버스에서는 잘 작동했거든요.
[08:54]
자, 캔버스에서는 이렇게 보입니다.
[08:56]
여기 혈류가 보이죠.
[08:59]
여러 축을 따라 움직일 수 있고
[09:01]
이렇게 회전도 가능합니다.
[09:04]
적혈구, 백혈구,
[09:06]
바이러스가 있습니다. 여기 바이러스의
[09:09]
수를 조절할 수 있는데
[09:11]
이걸 늘리면, 초록색 점으로 표시된
[09:13]
바이러스의 수가 크게 증가하는 걸
[09:16]
볼 수 있습니다.
[09:17]
실제로 혈류 내부를 확대해서 볼 수도 있는데
[09:20]
이게 정말 멋진 것 같아요.
[09:22]
복제율도 있어서,
[09:23]
바이러스가 공격한 후에
[09:25]
바이러스를 복제할 수 있습니다.
[09:28]
바이러스 유형은 공격적, 은밀형,
[09:30]
아직 구현되지 않은 것과
[09:32]
빠른 복제형이 있는데, 이것도
[09:33]
아직 구현되지 않았네요.
[09:35]
그리고 백혈구의 수도 있는데
[09:37]
기억하세요, 백혈구는
[09:39]
방어를 담당합니다. 공격력,
[09:41]
감지 반경, 그리고 이동
[09:44]
속도도 조절할 수 있죠.
[09:45]
환경 설정도 있습니다. 시뮬레이션
[09:48]
속도를 높여볼까요? 혈류의
[09:50]
속도도 증가시킬 수 있습니다.
[09:52]
이렇게 모든 걸 볼 수 있죠.
[09:55]
꽤 괜찮은 결과라고 생각합니다. 매우 인상적이에요.
[09:58]
정말로 한 번에 성공했습니다.
[10:01]
X에서 발견한 또 다른 데모가 있습니다.
[10:05]
이건 Keepy가 만든 건데요.
[10:07]
절차적 애니메이션을 사용한 오리 정렬기입니다.
[10:09]
여러분은 이 하얀색 정렬기 캐릭터가 되어
[10:12]
돌아다니면서, 서로 다른 색상의
[10:14]
세 그룹의 오리들을 만나게 되는데
[10:17]
여러분의 임무는 이 오리들을
[10:19]
색상별로 모으는 겁니다.
[10:22]
저는 그냥 비디오를 다운로드하고
[10:25]
Gemini 2.5 Flash에 업로드했는데,
[10:28]
어떻게 됐는지 보여드리죠.
[10:29]
자, 여기 있습니다.
[10:30]
이상하게도 토큰을 하나만 사용했다고 하는데,
[10:32]
비디오를 업로드하고
[10:34]
'이 오리 정렬 게임을 만들어주세요.
[10:35]
파이썬 단일 파일로, 절차적
[10:37]
애니메이션을 사용해서요'라고 했습니다.
[10:40]
Flash라서 매우 빠르기 때문에
[10:42]
21초밖에 걸리지 않았어요.
[10:44]
생각 과정을 살펴볼까요?
[10:45]
핵심 요청을 이해했습니다.
[10:47]
사용자가 오리 정렬 게임을 복제하길 원합니다.
[10:50]
게임 요소를 파악했죠. 어두운 회색 배경,
[10:52]
타이틀 화면, 게임 화면, 종료 화면, 상호작용 등
[10:54]
기타 등등이요. 물리와 움직임도 파악했습니다.
[10:57]
정렬기는 커서를 향해 이동해야 하고
[10:59]
색깔 있는 오리들은 기본 움직임,
[11:01]
정렬기와의 충돌, 오리끼리의 충돌,
[11:02]
경계면 충돌 등을 가져야 합니다.
[11:05]
비디오를 보는 것만으로 모든 요소를
[11:07]
파악했다는 게 정말 대단하죠.
[11:10]
이런 걸 할 수 있는 다른 AI 모델은
[11:12]
본 적이 없어요. 정말 인상적입니다.
[11:14]
그리고 나서 코드를 받았습니다. 여기
[11:17]
모든 코드가 있는데요.
[11:20]
설정 때문에 여러 번 왔다 갔다 했는데
[11:23]
설정이 잘못되어 있었어요.
[11:25]
Gemini 2.5 Flash와 여러 번 시도할 필요는 없었죠.
[11:27]
단순히 설정만 조정하면 됐는데,
[11:29]
물론 저는 최대한 완벽하게
[11:31]
만들고 싶었거든요.
[11:33]
이제 어떻게 보이는지 보여드릴게요.
[11:35]
거의 똑같아 보이죠. 이제 클릭해보겠습니다.
[11:38]
자, 이제 분류를 시작해볼게요.
[11:41]
파란색 오리들을 다른 파란색 오리들과
[11:44]
모으려고 하는 중이에요. 캐릭터나
[11:47]
스프라이트는 그렇게 좋아 보이진 않지만,
[11:49]
괜찮아요. 노란색 것들을
[11:51]
모아볼까요? 네, 제가 이 게임을
[11:52]
잘하진 못하네요. 좋아요,
[11:54]
저 노란 녀석을 저기로 보내고... 제가 좋아하는 건
[11:57]
화면을 벗어났다가
[11:58]
다시 튀어 들어오는 거예요.
[12:00]
물리 효과가 잘 적용되어 있죠.
[12:02]
이건 모두 데모 영상에서 가져온 거예요.
[12:04]
자, 저 노란 녀석을 저기로 보내고
[12:06]
분홍색 녀석들을 저쪽으로 보낸 다음
[12:10]
청록색을 모아볼게요. 다른 그룹을
[12:13]
흐트러뜨리지 않고 할 수 있을지 봐요. 아,
[12:16]
여러분께는 보기 힘드실 것 같네요.
[12:17]
죄송해요. 자, 됐어요.
[12:20]
지금은 승리 조건이 작동하지 않는데,
[12:22]
이전 버전에서는 잘 작동했었어요.
[12:24]
하지만 망가졌네요. 승리 조건은
[12:27]
'성공했습니다'라고 표시되는 거예요.
[12:28]
그래서 전 이게 꽤 괜찮다고 생각해요.
[12:30]
영상만 보고
[12:32]
재현한 것 치고는요. 다음으로, 프로듀서 Alex가
[12:35]
만든 이 타워 디펜스
[12:37]
게임인데, 놀랍게도 아주 잘 작동했어요.
[12:40]
프롬프트가 어땠는지 보여드릴게요.
[12:42]
HTML5 캔버스 기반 타워 디펜스를 만드는데,
[12:45]
풍선 적들이 웨이브로 나타나고(체력 1-10),
[12:47]
녹색에서 보라색까지
[12:50]
색상으로 구분되며 구불구불한
[12:52]
경로를 따라가요. 그리고 기억하세요, 그는
[12:54]
이 모든 걸 수동으로 작성하지 않았어요.
[12:56]
기본 아이디어를 가지고 LLM을
[12:59]
사용해서 프롬프트를 작성했죠.
[13:01]
저는 항상 이렇게 하는 걸 추천해요.
[13:03]
구불구불한 경로를 따라 가고,
[13:04]
계획 모드에서는 다트, 캐년,
[13:06]
얼음, 스나이퍼, 레이저 등 5가지 타워를 배치하는데,
[13:09]
각각 고유한 색상의 점으로 표시되고
[13:12]
마우스를 올리면 사거리가 표시돼요.
[13:14]
지금 빠진 것은 시각적 요소인데,
[13:16]
곧 보시겠지만, 그건 쉽게 추가할 수 있어요.
[13:18]
다음 단계예요. 라운드 시작을 누르면 시작되고,
[13:20]
다트 타워는 빠른 속도로 단일 목표를
[13:23]
연속 공격해요. 캐논 타워는 느린 광역 데미지,
[13:25]
얼음 타워는 적을 감속시키고, 스나이퍼 타워는
[13:28]
높은 데미지와 긴 사거리를 가졌어요. 레이저 타워는
[13:30]
청록색 레이저 선으로 연속 공격을 하죠.
[13:33]
적들의 체력이 숫자로 표시되고
[13:35]
기타 등등이 있어요. 생각보다
[13:38]
짧은 시간이 걸렸는데,
[13:39]
그건 언급되지 않았네요.
[13:42]
여기 코드가 있어요.
[13:43]
어떻게 생겼는지 보여드릴게요.
[13:45]
얼음을 여기와 여기에 배치해볼게요.
[13:48]
처음부터 속도를 늦춰야 해요.
[13:49]
좋아요, 100이 남았네요. 아마도
[13:52]
너무 많이 배치한 것 같아요.
[13:54]
다트를 여기와 저기에 배치해볼게요.
[13:59]
자, 시작해볼까요? 풍선들이
[14:02]
다가오고 있어요. 보시다시피
[14:04]
속도가 늦춰지고 있고, 다트가 그들을 제거했어요.
[14:06]
웨이브 1 완료. 웨이브 2를 준비하세요.
[14:09]
돈도 더 벌었네요. 좋아요.
[14:12]
여기에 다트를 하나 더 놓고,
[14:15]
다시 시작해보죠. 이제
[14:17]
체력이 증가했습니다. 위에
[14:19]
3과 4가 보이시죠. 보시다시피
[14:20]
잘 작동하고 있습니다.
[14:21]
물론 더 많은 시각적 요소와
[14:23]
게임의 복잡성을 추가하며
[14:25]
계속 개선할 수 있지만, 이 정도면
[14:27]
Gemini 2.5 Flash에서 정말 훌륭한 결과입니다.
[14:29]
자, 다음은 매우 복잡한 스네이크
[14:32]
게임입니다. Pygame을 사용해서
[14:34]
클래식 스네이크 게임을 만들건데,
[14:36]
독특하고 시각적으로 화려하며
[14:38]
복잡한 기능들을 추가해서
[14:39]
놀라운 게임을 만들어보죠. 먼저
[14:41]
Gemini 2.5 Pro가 만든 결과물을
[14:44]
보여드리겠습니다. 정말 시각적으로
[14:46]
화려했거든요. 한번 보시죠.
[14:48]
여러 종류의 먹이가 있고,
[14:50]
AI와 사람이 조종하는 두 마리의 뱀이
[14:52]
경주를 합니다. 카메라가 움직이고,
[14:54]
정말 인상적입니다. 이제 나머지
[14:57]
프롬프트를 보시죠. 역동적인 시각
[14:59]
효과가 있습니다. 뱀은 빛나는
[15:00]
흔적을 남기고, 배경은
[15:02]
미묘한 색상 그라데이션으로 맥동하며
[15:04]
먹이를 먹으면 파티클 폭발
[15:06]
효과가 발생합니다. 여러
[15:07]
종류의 먹이가 있어요. 속도
[15:09]
부스트, 컨트롤 반전, 이중 시야,
[15:11]
시간 감속 등이 있습니다.
[15:13]
여기까지만 하겠습니다. 설명과
[15:15]
세부사항이 많이 있는데, Gemini 2.5 Flash는
[15:18]
꽤 좋은 결과물을 만들었지만
[15:20]
Gemini 2.5 Pro만큼은 아니었습니다.
[15:22]
한번 보여드리죠. 자, 여기 있습니다.
[15:24]
제가 초록색이고 AI는 빨간색입니다. 보시다시피
[15:28]
속도 부스트가 있고... 충돌했네요. 게임
[15:30]
오버입니다. 다시 보여드리죠.
[15:32]
여러 종류의 먹이가 있습니다. 잘
[15:35]
작동하고 있죠. AI 뱀이 저와 충돌했습니다.
[15:38]
그래서 졌네요. 보시다시피
[15:40]
자, 이번엔 제가 졌네요. 미묘한
[15:42]
파티클 효과와 다양한 종류의
[15:44]
먹이가 있지만, 확실히
[15:46]
Gemini 2.5 Pro만큼 시각적으로 화려하지는
[15:49]
않습니다. 하지만 677줄의 코드로
[15:52]
이걸 완성했죠. 이게 아마도
[15:54]
Gemini 2.5 제품군, Pro와 Flash
[15:56]
모두와 다른 모든 모델들 사이의
[15:58]
가장 큰 차이점일 것입니다.
[16:00]
Gemini 2.5에 코드를 요청하면
[16:04]
긴 코드를 생성합니다. 수백 줄,
[16:07]
때로는 천 줄이 넘는 코드를
[16:09]
만들어냅니다. 제가 사용해본 다른
[16:12]
모델들은 몇백 줄 이상의
[16:14]
코드를 생성하지 못했습니다.
[16:16]
그리고 당연히
[16:18]
코드 줄 수의 제한으로 인해
[16:19]
만들 수 있는 복잡성도 제한됩니다.
[16:22]
하지만 다시 한 번 말씀드리지만,
[16:24]
Flash는 훨씬 저렴한 가격에
[16:28]
더 빠른 속도를 제공합니다. 그래서
[16:31]
상황에 맞는 도구를
[16:33]
사용하면 됩니다. 자, 다음입니다.
[16:36]
Alex가 만든 또 다른 예제입니다.
[16:37]
Alex, 도움 주셔서 감사합니다.
[16:39]
그는 두 AI가 경쟁하는 나란히 배치된 테트리스를
[16:42]
만들었습니다. Python과 Pygame으로
[16:44]
두 AI 플레이어가 서로 경쟁하는
[16:46]
테트리스 시뮬레이션을 만들어
[16:48]
클래식 테트리스 룰을 사용합니다.
[16:50]
한 플레이어가 꼭대기에 도달하면 게임이 끝나고
[16:52]
각 AI는 상대방에게 방해 라인을 보냅니다.
[16:56]
그래서 다른 플레이어에게 가비지 라인을
[16:58]
보내는 방식인데, 기본적으로
[17:00]
클리어해야 하는 블록 라인들입니다.
[17:02]
핵심 기능은 클래식 테트리스 규칙입니다.
[17:05]
표준 테트리미노 회전 시스템, 10x20 그리드,
[17:09]
홀드 기능 없음, T-스핀 없음, 콤보 없음,
[17:12]
각 플레이어당 현재 블록과
[17:14]
다음 블록 미리보기 1개만 표시됩니다.
[17:16]
가비지 시스템에서는 1,2,3,4줄 클리어 시
[17:20]
각각 0,1,2,4개의 가비지 라인이
[17:23]
상대방에게 전송됩니다.
[17:25]
가비지 라인에는 랜덤하게
[17:27]
구멍이 하나씩 있으며
[17:29]
짧은 경고 애니메이션과 함께
[17:31]
상대방 보드 아래에서 추가됩니다.
[17:34]
2.5 Pro 테스트 영상에서는
[17:36]
이 테트리스 테스트를 하지 않았는데,
[17:38]
지금 백그라운드에서 2.5 Pro로
[17:40]
실행해보고 있습니다.
[17:43]
AI 로직이 개선되어 스마트한 배치
[17:46]
휴리스틱을 사용합니다.
[17:47]
구멍 수를 최소화하고,
[17:49]
가장 높은 열의 높이를 최소화하며,
[17:52]
라인 클리어를 최대화하는 등의 전략을 씁니다.
[17:56]
이렇게 게임을 만들었는데, Alex는
[17:59]
Gemini 2.5 Flash와 여러 번
[18:02]
수정을 거쳐야 했습니다.
[18:04]
보시다시피 많은 피드백과
[18:06]
세부적인 개선이 있었죠.
[18:08]
최종 결과물을 보여드리겠습니다.
[18:10]
자, 두 AI 플레이어가 있고 다음 블록도 보이네요.
[18:13]
방금 가비지가 생겼는데,
[18:15]
저기 회색 블록들이 바로 그겁니다.
[18:17]
지금 19대 15 상황이고
[18:19]
양쪽 다 가비지가 있네요.
[18:22]
이건 시간이 좀 걸릴 것 같습니다.
[18:24]
AI가 꽤 잘하거든요.
[18:25]
자, 한 플레이어는 가비지가 더 많지만
[18:28]
다른 플레이어는 점수가 더 높네요.
[18:30]
어떻게 될지 보겠습니다.
[18:32]
플레이어 1이 위험해 보이는데
[18:34]
패배가 임박한 것 같네요.
[18:36]
아니네요. 결국 게임이 끝났고
[18:39]
플레이어 1이 꼭대기에 도달해서
[18:41]
플레이어 2 AI가 승리했습니다.
[18:44]
꽤 좋은 결과네요.
[18:46]
이제 2.5 Pro 버전을 보여드리겠습니다.
[18:49]
이건 첫 시도입니다. 아직 테스트도 안 해봤어요.
[18:52]
어떻게 될지 보죠. 꽤 비슷해 보이는데,
[18:55]
Gemini 2.5 Flash와 동일한
[18:58]
문제가 있네요. 화면이 잘려있습니다.
[19:00]
이전과 정확히 같은 문제예요.
[19:03]
거의 똑같아 보입니다.
[19:05]
작동도 동일하고, 다만 움직임이
[19:08]
조금 더 느린 것 같지만
[19:10]
전반적으로 거의
[19:12]
동일한 결과가 나왔네요.
[19:14]
꽤나 인상적입니다.
[19:16]
다음으로, X의 Romesh가 만든
[19:20]
갈톤 보드를 보겠습니다. 이건
[19:22]
확률 분포를 보여주는데
[19:24]
파칭코와 비슷해 보이네요. 공들을
[19:27]
위에서 떨어뜨리면
[19:29]
아래로 떨어지면서
[19:30]
결국 확률 분포를 나타내는
[19:32]
종 모양 곡선이 만들어집니다.
[19:34]
그는 Gemini 2.5 Flash가 갈톤 보드 테스트에서
[19:38]
압도적인 성능을 보였다고 했습니다.
[19:41]
GPT-4나 Claude 3은 이걸 만들지 못했는데,
[19:43]
그가 제공한 프롬프트를
[19:45]
사용했고, 감사하게도
[19:47]
영상도 다운받아서 업로드했습니다.
[19:50]
정보를 구축하기 위한 두 번째 소스로
[19:52]
우선 프롬프트를 가져왔습니다.
[19:55]
자체 포함된 HTML 파일을 만들어
[19:57]
가톤 보드 시뮬레이션을 위해 클라이언트 사이드 자바스크립트와
[19:59]
CDN을 통해 포함된 Matter.js와 같은 2D 물리 엔진을 사용했습니다.
[20:02]
이 시뮬레이션은 HTML5 캔버스에 렌더링되며
[20:05]
다음 기준을 충족해야 합니다.
[20:07]
단일 파일, 캔버스 크기,
[20:09]
물리 효과 등의 조건들이 있습니다.
[20:12]
기본적으로 가톤 보드가
[20:15]
어떻게 보여야 하는지,
[20:16]
공이 어떻게 움직여야 하는지,
[20:18]
페그가 어떻게 보여야 하는지 등을 정의합니다.
[20:20]
16초 동안 생각한 후에 결과물이 나왔습니다.
[20:23]
첫 번째 시도에서는
[20:25]
바닥의 컵들, 즉 공이 떨어지는
[20:27]
작은 공간들이 누락되었습니다.
[20:29]
그래서 그의 데모 영상을 업로드하고
[20:32]
"바닥 컵 부분이 없다.
[20:33]
이 영상을 검토하고
[20:35]
똑같이 보이게 만들어달라"고 했습니다.
[20:37]
참고로, 이 영상들에 대해
[20:38]
계속 한 토큰이라고 말하는데
[20:40]
확실히 한 토큰은 아닙니다만, 좋습니다.
[20:43]
22초 더 생각하고 앞뒤로 검토했는데
[20:45]
제가 고민하고 반복적으로 수정한 것은
[20:47]
바닥에 있는 작은 컵들의 너비였습니다.
[20:50]
그리고 참고로, 방금
[20:52]
작은 문제가 발생해서 수정을 요청했는데
[20:54]
출력 속도가 얼마나 빠른지 보세요.
[20:56]
이게 바로 Flash의 특징입니다.
[20:59]
정말 빠르고, 모든 코드를
[21:02]
다시 렌더링하고 있습니다. 다시 시도해보죠.
[21:04]
공들이 떨어지고 있네요. 완벽합니다.
[21:06]
이제 사라지지 않습니다.
[21:08]
전에는 공들이 착륙하고
[21:09]
사라졌었는데, 간단한 설명 몇 마디로
[21:12]
수정되었습니다. 자, 이제 보시죠.
[21:15]
벨 커브가 형성되기 시작하는 것을
[21:17]
볼 수 있습니다. 완전히 랜덤이라
[21:19]
완벽한 벨 커브가 아닐 수도 있지만
[21:21]
어떻게 될지 보겠습니다. 그리고
[21:23]
왼쪽에 시뮬레이션 컨트롤을 추가했습니다.
[21:26]
최대 공의 개수를 100개에서 2,000개까지
[21:29]
설정할 수 있고, 떨어지는 간격을
[21:32]
밀리초 단위로 조절할 수 있습니다.
[21:34]
중력이 있어서 공에 적용되는
[21:36]
중력을 조절할 수 있고, 공의 반지름도
[21:38]
조절 가능해서 더 크게 만들 수 있습니다.
[21:40]
물론 약간 걸리는 부분이 있지만
[21:42]
그래도 괜찮습니다.
[21:44]
가장 큰 크기로 설정하면
[21:46]
여전히 떨어지긴 하지만
[21:47]
좀 더 천천히 떨어지고
[21:48]
아주 작게 만들면 더 빨리 떨어집니다.
[21:51]
페그 반지름도 조절할 수 있어서 더 크게 만들 수 있고
[21:54]
페그 반지름을 최대로 하고
[21:56]
공의 반지름도 최대로 하면
[21:58]
당연히 어디로도 움직이지 못합니다.
[21:59]
그래서 공과 페그의 반지름을
[22:01]
가능한 한 작게 만들면
[22:03]
훨씬 더 빨리
[22:04]
떨어지게 됩니다. 그리고
[22:06]
페그의 수평 간격도 있어서
[22:09]
이렇게 조절할 수 있고,
[22:11]
페그의 수직, 수평 간격도 있습니다.
[22:15]
통의 개수도 있는데,
[22:16]
이건 좀 불편한 게 개수가 많아지면
[22:18]
갑자기 공간이 부족해져서
[22:20]
제가 원하는 대로 작동하지 않습니다.
[22:23]
통 위의 간격도 조절할 수 있어서
[22:25]
보시다시피 조정하면
[22:28]
보시다시피 페그 중 일부가 사라지고,
[22:30]
공의 탄성이 있고,
[22:32]
공의 마찰력이 있으며,
[22:34]
공기 마찰도 있습니다. 제 생각에는
[22:36]
꽤 멋진 것 같네요. 이것이 골턴 보드
[22:39]
시뮬레이션입니다. 여기서 떨어지는
[22:40]
공의 개수를 볼 수 있고,
[22:43]
공이 떨어지는 간격을 줄이면
[22:45]
더 빠르게 떨어지게 됩니다.
[22:46]
이것으로 성공이라고 할 수 있겠네요.
[22:48]
다음으로, Alex가 아이폰 드로잉 앱을 만들었습니다.
[22:51]
아이폰용으로 만든 것은 아니고,
[22:52]
실제로는 파이썬으로 만들어졌습니다.
[22:54]
그래서 직접적인 지시사항은
[22:56]
따르지 않았지만, 보여드리겠습니다.
[22:57]
그리기가 가능한 아이폰 앱
[22:59]
시뮬레이션을 만드는 것이 핵심이었죠.
[23:01]
아이폰 앱의 시뮬레이션이라는 게 중요합니다.
[23:04]
아이폰 앱을 만드는 게 아니라
[23:06]
시뮬레이션을 만드는 거죠.
[23:08]
다양한 펜, 연필, 브러시의
[23:09]
크기, 강도, 색상 등을 위한
[23:11]
슬라이더와 선택기가 있고,
[23:13]
사각형 도구, 지우개, 채우기 도구 등
[23:16]
여러 도구들도 있습니다.
[23:18]
구상 과정을 거친 다음
[23:20]
파이썬 코드가 있습니다. 펜이 있고,
[23:23]
설정을 클릭하면 색상을 변경할 수 있습니다.
[23:25]
초록색으로 바꿀 수 있고, 설정 버튼이
[23:28]
약간 어색해 보이긴 하지만,
[23:29]
펜의 크기도 바로 여기서 변경할 수 있습니다.
[23:33]
지우개도 있고, 이것은
[23:35]
윈도우에 기본으로 있는 그림판과 비슷해 보입니다.
[23:37]
사각형 도구가 있고,
[23:39]
채우기 도구도 있습니다. 초기화도 가능하고,
[23:41]
사각형 외곽선 모드도 있습니다.
[23:43]
크기도 이렇게 줄일 수 있고,
[23:46]
저장도 할 수 있습니다.
[23:48]
파일은 PNG 형식으로 저장됩니다.
[23:51]
이것은 정말 멋진 것 같습니다.
[23:53]
특히 만드는 데 아주 적은
[23:55]
노력만 들었다는 점이 인상적입니다.
[23:58]
마지막으로, 가장 멋진 것인데,
[24:01]
16분 길이의 뽀빠이 영상을 다운로드했습니다.
[24:03]
옛날 만화 뽀빠이를 아신다면,
[24:04]
매우 구체적인 질문들을 해보았습니다.
[24:07]
먼저 영상이 어떤 것인지
[24:09]
보여드리겠습니다. 여기 뽀빠이가 있습니다.
[24:11]
아주 옛날 만화입니다. 영상을 살펴보면
[24:14]
뽀빠이의 악당이 나옵니다.
[24:16]
이름은 잘 모르겠네요.
[24:18]
죄송합니다. 뽀빠이를 안 봤거든요.
[24:19]
제 시대보다 좀 이전이에요.
[24:21]
꽤 상세한 만화입니다. 16분이나 되는
[24:24]
긴 영상입니다. 이것을
[24:26]
Gemini 2.5 Flash에 직접 업로드했습니다.
[24:30]
16분짜리 영상에 283,000 토큰이 사용되었고,
[24:33]
100만 토큰을 받았으니,
[24:35]
거의 1시간 분량의 영상을
[24:37]
Gemini 2.5에 넣을 수 있다고 볼 수 있죠.
[24:41]
첫 번째로 물어본 것은
[24:42]
8분 즈음에 뽀빠이가
[24:44]
사자들과 싸우는 장면이 있는데, 사자가 몇 마리냐는 것입니다.
[24:46]
직접 영상을 읽어보면,
[24:48]
8분 부근에 사자가 두 마리 있습니다.
[24:50]
꽤 간단하죠. 하지만 생각해보세요.
[24:53]
1년 전만 해도, 아니 1년 반 전만 해도
[24:55]
16분이나 되는 영상, 심지어
[24:57]
30분, 45분짜리 영상에 대해
[24:59]
아무 질문이나 할 수 있다는 게 상상이나 됐을까요?
[25:02]
있을 수 없는 일이었죠. 하지만 이제는 가능합니다.
[25:04]
22초 동안 생각한 후, 8분 17초 즈음에
[25:07]
뽀빠이가 신밧드의 섬에 있는
[25:10]
동굴 입구에서 사자 두 마리와
[25:12]
싸운다고 답했습니다. 제가 물어본 것보다
[25:14]
더 많은 정보를 주었지만,
[25:15]
괜찮습니다. 다음으로, 영상 첫 부분에
[25:17]
뱀 두 마리가 감긴 표지판이 있는데
[25:19]
뭐라고 쓰여 있냐고 물었습니다.
[25:21]
34초 동안 생각한 후, 43초 부근에
[25:23]
'신밧드의 섬 조심하시오'라고 되어 있고
[25:26]
해골과 뼈가 그려져 있다고 했습니다.
[25:27]
신밧드... 확인해보죠.
[25:29]
'신밧드의 섬 조심하시오'가 있고,
[25:32]
뱀 두 마리가 감겨있고, 해골과 뼈가 있네요.
[25:34]
정확히 맞췄습니다. 더 어려운 걸 해볼까요?
[25:35]
10분 즈음에 배경에
[25:37]
통이 하나 있는데,
[25:39]
통에 뭐라고 쓰여 있냐고 물었습니다. 12초 동안
[25:41]
생각했습니다. 10분 부근으로 가보면,
[25:43]
여기 통이 있네요. XXX가 있고
[25:45]
'벅샷'이라고 쓰여 있지만, 대부분은
[25:48]
잘려있습니다. 실제로 '벅샷'이라고
[25:50]
쓰여 있긴 한데,
[25:53]
전체 텍스트를 보려면
[25:54]
영상을 자세히 살펴봐야 했을 텐데요.
[25:57]
물론 XX 벅샷이라고 정확히 맞췄습니다.
[26:00]
Gemini 2.5 Flash는 정말 놀랍습니다.
[26:03]
Gemini 2.5 Pro만큼은 아니지만 거의 비슷한 수준이고,
[26:07]
엄청나게 빠르고 훨씬 저렴합니다.
[26:11]
게다가 이런 최첨단 모델들은
[26:13]
대부분의 사용 사례에서는
[26:15]
필요하지 않습니다. 따라서
[26:17]
2.5 Pro와 거의 비슷한 성능을 내면서
[26:19]
훨씬 저렴한 비용으로
[26:21]
더 빠른 속도를 제공하는 모델이 있다는 것은
[26:24]
구글이 얼마나 잘 실행하고 있는지를
[26:26]
모든 것을 말해줍니다.
[26:28]
이 영상이 마음에 드셨다면
[26:31]
좋아요와 구독 부탁드립니다.
[26:32]
감사합니다.