Gemini 2.5 Flash의 엄청난 잠재력… (구글이 계속 승리)

채널 아이콘
Matthew Berman 구독자 419,000명

요약

이 영상에서는 구글의 Gemini 2.5 Flash 모델이 짧은 프롬프트와 비디오 입력만으로 다양한 인터랙티브 데모를 코드로 재현하는 과정을 보여줍니다. Flash는 불과 몇만 토큰만 사용해 3D 시각화, 바이러스·루빅스 큐브 시뮬레이션, 실시간 비디오 분석까지 초고속으로 처리하며, Pro 모델 못지않은 성능을 저렴한 비용에 제공합니다. 여러 예제를 통해 Flash와 Pro 모델의 차이점을 비교하고, Box AI 같은 협업 도구를 활용한 워크플로우 최적화 방안도 제시합니다. 이를 통해 구글이 AI 개발과 실행 면에서 여전히 선두를 유지하고 있음을 강조합니다.

주요 키워드

Gemini 2.5 Flash Gemini 2.5 Pro tokens zero-shot Three.js Canvas import map RAG 파이프라인 Matter.js Box AI

하이라이트

  • 🔑 Gemini 2.5 Flash는 단 10.5천 토큰만으로 복잡한 3D 시각화 코드를 재현했습니다.
  • ⚡️ Flash 모델은 불과 22초 만에 코드를 생성할 정도로 초고속 응답합니다.
  • 🌟 Gemini 2.5 Pro는 더 정교하지만, Flash는 비용 대비 성능이 뛰어납니다.
  • 📌 Box AI를 활용하면 기업 문서 저장·분석·자동화 워크플로우 구축이 간편해집니다.
  • 🚀 Flash를 이용해 루빅스 큐브, 바이러스 시뮬레이션, 덕 소터 게임 등을 한 번의 프롬프트로 자동 생성할 수 있습니다.
  • 🔍 16분짜리 영상에서 장면 속 캐릭터·텍스트를 정확히 식별해 질문에 답변했습니다.

용어 설명

Token

AI 모델이 텍스트를 처리하는 최소 단위

Zero-shot

사전 학습 없이 한 번의 시도로 새로운 작업을 수행하는 방식

Three.js (3JS)

웹에서 3D 그래픽을 구현하는 자바스크립트 라이브러리

Canvas

HTML5 그래픽 렌더링을 위한 캔버스 요소

Import map

모듈 경로를 정의해 스크립트를 로컬 또는 CDN에서 불러오는 방식

RAG 파이프라인

문서를 활용해 AI 모델에 질의응답 및 요약 기능을 제공하는 구조

Matter.js

브라우저 환경에서 물리 시뮬레이션을 위한 자바스크립트 엔진

Box AI

문서 저장·분석·자동화 기능을 제공하는 기업용 AI 플랫폼

[00:00:00] 데모 소개

Gemini 2.5 Pro 데모 영상을 다룹니다. Flash 모델로 재현할 계획을 설명합니다.

Punit이 X에서 공개한 Gemini 2.5 Pro 데모를 Gemini 2.5 Flash를 사용해 재현하는 시도를 소개합니다.
[00:00:24] 토큰 사용량 및 속도

불과 1백만 토큰 중 만 몇천만 사용했습니다. Flash 모델은 22초 만에 응답했습니다.

단 1만 500개의 토큰으로 3JS를 사용해 영상의 내용을 코드로 재현하도록 요청했습니다.
[00:00:42] 성능 및 비용 비교

Flash는 초고속이고 저렴합니다. Pro 대비 속도와 비용 효율을 비교합니다.

Gemini 2.5 Flash는 매우 빠르고 저렴하며, 22초 만에 설명과 함께 코드를 생성했습니다.
생성된 3D 시각화는 회전, 색상 변경, 다양한 모양 변형이 가능한 인터랙티브한 결과물을 보여줍니다.
[00:01:19] 3D 도형 시각화

3JS로 동적 3D 도형을 생성하고 회전합니다. 색상과 형태를 실시간으로 변경합니다.

타임라인 정보가 없습니다.

[00:01:59] Import map 해결책

3JS 로딩 문제를 import map으로 해결했습니다. Flash와 Pro 간 로딩 차이를 설명합니다.

Gemini 2.5 Flash와 Pro의 주요 차이점을 설명하며, Flash의 3JS 로딩 문제와 해결 방법을 공유합니다.
Flash는 훌륭하지만 Pro가 약간 더 우수하며, 최신 모델 벤치마크와 데모는 forwardfuture.ai 뉴스레터에서 확인할 수 있습니다.
Gemini 2.5 Pro의 루빅스 큐브 시뮬레이션 테스트에서는 첫 시도만으로 완벽한 시각화를 구현했으며, 이는 Google Cloud Next 행사에서도 주목받았습니다.
[00:03:34] 스폰서 소개: Box AI

Box AI로 기업 문서 저장과 분석을 손쉽게 합니다. RAG 파이프라인과 API 활용법을 소개합니다.

시뮬레이션은 기본적인 회전과 색상 표현은 잘 작동하지만, 큐브 섞기나 풀기 기능에서는 오류가 발생하는 한계를 보였습니다.
Flash 버전은 약간의 개선이 필요하지만, 다른 데모들에서는 우수한 성능을 보여주었으며, 특히 영상 분석 능력이 인상적이었습니다.
Box AI는 기업용 문서 저장 및 AI 기반 분석 도구로, 팀 협업과 문서 관리에 효과적인 솔루션을 제공합니다.
Box AI는 워크플로우와 에이전트를 통해 API를 제공하며, 새로운 모델이 출시될 때마다 자체 벤치마크를 실행하고 결과를 공개합니다.
Box AI는 11만 5천개 기업이 신뢰하는 서비스로, RAG 파이프라인을 완벽하게 처리하며 Gemini 2.5 Flash를 포함한 최신 모델과 호환됩니다.
[00:06:34] 바이러스 시뮬레이션

혈류 속 바이러스와 면역 세포 상호작용을 3D로 구현합니다. 다양한 슬라이더로 시뮬레이션 변수를 제어합니다.

다음 테스트로 혈류 속 바이러스 시뮬레이션을 진행하며, Gemini 2.5 Pro와 Flash의 성능을 비교합니다.
3JS를 사용한 인터랙티브 바이러스 시뮬레이션 제작을 위한 상세한 프롬프트를 설명합니다.
시뮬레이션은 혈액 세포, 바이러스, 다양한 설정 슬라이더를 포함하며, 바이러스와 백혈구의 상호작용을 구현합니다.
코드 생성 과정과 결과를 설명하며, 3JS 관련 참조 오류가 발생했음을 보고합니다.
3JS 로컬 로딩 문제가 발생했지만 캔버스에서는 정상적으로 작동했습니다. 이는 로컬 머신과 Gemini 2.5 Flash의 호환성 문제로 판단됩니다.
혈류 시뮬레이션을 구현하여 적혈구, 백혈구, 바이러스의 상호작용을 보여주며, 다양한 파라미터를 조절할 수 있습니다.
바이러스의 복제율, 유형(공격적, 은밀형, 빠른 복제형), 백혈구의 수와 능력치 등을 조절할 수 있는 기능이 구현되었습니다.
시뮬레이션과 혈류 속도를 조절할 수 있는 환경 설정이 추가되어 있어 매우 인상적인 결과를 보여줍니다.
[00:10:05] 덕 소터 게임

영상만으로 오리 분류 게임 코드를 자동 생성했습니다. 절차적 애니메이션 요소를 재현합니다.

Keepy의 '오리 정렬기' 데모에서는 절차적 애니메이션을 사용하여 색상별로 오리를 정렬하는 게임을 구현했습니다.
Gemini 2.5 Flash는 단 21초 만에 비디오를 분석하고 게임의 모든 요소를 파악하여 파이썬 코드를 생성했습니다.
Gemini 2.5 Flash 프로젝트에서 설정 조정만으로 충분했음을 설명하고, 최대한 완벽하게 만들고자 했던 의도를 설명합니다.
게임 데모를 시연하며 색상별로 오리를 분류하는 게임플레이를 보여주고, 물리 효과와 움직임이 데모 영상과 유사하게 구현되었음을 설명합니다.
[00:12:04] 타워 디펜스 게임

HTML5 캔버스 기반으로 풍선 적 웨이브를 방어합니다. 다양한 타워 유형과 발사 모드를 지원합니다.

현재 승리 조건 기능이 작동하지 않는 문제를 언급하고, 영상을 보고 재현한 결과물에 대해 만족스러워합니다.
프로듀서 Alex가 개발한 타워 디펜스 게임을 소개하고, LLM을 활용한 프롬프트 작성 방법을 설명합니다.
5가지 타워 유형(다트, 캐년, 얼음, 스나이퍼, 레이저)의 특성과 게임 메커니즘을 상세히 설명합니다.
실제 게임플레이를 시연하며 타워 배치와 웨이브 진행 과정을 보여줍니다.
다트 게임을 계속하며 체력이 증가된 적들과 대면하고 있습니다. 게임이 잘 작동하고 있으며, 더 많은 시각적 요소와 복잡성을 추가할 수 있는 가능성이 있습니다.
복잡한 스네이크 게임 개발을 시작하며, Pygame을 사용해 독특하고 시각적으로 화려한 기능들을 추가할 계획을 설명합니다.
[00:14:32] 강화된 스네이크 게임

Pygame으로 차별화된 비주얼 이펙트를 적용합니다. AI와 인간 플레이어가 경쟁합니다.

Gemini 2.5 Pro로 만든 스네이크 게임의 특징을 보여주며, AI와 사람이 조종하는 두 뱀의 경주, 다양한 시각 효과, 여러 종류의 먹이 시스템을 구현했습니다.
Gemini 2.5 Flash와 Pro 버전의 성능 차이를 비교하며, Flash 버전이 더 단순하지만 677줄의 코드로 꽤 좋은 결과물을 만들어냈음을 설명합니다.
Gemini 2.5의 주요 장점으로 긴 코드 생성 능력을 강조하며, 다른 모델들과 비교했을 때의 차별점을 설명합니다.
[00:16:36] 사이드 바이 사이드 테트리스

두 AI가 Python Pygame으로 대결합니다. 승패 결정 및 가비지 시스템을 구현합니다.

새로운 프로젝트로 AI 간의 테트리스 대결 게임을 소개하며, 게임의 기본 규칙과 특징을 설명합니다.
테트리스 게임의 기본 규칙과 가비지 라인 시스템이 설명됩니다. 클래식 테트리스 규칙을 따르며, 라인을 클리어하면 상대방에게 가비지 라인이 전송됩니다.
2.5 Pro 버전에서 새로운 테트리스 테스트를 진행하며, AI의 개선된 로직과 스마트한 배치 전략이 소개됩니다.
Alex가 Gemini 2.5 Flash로 게임을 개발하는 과정과 여러 번의 수정 작업이 있었음이 설명됩니다.
실제 게임 플레이가 시연되며, 두 AI 플레이어의 대결과 가비지 라인 시스템의 작동이 보여집니다.
2.5 Pro 버전과의 비교 테스트가 진행되며, 두 버전이 거의 동일한 성능을 보여주지만 약간의 속도 차이가 있음이 확인됩니다.
Romesh의 갈톤 보드 실험이 소개되며, Gemini 2.5 Flash가 다른 AI 모델들보다 우수한 성능을 보여줬다는 내용이 설명됩니다.
[00:19:20] 갈턴 보드 시뮬레이션

Matter.js로 확률 분포를 벨 곡선 형태로 시각화합니다. 슬라이더로 공 개수·중력 조절이 가능합니다.

HTML 파일과 물리 엔진을 사용한 가톤 보드 시뮬레이션 구현 방법을 설명합니다.
첫 시도에서 바닥 컵이 누락되어 데모 영상을 참고해 수정 작업을 진행했습니다.
Flash의 빠른 처리 속도로 코드가 즉시 렌더링되며, 벨 커브 형태로 공이 떨어지는 것을 확인했습니다.
시뮬레이션 컨트롤을 추가하여 공의 개수, 낙하 간격, 중력, 크기 등을 조절할 수 있게 했습니다.
[00:21:26] iPhone 그리기 앱 시뮬레이션

Python으로 다양한 드로우 도구와 캔버스 기능을 제공합니다. 색상·펜 크기·저장 기능을 구현합니다.

통의 개수와 간격 조절 기능을 추가했으나, 공간 제약으로 인한 한계가 있음을 설명합니다.
골턴 보드 시뮬레이션의 물리적 특성(페그, 공의 탄성, 마찰력 등)을 조정하고 시연하며 성공적인 결과를 보여줍니다.
Alex가 파이썬으로 만든 아이폰 드로잉 앱 시뮬레이션을 소개하고, 다양한 그리기 도구와 기능들을 설명합니다.
[00:23:58] 비디오 Q&A 분석

16분짜리 Popeye 영상에서 장면별 질문에 답했습니다. 라이온·안내판·배럴 텍스트를 정확히 식별합니다.

16분 길이의 뽀빠이 만화를 Gemini 2.5 Flash에 업로드하여 영상 내용에 대한 상세한 질문과 답변을 테스트합니다.
Gemini 2.5 Flash의 성능을 평가하며, Pro 버전과 비교했을 때 속도와 비용 면에서의 장점을 강조합니다.
[00:26:03] 결론 및 구독 요청

Flash는 Pro에 근접한 성능을 저비용으로 제공합니다. 구글의 AI 실행력을 강조하며 구독을 권장합니다.

타임라인 정보가 없습니다.

Punit이 X에서 공개한 Gemini 2.5 Pro로 만든
데모를 한번 살펴보겠습니다. 하지만 우리는
이것을 다른 방식으로 재현해볼 건데요,
제가 실제로 이 영상을 다운로드해서
Gemini 2.5 Flash에 업로드하고 재현하도록 했습니다.
자, 한번 보시죠. 트위터에서 직접
영상을 다운로드하고
Google AI Studio에 바로 업로드했는데,
이건 Gemini에서도 직접
할 수 있는 작업입니다.
그리고 이것은 단 1만 500개의
토큰만 사용했습니다. 100만 토큰 중에서요.
저는 단순히 이 영상에 있는 것을
코드로 재현해달라고 했어요. 3JS를 사용하고
모든 코드를 하나의 HTML 파일에 넣으라고 했죠.
3JS를 이렇게 로드하라고 했고,
왜 이렇게 했는지 곧 설명하겠습니다.
22초 동안 생각을 했고, 이것이
Gemini 2.5 Flash 모델의 가장
인상적인 부분입니다. 번개처럼 빠르고
시장의 다른 모델들에 비해 매우 저렴하죠.
그래서 설명과 함께
많은 양의 코드를 출력했습니다.
여기 결과물이 있네요. 완전히 똑같지는
않지만, 이건 단순히 영상만 보고
재현한 거라는 걸 기억하세요. 이렇게
회전도 할 수 있고, 축을 따라
이동도 할 수 있습니다.
다양한 방향으로 회전하고
색상도 변경할 수 있어요. 예쁜 핑크와
보라색이 있고, 파란색과 초록색도 있네요.
그리고 여기 무지개색도 있습니다.
정말 멋지죠. 확대해서 보면
이 3D 시각화를 구성하는
작은 사각형들을 모두 볼 수 있어요.
원본 데모처럼 클릭해서
모양을 바꿀 수 있고, 새로운
모양이 로드됩니다. 이번엔 큐브네요.
이전처럼 회전도 할 수 있습니다.
보라색, 파란색, 하늘색, 초록색, 노란색,
주황색, 그리고 바닥의 빨간색이 있네요.
다시 한번 클릭해볼까요?
어떤 모양이 나올지 봅시다. 자, 여기
피라미드가 나왔네요. 조금
축소해보면 모든 면이 보이죠.
이게 제일 마음에 드네요. 다시
모양을 바꿔볼까요? 도넛
모양이 나왔네요. 멋있죠. 모양을
한 번 더 바꿔보겠습니다. 접시나 평면
모양이 나왔네요. 아주 좋습니다. 다시
한번 바꿔볼까요? 오, 정말 멋지네요. 일종의
파형이 나왔어요. 그리고
배경에서 보면 겹치는 부분의
색상이 변하는 것을
볼 수 있죠. 정말 멋지고
아주 쉽게 만들었습니다. 프롬프트도 거의 안 썼어요.
자, 다시 처음으로 돌아가서,
왜 이 부분을 추가했는지 설명하겠습니다.
'3JS를 이렇게 로드하세요'라고 했고,
import map이 있는 스크립트를 사용했죠.
이렇게 한 이유는 지금까지
Gemini 2.5 Flash로 생성한 모든 코드가
3JS를 제대로 로드하는 데 실패했기 때문입니다.
이상한 방식을 사용해서 콘솔에
에러가 발생했고, 결국 이게
올바른 방법이라는 걸 알아냈죠.
근데 Gemini 2.5 Pro는 이런 문제가
없었어요. 이게 바로
두 모델의 주요한 차이점입니다.
Pro는 거대한 괴물같은 모델이에요. 더 느리고
더 비싸지만, 확실히
더 뛰어난 능력을 보여줍니다. 그래서 이제는
이 부분을 항상 추가하니 잘 작동하고
있어요. 이제 여러분께
Gemini 2.5 Pro와 Flash의 차이점을
보여드리도록 하겠습니다.
Flash는 훌륭하지만, Pro가 약간 더 우세합니다.
그리고 참고로,
최신 모델 벤치마크와 데모 등
더 많은 내용을 보고 싶으시다면
제 뉴스레터인
forwardfuture.ai를 구독하시길 추천드립니다.
우리는 훌륭한 오리지널 콘텐츠를 제공하고
여러분을 위해 뉴스도 정리해드립니다.
forward future.ai를 확인해보세요.
자, 이제 루빅스 큐브 시뮬레이션입니다.
이게 제가 가장 좋아하는 Gemini 2.5 Pro 테스트였죠.
단 한 번의 시도로, 제로샷으로
완벽한 시각화를 만들어냈습니다.
Alex가 지금 제가 설명하는 동안
화면에 보여줄 건데요,
이건 구글도 매우 인상 깊어했던 데모로,
최근 Google Cloud Next 행사에서
시연했고,
CEO도 이에 대해 언급했습니다.
자, 다시 한번 해보겠습니다.
동일한 프롬프트를 입력했더니,
꽤 괜찮아 보이네요.
왜 좀 어둡게 보이는진 모르겠지만,
다크 모드 브라우저 플러그인을
꺼놨는데도 말이죠. 하지만 회전도 되고
각 면의 색상도
대체로 정확합니다.
크기를 늘릴 수 있을까요? 네, 큐브 크기를
다양하게 조절할 수 있고, 평면으로 회전도 되고
다양한 각도로도 회전이 가능합니다.
10x10으로 늘려볼까요? 자, 됐네요.
여전히 잘 작동하고, 모든 면이 정확합니다.
하지만 섞기를 누르면
아무 일도 일어나지 않네요. 콘솔을 확인해보죠.
150회 섞기 진행 중. 섞기 완료.
기록된 움직임 0회라고 나오네요.
뭔가 작동해야 할 것 같은데
제대로 작동하지 않습니다.
오늘 보여드릴
몇 가지 데모에서는 약간의 반복을
시도했지만, 이건 그러지 않았고
제로샷으로 잘 작동하는지
보고 싶었습니다. 자, 다시
3x3 큐브로 돌아가보겠습니다.
회전을 시키면 회전은 되는데
색상이 좀 이상해지네요.
색상이 서로 뒤바뀌고 좀
어색해 보입니다.
반대로 돌려도 마찬가지고,
다른 축으로 회전해도 같은 현상이 발생합니다.
Gemini 2.5 Flash로 몇 번 더
프롬프트를 시도하면
잘 작동하게 만들 수 있을 것 같은데,
다른 데모들은 제로샷으로도
잘 작동했고,
그중 가장 인상적인 것은
전체 영상을 보고 영상 속의
세부적인 내용에 대해
질문하는 것이었습니다. 곧 보여드리죠.
풀기를 클릭해도 아무 일도 일어나지 않고,
12단계로 풀기, 큐브 완성이라고 뜨지만
에러가 발생합니다.
가장 중요한 건,
실제로 풀리는 걸 볼 수 없다는 거죠.
Gemini 2.5 Pro는 이 모든 걸
첫 시도에 해냈다는 걸 기억하세요.
오늘 영상의 스폰서인
Box를 꼭 테스트해보시길 바랍니다. Box AI는 정말 대단해요.
저희 팀 전체가 Box로 전환했는데
지금까지 아주 만족스럽습니다.
Box를 사용하면 모든 종류의
회사 문서를 저장하고
인공지능을 활용해 인사이트를 추출하고,
Q&A에 답변하고, 자동화와 지능형
워크플로우와 에이전트를 통해
Box AI의 API를 직접 활용하여 개발할 수도 있습니다.
최신 모델들을 모두 보유하고 있으며,
Box 내부에 특별 팀이 있어
새로운 모델이 출시되면 즉시
자체 벤치마크를 실행하고
그 결과를 공개적으로 공유합니다.
따라서 Box AI를 활용하여
개발하고 싶다면,
RAG 파이프라인 전체를 대신 처리해줍니다.
모든 문서를 지원하며,
11만 5천개의 기업이 신뢰하고 있습니다.
기업급 보안과 관리 기능을 갖추고 있으며,
Gemini 2.5 Flash와
최근 출시된 모든 모델과 호환됩니다.
꼭 확인해보시기 바랍니다.
훌륭한 파트너십을 맺고 있습니다.
아래에 모든 링크를 첨부해두었으니
확인해보시기 바랍니다.
Box에 다시 한 번 감사드립니다.
이제 다음 테스트로 넘어가보겠습니다.
다음은 바이러스 시뮬레이션입니다.
혈류 속에서 혈구를 공격하는 바이러스를 시뮬레이션합니다.
이전과 동일한 프롬프트를 사용했는데,
Gemini 2.5 Pro에서는
이런 결과가 나왔습니다.
매우 인상적이죠.
이제 Gemini 2.5 Flash의 결과를 보여드리겠습니다.
Flash는 훨씬 더 빠른 시간 내에
이 코드를 생성할 수 있었다는 점을 기억하세요.
여기 프롬프트가 있습니다.
'혈류 속에서 세포를 공격하는 바이러스의
인터랙티브 시뮬레이션을 만들어주세요.
모든 코드를 하나의 HTML 파일에 넣고
3JS를 사용해주세요.' 왜 이렇게 했을까요?
작업을 쉽게 하기 위해서입니다.
Gemini의 좋은 점은
이제 캔버스도 사용할 수 있다는 것입니다.
반드시 하나의 파일에 모든 것을
넣을 필요는 없지만, 이게 더 편하죠.
환경은 시각적으로
흐르는 혈액과 적혈구,
백혈구, 바이러스를 표현해야 합니다.
다음 기능들을 포함했습니다:
시뮬레이션 요소들. 적혈구는 바이러스가
공격하고 파괴하는 수동적 세포이고,
백혈구는... 자, 이렇게 설명되어 있습니다.
그리고 여러 슬라이더가 있습니다.
바이러스 설정, 바이러스 수,
바이러스 복제 속도,
바이러스 타입 선택기(공격적, 은밀함 등),
백혈구 설정,
백혈구 수,
공격력, 탐지 반경,
이동 속도, 환경 설정,
혈류 속도, 시뮬레이션 속도,
카메라 줌, 이동 감도가 있습니다.
바이러스는 무작위로 움직이거나
적혈구를 찾아다닙니다.
접촉하면 바이러스가 적혈구를 파괴하고
복제될 수 있습니다. 백혈구는
적극적으로 순찰하며,
기본적인 상태 표시기를 포함하고
카메라를 움직일 수 있습니다.
여기 처리 과정이 있습니다.
완전한 인터랙티브 3D 시뮬레이션을 만드는
과정입니다. 여기 모든 생각이 있죠.
실제로 코드를 출력하기 전에
생각하는 과정이 꽤 가벼웠습니다.
그리고 여기 코드가 있습니다.
상당한 양의 코드가 생성되었죠.
한 가지 오류가 있었는데,
콘솔에서 바로 복사한
오류는 다음과 같습니다:
'Uncaught reference 3 is not defined'
제가 앞서 언급했던 문제인데요.
어떤 이유에서인지 3JS를 로컬에서
불러오지 못했습니다. 하지만 캔버스에서는 작동했어요.
그래서 이건 제 로컬 머신에서
Gemini 2.5 Flash와 함께 작동하는 방식과
3JS를 로드하는 방식의 호환성 문제였던 것 같습니다.
그래서 저는 여전히 한 번의 시도로
통과시키려고 합니다.
왜냐하면 캔버스에서는 잘 작동했거든요.
자, 캔버스에서는 이렇게 보입니다.
여기 혈류가 보이죠.
여러 축을 따라 움직일 수 있고
이렇게 회전도 가능합니다.
적혈구, 백혈구,
바이러스가 있습니다. 여기 바이러스의
수를 조절할 수 있는데
이걸 늘리면, 초록색 점으로 표시된
바이러스의 수가 크게 증가하는 걸
볼 수 있습니다.
실제로 혈류 내부를 확대해서 볼 수도 있는데
이게 정말 멋진 것 같아요.
복제율도 있어서,
바이러스가 공격한 후에
바이러스를 복제할 수 있습니다.
바이러스 유형은 공격적, 은밀형,
아직 구현되지 않은 것과
빠른 복제형이 있는데, 이것도
아직 구현되지 않았네요.
그리고 백혈구의 수도 있는데
기억하세요, 백혈구는
방어를 담당합니다. 공격력,
감지 반경, 그리고 이동
속도도 조절할 수 있죠.
환경 설정도 있습니다. 시뮬레이션
속도를 높여볼까요? 혈류의
속도도 증가시킬 수 있습니다.
이렇게 모든 걸 볼 수 있죠.
꽤 괜찮은 결과라고 생각합니다. 매우 인상적이에요.
정말로 한 번에 성공했습니다.
X에서 발견한 또 다른 데모가 있습니다.
이건 Keepy가 만든 건데요.
절차적 애니메이션을 사용한 오리 정렬기입니다.
여러분은 이 하얀색 정렬기 캐릭터가 되어
돌아다니면서, 서로 다른 색상의
세 그룹의 오리들을 만나게 되는데
여러분의 임무는 이 오리들을
색상별로 모으는 겁니다.
저는 그냥 비디오를 다운로드하고
Gemini 2.5 Flash에 업로드했는데,
어떻게 됐는지 보여드리죠.
자, 여기 있습니다.
이상하게도 토큰을 하나만 사용했다고 하는데,
비디오를 업로드하고
'이 오리 정렬 게임을 만들어주세요.
파이썬 단일 파일로, 절차적
애니메이션을 사용해서요'라고 했습니다.
Flash라서 매우 빠르기 때문에
21초밖에 걸리지 않았어요.
생각 과정을 살펴볼까요?
핵심 요청을 이해했습니다.
사용자가 오리 정렬 게임을 복제하길 원합니다.
게임 요소를 파악했죠. 어두운 회색 배경,
타이틀 화면, 게임 화면, 종료 화면, 상호작용 등
기타 등등이요. 물리와 움직임도 파악했습니다.
정렬기는 커서를 향해 이동해야 하고
색깔 있는 오리들은 기본 움직임,
정렬기와의 충돌, 오리끼리의 충돌,
경계면 충돌 등을 가져야 합니다.
비디오를 보는 것만으로 모든 요소를
파악했다는 게 정말 대단하죠.
이런 걸 할 수 있는 다른 AI 모델은
본 적이 없어요. 정말 인상적입니다.
그리고 나서 코드를 받았습니다. 여기
모든 코드가 있는데요.
설정 때문에 여러 번 왔다 갔다 했는데
설정이 잘못되어 있었어요.
Gemini 2.5 Flash와 여러 번 시도할 필요는 없었죠.
단순히 설정만 조정하면 됐는데,
물론 저는 최대한 완벽하게
만들고 싶었거든요.
이제 어떻게 보이는지 보여드릴게요.
거의 똑같아 보이죠. 이제 클릭해보겠습니다.
자, 이제 분류를 시작해볼게요.
파란색 오리들을 다른 파란색 오리들과
모으려고 하는 중이에요. 캐릭터나
스프라이트는 그렇게 좋아 보이진 않지만,
괜찮아요. 노란색 것들을
모아볼까요? 네, 제가 이 게임을
잘하진 못하네요. 좋아요,
저 노란 녀석을 저기로 보내고... 제가 좋아하는 건
화면을 벗어났다가
다시 튀어 들어오는 거예요.
물리 효과가 잘 적용되어 있죠.
이건 모두 데모 영상에서 가져온 거예요.
자, 저 노란 녀석을 저기로 보내고
분홍색 녀석들을 저쪽으로 보낸 다음
청록색을 모아볼게요. 다른 그룹을
흐트러뜨리지 않고 할 수 있을지 봐요. 아,
여러분께는 보기 힘드실 것 같네요.
죄송해요. 자, 됐어요.
지금은 승리 조건이 작동하지 않는데,
이전 버전에서는 잘 작동했었어요.
하지만 망가졌네요. 승리 조건은
'성공했습니다'라고 표시되는 거예요.
그래서 전 이게 꽤 괜찮다고 생각해요.
영상만 보고
재현한 것 치고는요. 다음으로, 프로듀서 Alex가
만든 이 타워 디펜스
게임인데, 놀랍게도 아주 잘 작동했어요.
프롬프트가 어땠는지 보여드릴게요.
HTML5 캔버스 기반 타워 디펜스를 만드는데,
풍선 적들이 웨이브로 나타나고(체력 1-10),
녹색에서 보라색까지
색상으로 구분되며 구불구불한
경로를 따라가요. 그리고 기억하세요, 그는
이 모든 걸 수동으로 작성하지 않았어요.
기본 아이디어를 가지고 LLM을
사용해서 프롬프트를 작성했죠.
저는 항상 이렇게 하는 걸 추천해요.
구불구불한 경로를 따라 가고,
계획 모드에서는 다트, 캐년,
얼음, 스나이퍼, 레이저 등 5가지 타워를 배치하는데,
각각 고유한 색상의 점으로 표시되고
마우스를 올리면 사거리가 표시돼요.
지금 빠진 것은 시각적 요소인데,
곧 보시겠지만, 그건 쉽게 추가할 수 있어요.
다음 단계예요. 라운드 시작을 누르면 시작되고,
다트 타워는 빠른 속도로 단일 목표를
연속 공격해요. 캐논 타워는 느린 광역 데미지,
얼음 타워는 적을 감속시키고, 스나이퍼 타워는
높은 데미지와 긴 사거리를 가졌어요. 레이저 타워는
청록색 레이저 선으로 연속 공격을 하죠.
적들의 체력이 숫자로 표시되고
기타 등등이 있어요. 생각보다
짧은 시간이 걸렸는데,
그건 언급되지 않았네요.
여기 코드가 있어요.
어떻게 생겼는지 보여드릴게요.
얼음을 여기와 여기에 배치해볼게요.
처음부터 속도를 늦춰야 해요.
좋아요, 100이 남았네요. 아마도
너무 많이 배치한 것 같아요.
다트를 여기와 저기에 배치해볼게요.
자, 시작해볼까요? 풍선들이
다가오고 있어요. 보시다시피
속도가 늦춰지고 있고, 다트가 그들을 제거했어요.
웨이브 1 완료. 웨이브 2를 준비하세요.
돈도 더 벌었네요. 좋아요.
여기에 다트를 하나 더 놓고,
다시 시작해보죠. 이제
체력이 증가했습니다. 위에
3과 4가 보이시죠. 보시다시피
잘 작동하고 있습니다.
물론 더 많은 시각적 요소와
게임의 복잡성을 추가하며
계속 개선할 수 있지만, 이 정도면
Gemini 2.5 Flash에서 정말 훌륭한 결과입니다.
자, 다음은 매우 복잡한 스네이크
게임입니다. Pygame을 사용해서
클래식 스네이크 게임을 만들건데,
독특하고 시각적으로 화려하며
복잡한 기능들을 추가해서
놀라운 게임을 만들어보죠. 먼저
Gemini 2.5 Pro가 만든 결과물을
보여드리겠습니다. 정말 시각적으로
화려했거든요. 한번 보시죠.
여러 종류의 먹이가 있고,
AI와 사람이 조종하는 두 마리의 뱀이
경주를 합니다. 카메라가 움직이고,
정말 인상적입니다. 이제 나머지
프롬프트를 보시죠. 역동적인 시각
효과가 있습니다. 뱀은 빛나는
흔적을 남기고, 배경은
미묘한 색상 그라데이션으로 맥동하며
먹이를 먹으면 파티클 폭발
효과가 발생합니다. 여러
종류의 먹이가 있어요. 속도
부스트, 컨트롤 반전, 이중 시야,
시간 감속 등이 있습니다.
여기까지만 하겠습니다. 설명과
세부사항이 많이 있는데, Gemini 2.5 Flash는
꽤 좋은 결과물을 만들었지만
Gemini 2.5 Pro만큼은 아니었습니다.
한번 보여드리죠. 자, 여기 있습니다.
제가 초록색이고 AI는 빨간색입니다. 보시다시피
속도 부스트가 있고... 충돌했네요. 게임
오버입니다. 다시 보여드리죠.
여러 종류의 먹이가 있습니다. 잘
작동하고 있죠. AI 뱀이 저와 충돌했습니다.
그래서 졌네요. 보시다시피
자, 이번엔 제가 졌네요. 미묘한
파티클 효과와 다양한 종류의
먹이가 있지만, 확실히
Gemini 2.5 Pro만큼 시각적으로 화려하지는
않습니다. 하지만 677줄의 코드로
이걸 완성했죠. 이게 아마도
Gemini 2.5 제품군, Pro와 Flash
모두와 다른 모든 모델들 사이의
가장 큰 차이점일 것입니다.
Gemini 2.5에 코드를 요청하면
긴 코드를 생성합니다. 수백 줄,
때로는 천 줄이 넘는 코드를
만들어냅니다. 제가 사용해본 다른
모델들은 몇백 줄 이상의
코드를 생성하지 못했습니다.
그리고 당연히
코드 줄 수의 제한으로 인해
만들 수 있는 복잡성도 제한됩니다.
하지만 다시 한 번 말씀드리지만,
Flash는 훨씬 저렴한 가격에
더 빠른 속도를 제공합니다. 그래서
상황에 맞는 도구를
사용하면 됩니다. 자, 다음입니다.
Alex가 만든 또 다른 예제입니다.
Alex, 도움 주셔서 감사합니다.
그는 두 AI가 경쟁하는 나란히 배치된 테트리스를
만들었습니다. Python과 Pygame으로
두 AI 플레이어가 서로 경쟁하는
테트리스 시뮬레이션을 만들어
클래식 테트리스 룰을 사용합니다.
한 플레이어가 꼭대기에 도달하면 게임이 끝나고
각 AI는 상대방에게 방해 라인을 보냅니다.
그래서 다른 플레이어에게 가비지 라인을
보내는 방식인데, 기본적으로
클리어해야 하는 블록 라인들입니다.
핵심 기능은 클래식 테트리스 규칙입니다.
표준 테트리미노 회전 시스템, 10x20 그리드,
홀드 기능 없음, T-스핀 없음, 콤보 없음,
각 플레이어당 현재 블록과
다음 블록 미리보기 1개만 표시됩니다.
가비지 시스템에서는 1,2,3,4줄 클리어 시
각각 0,1,2,4개의 가비지 라인이
상대방에게 전송됩니다.
가비지 라인에는 랜덤하게
구멍이 하나씩 있으며
짧은 경고 애니메이션과 함께
상대방 보드 아래에서 추가됩니다.
2.5 Pro 테스트 영상에서는
이 테트리스 테스트를 하지 않았는데,
지금 백그라운드에서 2.5 Pro로
실행해보고 있습니다.
AI 로직이 개선되어 스마트한 배치
휴리스틱을 사용합니다.
구멍 수를 최소화하고,
가장 높은 열의 높이를 최소화하며,
라인 클리어를 최대화하는 등의 전략을 씁니다.
이렇게 게임을 만들었는데, Alex는
Gemini 2.5 Flash와 여러 번
수정을 거쳐야 했습니다.
보시다시피 많은 피드백과
세부적인 개선이 있었죠.
최종 결과물을 보여드리겠습니다.
자, 두 AI 플레이어가 있고 다음 블록도 보이네요.
방금 가비지가 생겼는데,
저기 회색 블록들이 바로 그겁니다.
지금 19대 15 상황이고
양쪽 다 가비지가 있네요.
이건 시간이 좀 걸릴 것 같습니다.
AI가 꽤 잘하거든요.
자, 한 플레이어는 가비지가 더 많지만
다른 플레이어는 점수가 더 높네요.
어떻게 될지 보겠습니다.
플레이어 1이 위험해 보이는데
패배가 임박한 것 같네요.
아니네요. 결국 게임이 끝났고
플레이어 1이 꼭대기에 도달해서
플레이어 2 AI가 승리했습니다.
꽤 좋은 결과네요.
이제 2.5 Pro 버전을 보여드리겠습니다.
이건 첫 시도입니다. 아직 테스트도 안 해봤어요.
어떻게 될지 보죠. 꽤 비슷해 보이는데,
Gemini 2.5 Flash와 동일한
문제가 있네요. 화면이 잘려있습니다.
이전과 정확히 같은 문제예요.
거의 똑같아 보입니다.
작동도 동일하고, 다만 움직임이
조금 더 느린 것 같지만
전반적으로 거의
동일한 결과가 나왔네요.
꽤나 인상적입니다.
다음으로, X의 Romesh가 만든
갈톤 보드를 보겠습니다. 이건
확률 분포를 보여주는데
파칭코와 비슷해 보이네요. 공들을
위에서 떨어뜨리면
아래로 떨어지면서
결국 확률 분포를 나타내는
종 모양 곡선이 만들어집니다.
그는 Gemini 2.5 Flash가 갈톤 보드 테스트에서
압도적인 성능을 보였다고 했습니다.
GPT-4나 Claude 3은 이걸 만들지 못했는데,
그가 제공한 프롬프트를
사용했고, 감사하게도
영상도 다운받아서 업로드했습니다.
정보를 구축하기 위한 두 번째 소스로
우선 프롬프트를 가져왔습니다.
자체 포함된 HTML 파일을 만들어
가톤 보드 시뮬레이션을 위해 클라이언트 사이드 자바스크립트와
CDN을 통해 포함된 Matter.js와 같은 2D 물리 엔진을 사용했습니다.
이 시뮬레이션은 HTML5 캔버스에 렌더링되며
다음 기준을 충족해야 합니다.
단일 파일, 캔버스 크기,
물리 효과 등의 조건들이 있습니다.
기본적으로 가톤 보드가
어떻게 보여야 하는지,
공이 어떻게 움직여야 하는지,
페그가 어떻게 보여야 하는지 등을 정의합니다.
16초 동안 생각한 후에 결과물이 나왔습니다.
첫 번째 시도에서는
바닥의 컵들, 즉 공이 떨어지는
작은 공간들이 누락되었습니다.
그래서 그의 데모 영상을 업로드하고
"바닥 컵 부분이 없다.
이 영상을 검토하고
똑같이 보이게 만들어달라"고 했습니다.
참고로, 이 영상들에 대해
계속 한 토큰이라고 말하는데
확실히 한 토큰은 아닙니다만, 좋습니다.
22초 더 생각하고 앞뒤로 검토했는데
제가 고민하고 반복적으로 수정한 것은
바닥에 있는 작은 컵들의 너비였습니다.
그리고 참고로, 방금
작은 문제가 발생해서 수정을 요청했는데
출력 속도가 얼마나 빠른지 보세요.
이게 바로 Flash의 특징입니다.
정말 빠르고, 모든 코드를
다시 렌더링하고 있습니다. 다시 시도해보죠.
공들이 떨어지고 있네요. 완벽합니다.
이제 사라지지 않습니다.
전에는 공들이 착륙하고
사라졌었는데, 간단한 설명 몇 마디로
수정되었습니다. 자, 이제 보시죠.
벨 커브가 형성되기 시작하는 것을
볼 수 있습니다. 완전히 랜덤이라
완벽한 벨 커브가 아닐 수도 있지만
어떻게 될지 보겠습니다. 그리고
왼쪽에 시뮬레이션 컨트롤을 추가했습니다.
최대 공의 개수를 100개에서 2,000개까지
설정할 수 있고, 떨어지는 간격을
밀리초 단위로 조절할 수 있습니다.
중력이 있어서 공에 적용되는
중력을 조절할 수 있고, 공의 반지름도
조절 가능해서 더 크게 만들 수 있습니다.
물론 약간 걸리는 부분이 있지만
그래도 괜찮습니다.
가장 큰 크기로 설정하면
여전히 떨어지긴 하지만
좀 더 천천히 떨어지고
아주 작게 만들면 더 빨리 떨어집니다.
페그 반지름도 조절할 수 있어서 더 크게 만들 수 있고
페그 반지름을 최대로 하고
공의 반지름도 최대로 하면
당연히 어디로도 움직이지 못합니다.
그래서 공과 페그의 반지름을
가능한 한 작게 만들면
훨씬 더 빨리
떨어지게 됩니다. 그리고
페그의 수평 간격도 있어서
이렇게 조절할 수 있고,
페그의 수직, 수평 간격도 있습니다.
통의 개수도 있는데,
이건 좀 불편한 게 개수가 많아지면
갑자기 공간이 부족해져서
제가 원하는 대로 작동하지 않습니다.
통 위의 간격도 조절할 수 있어서
보시다시피 조정하면
보시다시피 페그 중 일부가 사라지고,
공의 탄성이 있고,
공의 마찰력이 있으며,
공기 마찰도 있습니다. 제 생각에는
꽤 멋진 것 같네요. 이것이 골턴 보드
시뮬레이션입니다. 여기서 떨어지는
공의 개수를 볼 수 있고,
공이 떨어지는 간격을 줄이면
더 빠르게 떨어지게 됩니다.
이것으로 성공이라고 할 수 있겠네요.
다음으로, Alex가 아이폰 드로잉 앱을 만들었습니다.
아이폰용으로 만든 것은 아니고,
실제로는 파이썬으로 만들어졌습니다.
그래서 직접적인 지시사항은
따르지 않았지만, 보여드리겠습니다.
그리기가 가능한 아이폰 앱
시뮬레이션을 만드는 것이 핵심이었죠.
아이폰 앱의 시뮬레이션이라는 게 중요합니다.
아이폰 앱을 만드는 게 아니라
시뮬레이션을 만드는 거죠.
다양한 펜, 연필, 브러시의
크기, 강도, 색상 등을 위한
슬라이더와 선택기가 있고,
사각형 도구, 지우개, 채우기 도구 등
여러 도구들도 있습니다.
구상 과정을 거친 다음
파이썬 코드가 있습니다. 펜이 있고,
설정을 클릭하면 색상을 변경할 수 있습니다.
초록색으로 바꿀 수 있고, 설정 버튼이
약간 어색해 보이긴 하지만,
펜의 크기도 바로 여기서 변경할 수 있습니다.
지우개도 있고, 이것은
윈도우에 기본으로 있는 그림판과 비슷해 보입니다.
사각형 도구가 있고,
채우기 도구도 있습니다. 초기화도 가능하고,
사각형 외곽선 모드도 있습니다.
크기도 이렇게 줄일 수 있고,
저장도 할 수 있습니다.
파일은 PNG 형식으로 저장됩니다.
이것은 정말 멋진 것 같습니다.
특히 만드는 데 아주 적은
노력만 들었다는 점이 인상적입니다.
마지막으로, 가장 멋진 것인데,
16분 길이의 뽀빠이 영상을 다운로드했습니다.
옛날 만화 뽀빠이를 아신다면,
매우 구체적인 질문들을 해보았습니다.
먼저 영상이 어떤 것인지
보여드리겠습니다. 여기 뽀빠이가 있습니다.
아주 옛날 만화입니다. 영상을 살펴보면
뽀빠이의 악당이 나옵니다.
이름은 잘 모르겠네요.
죄송합니다. 뽀빠이를 안 봤거든요.
제 시대보다 좀 이전이에요.
꽤 상세한 만화입니다. 16분이나 되는
긴 영상입니다. 이것을
Gemini 2.5 Flash에 직접 업로드했습니다.
16분짜리 영상에 283,000 토큰이 사용되었고,
100만 토큰을 받았으니,
거의 1시간 분량의 영상을
Gemini 2.5에 넣을 수 있다고 볼 수 있죠.
첫 번째로 물어본 것은
8분 즈음에 뽀빠이가
사자들과 싸우는 장면이 있는데, 사자가 몇 마리냐는 것입니다.
직접 영상을 읽어보면,
8분 부근에 사자가 두 마리 있습니다.
꽤 간단하죠. 하지만 생각해보세요.
1년 전만 해도, 아니 1년 반 전만 해도
16분이나 되는 영상, 심지어
30분, 45분짜리 영상에 대해
아무 질문이나 할 수 있다는 게 상상이나 됐을까요?
있을 수 없는 일이었죠. 하지만 이제는 가능합니다.
22초 동안 생각한 후, 8분 17초 즈음에
뽀빠이가 신밧드의 섬에 있는
동굴 입구에서 사자 두 마리와
싸운다고 답했습니다. 제가 물어본 것보다
더 많은 정보를 주었지만,
괜찮습니다. 다음으로, 영상 첫 부분에
뱀 두 마리가 감긴 표지판이 있는데
뭐라고 쓰여 있냐고 물었습니다.
34초 동안 생각한 후, 43초 부근에
'신밧드의 섬 조심하시오'라고 되어 있고
해골과 뼈가 그려져 있다고 했습니다.
신밧드... 확인해보죠.
'신밧드의 섬 조심하시오'가 있고,
뱀 두 마리가 감겨있고, 해골과 뼈가 있네요.
정확히 맞췄습니다. 더 어려운 걸 해볼까요?
10분 즈음에 배경에
통이 하나 있는데,
통에 뭐라고 쓰여 있냐고 물었습니다. 12초 동안
생각했습니다. 10분 부근으로 가보면,
여기 통이 있네요. XXX가 있고
'벅샷'이라고 쓰여 있지만, 대부분은
잘려있습니다. 실제로 '벅샷'이라고
쓰여 있긴 한데,
전체 텍스트를 보려면
영상을 자세히 살펴봐야 했을 텐데요.
물론 XX 벅샷이라고 정확히 맞췄습니다.
Gemini 2.5 Flash는 정말 놀랍습니다.
Gemini 2.5 Pro만큼은 아니지만 거의 비슷한 수준이고,
엄청나게 빠르고 훨씬 저렴합니다.
게다가 이런 최첨단 모델들은
대부분의 사용 사례에서는
필요하지 않습니다. 따라서
2.5 Pro와 거의 비슷한 성능을 내면서
훨씬 저렴한 비용으로
더 빠른 속도를 제공하는 모델이 있다는 것은
구글이 얼마나 잘 실행하고 있는지를
모든 것을 말해줍니다.
이 영상이 마음에 드셨다면
좋아요와 구독 부탁드립니다.
감사합니다.