구글, Gemini 2.5 Pro IO Edition 업데이트 공개 – 놀라운 성능

채널 아이콘
Matthew Berman 구독자 419,000명

요약

이번 영상에서는 구글이 5월 6일 공개한 Gemini 2.5 Pro IO Edition의 새로운 기능과 성능을 집중적으로 살펴봅니다. 발표자는 20×20 루빅스 큐브 해결부터 다양한 웹 앱·게임·시뮬레이션 데모까지 직접 테스트하며 모델의 우수성을 증명합니다. 특히 대화형 웹 애플리케이션 지원 강화, 백만 토큰 컨텍스트 윈도우, 멀티모달 입력, 도구 호출 개선 등 코딩 역량이 획기적으로 향상된 점을 강조합니다. 마지막에는 모델 능력을 검증할 퍼즐 문제까지 제시하며 현 AI 최강자임을 확인합니다.

주요 키워드

Gemini 2.5 Pro IO Edition Interactive Web Apps LM Arena 벤치마크 백만 토큰 컨텍스트 윈도우 멀티모달 입력 도구 호출(Tool Calling) Three.js Box AI Agentic 코딩

하이라이트

  • 🚀 Gemini 2.5 Pro IO Edition은 20×20 루빅스 큐브도 단번에 해결해 인상적인 계산 능력을 입증했습니다.
  • 🌐 웹 앱 구축에 최적화된 기능이 대폭 강화돼 Three.js를 활용한 대화형 UI 생성이 손쉬워졌습니다.
  • 📊 LM Arena 점수가 1437에서 1448로, Web Dev Arena는 1272에서 1419로 각각 대폭 상승하며 벤치마크 최상위 자리를 지켰습니다.
  • 💸 입력 토큰 당 $2.50, 출력 토큰 당 $15의 저렴한 비용으로 동급 최강 AI를 경제적으로 활용할 수 있습니다.
  • 🎮 Three.js 기반 비행 시뮬레이터, Python Pygame 스네이크 게임, HTML5 타워 디펜스까지 폭넓은 데모를 단 한번의 프롬프트로 생성했습니다.
  • 📷 동영상 업로드만으로 원본 입자 시뮬레이션을 완벽히 재현하고, 추가 요구사항(마우스 회전·슬라이더)까지 유연하게 대응했습니다.
  • 🏗️ Lego 빌딩 시뮬레이터와 드로잉 앱, Google AI Studio 클론 프론트엔드를 단일 HTML 파일로 제로샷 생성해냅니다.
  • 🧩 마지막 퍼즐 문제로 제시된 4×5×3 큐브에서 빠진 14개 조각을 정확히 찾아내며 비주얼 이해력까지 뛰어남을 보여줍니다.

용어 설명

Gemini 2.5 Pro IO Edition

구글의 최신 멀티모달 AI 모델로, 대규모 컨텍스트 윈도우와 향상된 코딩 역량을 갖춤

LM Arena

언어 모델 성능을 종합 평가하는 벤치마크 플랫폼

Web Dev Arena

웹 개발 관련 AI 성능을 평가하는 전용 벤치마크

컨텍스트 윈도우(Context Window)

AI가 기억하고 처리할 수 있는 입력 토큰의 최대 길이

멀티모달(Multimodal) 입력

텍스트뿐 아니라 이미지·비디오·오디오 등 복합 데이터를 동시에 처리하는 기능

함수 호출(Function Calling)

모델이 외부 API나 사용자 정의 함수를 직접 호출해 작업을 수행하는 기법

도구 호출(Tool Calling)

모델이 코드 에디터·디버거 등 외부 도구를 연동해 사용하는 기능

Agentic 코딩

AI가 스스로 애플리케이션 전체를 설계·구현·조정하는 자동화 코딩 워크플로

[00:00:00] 소개 및 루빅스 큐브 시연

영상 오프닝에서 구글이 Gemini 2.5 Pro IO Edition을 발표했음을 알리고, 10×10에 이어 20×20 완전 스크램블 루빅스 큐브를 직접 풀어 모델의 즉각적인 계산 능력을 보여줍니다.

Google이 Gemini 2.5 Pro IO Edition을 새로 업데이트했으며, 이는 지금까지 만든 최고의 모델로 평가받고 있습니다.
루빅스 큐브 3x3 테스트에서는 회전, 확대/축소 등 새로운 기능이 추가되었으며, 12번의 움직임으로 큐브를 섞고 빠르게 해결하는 데 성공했습니다.
20x20 루빅스 큐브 도전을 시작했으며, 이는 이전 10x10보다 훨씬 복잡한 과제입니다.
새 버전은 웹 앱 개발에 중점을 두고 있으며, Google IO 컨퍼런스를 앞두고 미리 공개되었습니다.
[00:01:12] 업데이트 개요 및 IO Edition 특징

새 버전은 Google I/O Preview용으로 웹 앱 제작에 초점을 맞췄으며, 강화된 도구 호출, 코드 변환·편집 성능, 백만 토큰 컨텍스트 윈도우, 멀티모달 입력·출력 등을 탑재했습니다.

Gemini 2.5 Pro는 전반적인 코딩에서 최고의 성능을 보여주지만, 이전에는 에이전틱 코딩에서 Claude 3.7이 더 우수했습니다.
[00:02:09] 벤치마크 성능 비교

LM Arena에서 1448점을 기록(이전 대비 +11), Web Dev Arena에서 1419점(+147)을 달성하며 AI 모델 최상위권을 유지합니다. GPQA·MMLU 등 주요 벤치마크에서도 동급 성능을 보입니다.

100만 토큰의 컨텍스트 윈도우를 지원하며, LM Arena 점수가 1437점에서 1448점으로 상승하는 등 큰 성능 향상을 보여주고 있습니다.
Gemini 2.5 Pro의 점수가 147점 상승하여 1419점을 기록했으며, 20x20 큐브 문제는 계속 진행 중이다.
5월 6일 Gemini 2.5 Pro의 벤치마크 결과, GPQA Diamond 83% 등 여러 지표에서 GPT-4와 비슷하거나 약간 낮은 성능을 보였다.
[00:03:48] 비용 경쟁력

입력 토큰당 $2.50, 출력 토큰당 $15로 GPT-3.5 대비 3∼4배 저렴한 가격을 제시합니다. Deepseek R1을 제외하면 가장 경제적인 프리미엄 모델입니다.

벤치마크 수치보다 중요한 것은 실제 성능으로, Gemini 2.5 Pro는 복잡한 코드 생성과 애플리케이션 개발에서 뛰어난 능력을 보여준다.
Gemini 2.5 Pro는 경쟁 모델들에 비해 훨씬 저렴한 가격(입력 토큰 백만 개당 $2.50, 출력 토큰 백만 개당 $15)을 제공한다.
[00:04:36] Box AI 통합 소개

스폰서 Box AI를 통해 문서를 저장·검색·자동화 워크플로 구축까지 지원합니다. 간편한 API로 RAG 파이프라인을 처리하며, 엔터프라이즈급 보안·컴플라이언스를 제공합니다.

20x20 루빅스 큐브 문제가 성공적으로 해결되었다.
Box AI가 Gemini 2.5 Pro IO 에디션을 도입할 예정이며, 기업용 문서 관리와 AI 기능을 통합 제공한다.
[00:05:48] 웹 앱 데모 I: 3D 플로팅 아일랜드 & Galton Board

Three.js로 구현한 저폴리 플로팅 아일랜드에 광원·애니메이션·슬라이더 UI를 추가했습니다. Matter.js 기반 Galton 보드 시뮬레이션도 인터랙티브 슬라이더로 제어합니다.

3D 부유 섬 시뮬레이션 테스트를 시작하여 HTML 파일로 동적 조명과 애니메이션이 있는 장면을 구현했다.
3D 부유 섬 시뮬레이션에서 줌인/아웃, 조명, 그림자 효과를 확인하고 다양한 설정을 조절할 수 있습니다.
섬의 흔들림 속도와 정도, 구름의 이동 속도 등을 슬라이더로 제어할 수 있으며, 각 효과가 자연스럽게 적용됩니다.
새로운 골턴 보드 시뮬레이션 프로젝트를 시작하여 HTML5 캔버스와 2D 물리 엔진을 활용한 구현을 설명합니다.
초기 구현에서 발견된 문제점(깔때기 구멍 없음)을 수정하고, 드롭 간격과 공의 개수 등을 조절할 수 있는 기능을 추가했습니다.
물리 법칙에 따른 자연스러운 시뮬레이션과 다양한 매개변수 조정 기능을 통해 정교한 골턴 보드 실험이 가능해졌습니다.
갈튼 보드 시뮬레이터의 설정을 조정하며 핀의 개수, 공의 크기, 중력 등 다양한 매개변수를 실험해봅니다.
[00:09:44] 웹 앱 데모 II: 비행 시뮬레이터 & 스네이크 게임

세 번째인 flight simulator는 3인칭 카메라·간단 조작이 적용된 작은 비행기 시뮬레이터를, Python Pygame 기반 스네이크 게임에는 다채로운 파티클·전력 아이템 효과를 삽입했습니다.

Three.js를 사용한 3D 비행 시뮬레이터 개발에 대해 설명합니다. 3인칭 시점, 기본 조작법, 환경 구성 등 주요 기능을 구현했습니다.
Pygame으로 개선된 스네이크 게임을 만들었습니다. 빛나는 흔적, 파티클 효과, 특수 능력 등 시각적으로 화려한 요소들을 추가했습니다.
스네이크 게임의 AI 구현에 대해 평가하며, AI가 플레이어와 충돌해도 게임이 끝나지 않는 문제점을 지적하고 이전 버전이 더 나았다고 평가합니다.
[00:11:54] 시각 효과·물리 엔진: 입자 시뮬레이션 & Lego 빌딩

36초짜리 입자 시뮬레이션 비디오를 업로드해 동일한 Three.js 버전을 단일 파일로 재생성하고, 3D Lego 빌딩 환경에 충돌 감지·스냅 시스템·음향 효과를 더했습니다.

Punit의 파티클 시뮬레이션을 Gemini 2.5 Pro를 통해 재현하는 과정을 설명하고, 초기에 받은 개별 파일들을 하나로 통합하고 마우스 회전 기능을 추가한 과정을 설명합니다.
완성된 파티클 시뮬레이션의 다양한 기능을 시연하며, 도형 회전, 색상 변경, 모양 변형 등의 기능을 보여줍니다.
시뮬레이션의 세부 설정을 조정할 수 있는 슬라이더 기능들을 설명하며, 파티클의 수, 크기, 변형 속도 등을 실시간으로 조절하는 것을 시연합니다.
레고 시뮬레이터 프로젝트를 소개하며, Three.js를 사용한 3D 레고 조립 시뮬레이션의 주요 기능과 기술적 요구사항을 설명합니다.
레고 시뮬레이션에서 정확한 스터드와 3D 평면을 구현하여 브릭을 배치하고 회전할 수 있습니다. 완벽하진 않지만 효과적인 레고 건설 시스템을 보여줍니다.
90년대의 인기 게임 다마고치를 파이썬으로 재현했습니다. 실시간 시계 기반으로 작동하며 가상 펫과 다양한 상호작용이 가능한 시스템을 구현했습니다.
[00:15:20] 레트로 게임 & 타워 디펜스

90년대 Tamagotchi 키체인 게임을 Python으로 재현해 진화·수면·배설 메커니즘을 구현하고, HTML5 Canvas 기반 타워 디펜스에서 다섯 가지 타워 타입·범위 프리뷰 등을 실시간으로 체험합니다.

다마고치 게임의 진화 시스템과 상태 관리를 구현했으며, 배고픔, 행복도, 훈육 등 다양한 상태를 관리할 수 있습니다.
다마고치가 어린이 단계로 진화하고, 수면 모드에서는 각종 상태가 자동으로 개선되는 것을 확인할 수 있습니다.
타마고치 게임에서 버그가 발생했지만 재시작 후 해결되었고, 똥 청소 기능이 정상적으로 작동함을 확인했습니다.
레트로 FPS 게임 프로젝트를 시작하며, 1993년 둠 게임에서 영감을 받아 Three.js를 사용한 브라우저 기반 게임을 구현하기로 했습니다.
게임의 주요 기능으로 미로형 레벨, 텍스처 처리된 환경, 조명 효과, 미니맵, 1인칭 시점 조작이 포함됩니다.
무기 시스템으로 권총과 샷건을 구현했으며, 적 AI, 탄약 시스템, 충돌 감지 등 다양한 게임 메카닉을 포함했습니다.
게임 테스트를 통해 적 처치, 탄약 관리, 이동 시스템이 정상적으로 작동함을 확인했습니다.
다음 프로젝트로 HTML5 캔버스 기반의 타워 디펜스 게임 개발을 시작하며, 다양한 타워 타입과 적 시스템을 계획했습니다.
타워 디펜스 게임의 기본 타워들을 소개하고, 각 타워의 특성과 공격 방식을 설명합니다.
게임을 시작하며 다트 타워를 배치하고 첫 라운드를 진행합니다. 기본적인 게임 시스템을 확인합니다.
얼음 타워와 스나이퍼 타워를 추가하여 게임 전략을 발전시키고, 타워들의 시너지를 확인합니다.
레이저 타워를 추가하고 게임 개발 과정에서 발생한 문제들과 해결 과정을 설명합니다.
[00:22:07] 웹 앱 제작: 드로잉 앱 & AI Studio 클론

매우 간단한 스케치 UI 이미지를 제시하고 드로잉 앱을 한 번에 생성했으며, Google AI Studio 프론트엔드 스크린샷만으로도 거의 완전한 클론을 단일 HTML 파일로 무리 없이 만들어냈습니다.

드로잉 앱 개발로 전환하여 간단한 스케치를 통해 색상, 도구, 크기 조절 기능을 구현합니다.
구글 AI 스튜디오의 프론트엔드 재현 시도에 대해 설명합니다.
AI 스튜디오 재현 시도에서 첫 시도는 실패했지만, 22초 후 매우 정확한 HTML 파일을 생성했습니다.
생성된 AI 스튜디오는 API 키 설정, 구조화된 출력, 코드 실행, 함수 호출 등 다양한 기능을 포함하고 있습니다.
새로운 챌린지로 큐브 퍼즐 문제를 소개했는데, 4x5x3 크기의 큐브에서 빠진 부분을 계산하는 문제였습니다.
[00:24:09] 최종 퍼즐 & 마무리

4×5×3 큐브 총 60개 중 결손된 14개를 정확히 찾아내는 퍼즐을 통해 멀티모달 사고력을 검증하고, 시청자에게 의견과 구독 요청으로 영상을 마무리합니다.

타임라인 정보가 없습니다.

Google이 지금까지 만든 최고의 모델인
Gemini 2.5 Pro IO Edition을
오늘 5월 6일자로 업데이트했는데,
제가 철저히 테스트해봤고
놀라운 성능을 보여드리겠습니다.
이 모델은 제가 지금까지 본 모델 중에서
가장 인상적인 코드 프로젝트들을
완벽하게 구현해낼 수 있습니다.
자, 먼저 루빅스 큐브로 시작해보죠.
이전 Gemini 2.5 Pro 버전도
한 번에 이걸 해결할 수 있었지만,
이번 새 버전에는 기능이 더 추가됐습니다.
보시다시피 회전이 가능하고,
확대/축소도 할 수 있으며,
이 모든 버튼으로 회전도 가능한데
정말 편리합니다.
물론 쉽게 풀 수도 있죠.
지난번처럼 섞기 버튼이 있는데
이전보다 더 빠르게 섞이고,
12번의 움직임으로 섞었네요. 이제 풀어볼까요?
정말 놀랍습니다. 지난번엔 10x10을 했는데,
이번에는 20x20을 해보겠습니다.
자, 큐브를 섞어보도록 하죠.
좋습니다. 자, 보세요.
완전히 섞인 20x20 큐브입니다.
엄청나게 복잡하죠. 이제 풀어보겠습니다.
시간이 좀 걸릴 테니 기다려주세요.
완성되면 보여드리겠습니다.
자, 업데이트 내용을 말씀드리죠.
이미 뛰어난 모델이었는데
이번에 정말 큰 개선이 있었거든요.
풍부한 인터랙티브 웹 앱을
업데이트된 Gemini 2.5 Pro로 만들 수 있게 됐고,
웹 앱 구축에 정말 집중했습니다.
곧 테스트 결과를 보여드리겠습니다.
이번 버전은 Gemini 2.5 Pro Preview IO
Edition이라고 불리는데,
곧 있을 Google IO 컨퍼런스 때문입니다.
Google IO는 새로운 기술을
선보이는 컨퍼런스죠.
2.5 Pro의 업데이트 버전은
특히 매력적인 인터랙티브 웹 앱 구축과
코딩 능력이 크게 향상됐습니다.
이 업데이트는 몇 주 후 Google IO에서
공개될 예정이었지만,
이 모델에 대한 엄청난 관심 때문에
개발자들이 빨리 사용해볼 수 있도록
미리 공개하기로 했습니다.
Gemini 2.5 Pro는
현존하는 최고의 코딩 모델입니다.
이건 정말 논란의 여지가 없죠.
하지만 사실 저는 Claude 3.7이
에이전틱 코딩에서는 더 낫다고 봤습니다.
전체 애플리케이션이나 게임,
시뮬레이션을 완벽하게 구현하는 면에서는
Gemini가 더 뛰어났지만,
함수 호출과 에이전트 활용 면에서는
Claude가 더 좋았죠.
하지만 이제 달라졌습니다.
새로운 2.5 Pro 버전에서는
도구 호출 기능이 크게 개선됐거든요.
이러한 개선은 코드 변환,
코드 편집,
복잡한 에이전트 워크플로우 개발 등
다른 코딩 작업에도 적용됩니다.
다른 Gemini 모델들처럼
100만 토큰의 컨텍스트 윈도우를 가지고 있는데
이건 정말 놀라운 수치죠.
비디오, 이미지, 오디오 등
거의 모든 것을 처리할 수 있습니다.
LM Arena 순위에서도
이전 2.5 Pro 버전이 1437점으로
1위였는데, 새 버전은 점수가
11점이나 상승해서 1448점이 됐습니다.
이건 작은 진전이 아니에요.
웹 개발 아레나 리더보드에서는 1272점에서
1419점으로 147점이나 상승했습니다.
20x20 큐브로 잠깐 돌아가 보면,
아직도 풀고 있네요. 잠시 후에
다시 확인해보겠습니다.
자, 이제 벤치마크를
살펴보겠습니다. 5월 6일의 Gemini 2.5 Pro 프리뷰에서
업데이트된 수치가 나왔습니다.
GPQA Diamond에서 83%를 기록했는데,
비교 가능한 모델은 OpenAI GPT-4입니다.
Amy 2024는 83%, GPT-4가 이겼고,
Ader Polyglot은 76%, GPT-4가 이겼습니다.
Sweetbench verified는 63대 69로 GPT-4가 이겼죠.
Simple QA, MMLU에서는 비슷하거나
GPT-4가 앞서고 있습니다. 하지만,
벤치마크에 대해 한 가지 말씀드리자면,
실제로는 그리 중요하지 않습니다.
제 경험상 정말 놀라운 수준의
긴 코드를 출력해 정교한 애플리케이션과
게임을 만들 수 있는 유일한 모델은
Gemini 2.5 Pro입니다. 게다가 가격이
정말 대단한데요. 구글은
최상급 프론티어 모델을 보유했을 뿐만 아니라,
이 수준의 지능을 가진 모델 중
가장 저렴합니다. 백만 토큰당 $2.50,
출력 토큰은 백만 개당 $15입니다.
GPT-4와 비교하면 입력 비용은 4배,
출력 비용은 3배 정도
차이가 납니다. 실제로
Gemini 2.5 Pro보다 저렴한 모델은
오픈소스인 Deepseek R1 뿐인데,
이는 당연한 일이죠. 자,
큐브를 다시 확인해볼까요?
오, 보세요, 방금 확인했더니
완성되었네요!
믿을 수 없네요. 마침 이 탭으로
돌아왔더니 눈앞에서
완성되었습니다. 20x20 큐브가 완전히 풀렸네요.
정말 인상적입니다. 여러분도
이 새로운 모델을 시도해보고
문서 위에 멋진 것들을
만들고 싶다면 Box AI를 써보세요.
이 영상의 스폰서인 Box는
곧 Gemini 2.5 Pro IO 에디션을
도입할 예정입니다. Box를 사용하면
모든 종류의 회사 문서를 저장하고
인공지능을 활용하여
인사이트 추출, Q&A, 자동화 생성,
지능형 워크플로우를
에이전트로 만들 수 있습니다.
사용하기 쉬운 API가 있어서
Box AI 위에 멋진 기능들을 만들 수 있고,
RAG 파이프라인 전체를 관리해주어
복잡한 것들을 신경 쓸 필요가
없습니다. Box는 11만 5천개의
기업 조직이 신뢰하고 있으며,
우리 회사를 포함해
기업급 보안, 컴플라이언스,
거버넌스를 제공합니다. Box AI를
확인해보세요. 아래에 링크를
걸어두었으니 곧 출시될 Gemini 2.5 Pro IO
에디션을 사용해보세요.
Box에 다시 한번 감사드립니다.
다음 테스트로 넘어가보죠.
3D 부유 섬 시뮬레이션을 만들어보았는데,
OpenAI의 GPT-4로 테스트했을 때는 그저 그랬습니다.
보시다시피 완벽하진 않았죠. 이제
프롬프트를 보여드리고
실제 시뮬레이션을 보여드리겠습니다.
'동적 조명과 부드러운 애니메이션이 있는
몽환적인 로우폴리 부유 섬 장면을
HTML 파일 하나로 만들어줘'라고 했더니
25초만에 생각해냈습니다.
보세요, 얼마나 잘 만들어졌는지. 구름이
둥둥 떠다니고,
큰 구름들이
뒤로 이동할 수 있고, 줌인 줌아웃도 가능합니다.
조명이 정말 잘 표현되었고
그림자도 매우 자연스럽게 나왔네요.
이제 여러 슬라이더들이 있는데,
태양 광도를 조절할 수 있습니다.
주변 조명도 조절 가능하구요.
보세요, 완벽하죠. 크리스탈
중앙의 빛나는 부분은
저기 중앙에 있는 크리스탈인데,
조정해보도록 하겠습니다.
자, 이제 근거리
안개 효과가 있는데,
안개가 많이 보이진 않지만
조명에 영향을 주고 있어요.
원거리 안개도 있습니다.
음, 큰 변화는 없네요.
섬의 흔들림 속도를 보면
이렇게 조절할 수 있습니다.
아직도 꽤 느린 편이지만
아주 느리게 또는 좀 더 빠르게
설정할 수 있죠.
섬의 흔들림 정도도 조절 가능한데,
보시면 알 수 있듯이
위아래로 크게 움직이고 있습니다.
구름 속도도 조절할 수 있어서
구름이 더 빨리 움직이네요.
최대치까지 올려보고
느리게도 해볼 수 있습니다. 정말 멋지죠.
첫 번째 출력은 훌륭했지만
저는 한 번 더 요청해서
'다양한 측면을 제어할 수 있는
슬라이더들을 추가해줘'라고 했고
방금 보여드린 모든 슬라이더가 추가됐죠.
다음은 골턴 보드 시뮬레이션입니다.
HTML 파일 하나로 골턴 보드
시뮬레이션을 만드는데
Matter.js 같은 2D 물리 엔진을 사용한
클라이언트 사이드 자바스크립트로 구현했습니다.
HTML5 캔버스에 렌더링되며
다음 기준을 충족합니다: 단일 파일이고
캔버스 크기는 500x700 정도입니다.
표준 화면에 맞게
스크롤이나 확대 없이 보입니다.
2D 강체 물리학을 활용했고,
장애물, 핀, 벽 등이 있습니다.
코드를 출력했는데
한 가지 문제가 있었어요.
처음에는 이렇게 보였는데
보시다시피 위쪽 깔때기에
구멍이 없어서 공들이
통과하지 못했죠. 그래서
한 번 더 수정이 필요했습니다.
위쪽 깔때기에 구멍이 없어서
공이 걸린다고 말했고,
슬라이더도 없다고 했죠. 자, 보세요.
골턴 보드 시뮬레이션입니다.
우리가 볼 수 있는 건 멋진 정규분포 곡선으로
공이 중앙으로 떨어질 확률과
양쪽으로 떨어질 확률을
보여줍니다. 이제 우리는
여러 슬라이더를 조절할 수 있는데,
드롭 간격을 보면, 이걸 높이면
공이 덜 자주 떨어지고
최소로 낮추면
더 많은 공이 떨어집니다.
보시다시피 공들이
걸리기도 하는데, 이건 물리 법칙대로
작동하는 거라 좋은 시뮬레이션이죠.
자, 이제 낮춰보겠습니다.
다음으로 최대 공의 개수가 있는데
이걸 줄일 수도 있죠.
이건 이번 시뮬레이션에서
사용할 총 공의 개수입니다.
통의 개수도 있고
이렇게 조절하면 초기화됩니다.
리셋해볼게요. 아래에 더 많은 통이 있는 것을
볼 수 있습니다. 이제 여기서 조정할 수 있는
핀 열의 수가 있어요. 그래서
이 모든 설정들이 확률을
변경하게 됩니다. 우리는
핀의 반지름이 있고, 또
공의 반지름, 공의 탄성이 있습니다.
자, 이제 이것들 중 몇 가지를
바꿔보고 중력도 조정해보죠.
중력이 매우 높은데, 한번
중력을 많이 낮춰서 어떻게 되는지 봅시다.
좋아요. 이제 정말 천천히 떠다니네요.
한 가지 눈에 띄는 문제점은
핀들이 서로 엇갈려 있어야 하는데
모두 서로 위에 겹쳐있다는 거예요.
그래서 시뮬레이션이 완벽하지는
않지만, 충분히 괜찮네요.
다음으로, 당연히 비행
시뮬레이터를 만들어야 했죠. HTML
파일을 작성해서 Three.js로
간단한 비행 시뮬레이터를 만듭니다. 장면에는
비행기 모델 뒤쪽과 약간 위에서
따라가는 3인칭 카메라가 있어야 합니다.
기본 도형으로 만들 수 있지만
비행기처럼 보여야 합니다. 간단한 조작으로
WD로 좌우 회전, 상하 피치를 조정하고
스페이스바로 속도를 높이고 쉬프트로
감속합니다. 중력은 필요 없고
비행기는 공중에 떠있어야 합니다. 기본적인 3D
환경으로 텍스처가 있는
지면을 추가하고,
몇 개의 간단한 건물들로 세계를 채웁니다.
비행기는 이 건물들 주위를
자유롭게 날 수 있어야 합니다.
모든 것을 하나의 HTML 파일에 유지하고
외부 3D 모델은 가져오지 마세요. 나중에
다른 테스트에서는 멋질 수 있겠지만요.
자, 이게 그 결과입니다.
정말 멋지네요. 여기에
중력을 추가하면 더 멋질 것 같아요.
스페이스바를 눌러서
가속하고 쉬프트로 감속해보죠.
잘 작동하네요. 보세요.
지면에서 반사되는
그림자가 반짝이는 게 보이죠. 네, 매우
기본적이지만 정말 멋집니다. 다음으로
당연히 스네이크 게임을 가져왔지만
단순히 스네이크 게임을 만드는 것으로는
부족합니다. 더 복잡한 버전을 원했죠.
그래서 Pygame을 사용해 파이썬으로
클래식 스네이크 게임을 만들되
독특하고 시각적으로 멋지며
보는 재미가 있는
복잡한 기능들을 추가했습니다. 기본적인
스네이크 메카닉 외에도
다이나믹한 시각 효과를 구현했죠.
뱀이 지나간 자리에 빛나는
흔적이 서서히 사라지고, 제가 이것을
설명하는 동안 이전 버전의 Gemini 2.5 Pro가
만든 것을 보여드리겠습니다.
정말 잘 만들었거든요. 그 다음
이번 버전이 만든 것도
보여드리죠. 배경은
미묘한 색상 그라데이션으로 맥동하고
음식을 먹으면 파티클
폭발 효과가 나타납니다. 여러 종류의
음식이 일시적인 능력을 부여하는데, 속도
증가, 조작 반전, 더블 비전,
시간 감속 등이 있죠. 각 음식마다 고유한
애니메이션이 있고, 뱀도 진화합니다.
자, 한번 시도해볼까요? 여기 있네요.
벽들이 있고 음식을 먹으려
하고 있습니다. AI 버전의 뱀이
우리와 대결하고 있네요. 명백히
실제로 내가 부딪혀도 게임이 끝나지 않아요.
보시다시피 그냥 통과해버리죠.
전반적으로 이전 버전이 오히려
더 나았던 것 같네요. 자, 다음으로 Punit의
파티클 시뮬레이션을 사용했는데, 제가 한 일은
영상을 다운로드해서 Gemini 2.5 Pro의
새 버전에 업로드하고
이것을 재현해달라고 요청한 것뿐이에요.
36초 길이의 영상을 업로드했고,
10,000 토큰이 사용됐어요. 이 시뮬레이션을
정확히 재현해달라고 했죠. 처음에는
여러 개의 개별 파일들을
제공해줬어요. 그래서 수정을 요청했죠.
'전부 하나의 파일로 주세요'라고 했고,
이건 AI의 잘못이 아니라
제가 명확히 지정하지 않은 거예요.
그 다음 '마우스로 도형을
회전할 수 있게 해달라'고 했더니
문제없이 추가했어요. 원래는
그 기능이 없었거든요. 마지막으로
시뮬레이션의 여러 설정을 제어할
슬라이더를 추가했어요. 최종 결과를
보여드릴게요. 자, 여기 있네요.
보시다시피 회전이 가능하고,
여러 가지 색상을 보여드릴게요.
클릭하면 다른 모양으로 변형되죠.
다른 색상들도 볼 수 있어요.
정말 멋지죠. 무지개 색상으로 해볼게요.
정말 아름답네요. 자,
하단에 슬라이더가 있는데,
파티클 수를 조절할 수 있어요.
수를 늘리면 도형을 구성하는
파티클이 더 많아지고,
줄이면 적어져요. 오히려
적은 게 더 멋진 것 같네요.
이 정도로 두죠. 파티클의
크기도 변경할 수 있어요. 보시다시피
아주 작은 파티클로 만들 수 있고
멋진 발광 효과도 있어요.
물론 크기를 최대로
키울 수도 있는데, 이렇게 하면
발광이 너무 강해져서 다시 줄여볼게요.
변형 속도도 조절할 수 있어요.
속도를 낮추면 아주 빠르게
변형되죠. 자, 도넛 모양이 됐네요.
변형 시간을 5초로 최대로 늘리면
변형하는 데 더 오래 걸리고,
여기 3D 평면이 있네요.
모든 도형을 완벽하게 구현했어요.
정말 인상적이죠. 그리고
자동 회전 속도도 있고,
물론 여기를 클릭해서
모양을 바꿀 수도 있어요. 다시
구형으로 돌아왔네요. 다음으로는 레고
시뮬레이터를 만들어볼게요. Three.js를 사용해서
인터랙티브한 레고 building 시뮬레이션을
단일 HTML 파일로 만들어보겠습니다.
사용자가 레고 브릭을 배치하고,
이동하고, 3D 환경에서 연결할 수 있도록
할 거예요. 주요 기능으로는
실제 레고 브릭과 같은 모양으로
정확한 크기, 색상,
텍스처를 구현하고, 격자 기반
스냅 시스템으로 브릭들이
제대로 연결되게 하며,
브릭들이 같은 공간을 차지하지 않도록
충돌 감지도 구현할 거예요. 브릭이
연결될 때 시각적, 청각적 피드백도
넣을 거구요. 기술적
요구사항으로는 Three.js를 사용하고,
모던 브라우저에서 작동하며,
모든 코드를 단일 HTML 파일에 담고,
성능을 최적화하며, 다양한
브릭 크기와 여러 색상을 포함할 거예요.
여기에는 정확한 스터드 등이 있습니다.
3D 평면이 있고 브릭을 선택해서
배치하면 귀여운 작은 효과음이 납니다.
자, 이제 R키로 회전하는 것은
작동하지 않네요. 그래서
그건 빠진 기능이네요. 저는
튀어나오게 할 수 있고, ESC를 누르면
회전할 수 있습니다. 보시다시피
완벽하진 않지만 정말 좋습니다.
그리고 네, 이렇게 조각을 제거할 수도
있습니다. 이제 다른 색상을
선택하고, 다른 크기도 선택해서 저기에
놓겠습니다. 1x4 플레이트가 있네요.
배치가 완벽하진 않지만
이 정도면 정말 괜찮다고
생각합니다. 네, 이렇게 되었고
저장도 할 수 있고, 이전 것을
불러올 수도 있고, 초기화도 가능합니다.
다음으로 넘어가죠. 저는 90년대 아이라서
당연히 다마고치와 함께 자랐고
다마고치를 재현하고 싶었습니다.
혹시 모르시는 분들을 위해 설명하자면
이건 작은 키체인 게임이었어요.
캐릭터가 있고 그걸
돌봐야 했죠. 먹이도 주고
청소도 해주고 그랬습니다. AI를 사용해서
사양을 만들었는데, 여기
보시는 것처럼 파이썬으로
다마고치 게임을 만들고 이 사양을
가이드라인으로 사용했습니다. 핵심 루프,
시간 기반 진행, 시뮬레이션은
실시간 시계로 작동합니다. 사용자 상호작용,
플레이어는 가상 펫과
미리 정의된 동작들을 통해 상호작용하고,
상태 업데이트, 펫의 상태는
사용자의 행동에 따라
시간이 지나면서 업데이트됩니다. 배고픔, 행복도,
훈육, 건강, 나이, 체중이 있습니다.
다마고치가 먹고
시간이 지나면서 진화하고
결국엔 죽게 됩니다. 사용자 행동으로는
놀아주기, 청소하기,
훈육하기, 치료하기, 불을 켜고 끄면서
잠들게 할 수 있습니다.
진화 단계는 아기, 어린이,
청소년, 성인, 노인이 있습니다.
행동 메커니즘으로는 펫이 자신의 욕구를
표현합니다. 자, 보여드리겠습니다.
펫 이름을 B로 하겠습니다. 이건
제 강아지 이름이에요. 자 시작합니다.
보시다시피 나이가 올라가고 있고
여기 제 다마고치가 있네요. 지금은
부화 중이에요. 아직 알 상태입니다.
5틱 정도면 부화할 것 같네요. 됐네요.
다마고치가 나왔습니다. 그리고
배고픔, 행복도, 건강, 훈육,
체중이 있습니다. 훈육이
낮네요. 그래서 훈육을
해주겠습니다. 훈육하면
행복도가 떨어지죠. 그래서 놀아
줘야 합니다. 행복도가 올라가요. 배고픔, 먹이를
주겠습니다. 자, 이제 100% 배부르네요.
훈육이 아직도 좀 낮아서
한 번 더 훈육하겠습니다.
그러자 행복도가 떨어졌네요. 몇 번
놀아주겠습니다. 보세요.
진화했네요. 이제 어린이가 됐어요. 불을
끄니까 B가 잠들었습니다.
잠자는 동안
이런 여러 상태들이
실제로 좋아지고 있어요. 재미있게도
왠일인지 지금은 응가가 없네요. 전에는
응가를 했었고 꽤
재미있게 생겼었는데, 이번엔 왠지
이번에는 안 나왔네요. 아, 알겠어요.
다시 시작했더니 이제 똥이 보이네요.
그리고 'Bose Space 청소가 필요합니다'라고 나와요.
자, 청소를 해볼게요. 됐습니다.
그리고 물론, 네, 이건 흔들리고
진동하는 이상한 똥이에요. 그리고 네,
바로 이런 모습이에요. 매우 단순한
버전이에요. 이걸 쉽게 발전시켜서
더 재미있게 만들 수 있겠죠. 자, 됐습니다.
매우 향수를 불러일으키네요. 자, 새로운 테스트가 있습니다.
프로듀서 Alex에게 감사드립니다.
이걸 생각해냈거든요. 우리는
옛날 버전의 둠 게임을 만들고 싶었어요.
HTML로 레트로 FPS 게임을요. Three.js를 사용해서
레트로 스타일의 3D 1인칭 슈팅 게임을
단일 HTML 파일로 만들어보겠습니다.
1993년 오리지널 둠에서 영감을 받았죠.
게임은 브라우저에서 완전히 실행되며
Three.js와 표준 웹 API 외에는
의존성이 없어야 합니다. 코드는
모듈이나 임베디드 외의
외부 자산을 사용하지 않아야 해요. 미로같은 레벨
구조에 텍스처가 있는 벽과 바닥,
주변 조명, 선택적 동적
조명 효과, 분위기를 위한 스카이박스나 어두운 안개
배경이 있어요. 미니맵도 있고요.
자, 이걸 기억해두세요.
포인터 잠금 컨트롤을 사용한 1인칭 카메라,
WD로 이동, 점프,
충돌 감지, 체력 시스템, 탄약
시스템이 있어요. 여러 무기가 있는데,
권총과 샷건이 있습니다. 그리고
1키와 2키로 무기를 바꿀 수
있어요. 총구 섬광도 있고, 발사도
할 수 있죠. 보시다시피 이중 일부는
구현됐고, 일부는 안 됐어요.
서로 다른 속도와 체력을 가진
여러 종류의 적들, 간단한 AI, 플레이어 추적,
발사 효과가 있어요. 자,
보여드리겠습니다. 시작합니다.
자, 여기 있네요. 보시다시피
적이 있고 제가 쏘면
아주 좋네요. 사라지고
실제로 제가 쏠 때마다 탄약이
줄어들고 자동으로 재장전도
됩니다. 움직일 수도 있고요.
오른쪽 상단의 미니맵을
보세요. 이건 정말
인상적이네요. 자, 이 녀석이
쫓아오고 있어요. 샷건으로
바꿔서
한 발 쏴줬습니다. 전 보통
마우스 반전을 쓰는데 이건 그런 게
없네요, 양해 부탁드려요. 자,
됐어요. 이건 두 발이
필요하네요. 미로에 있는 모든
적들을 처치해봅시다. 여기
또 하나 있네요. 쾅.
재장전 중이에요. 좀 느리게
움직이지만, 정말 대단하네요.
자, 마지막 적이에요.
처치해볼까요. 아, 재장전해야 해요. 도망
가야겠어요. 됐어요. 승리했습니다.
모든 적을 처치했어요. 매우
기본적인 버전이라 이것도 쉽게 발전시킬 수
있을 것 같네요. 다음은 타워 디펜스입니다.
HTML5 캔버스 기반 타워 디펜스를 만들어볼건데
체력이 1에서 10인 풍선 적들이
초록색에서 보라색으로 색상 코드화되어
구불구불한 경로를 따라갑니다. 계획 모드에서
플레이어는 다트, 캐논, 얼음, 스나이퍼, 레이저
다섯 가지 타워를 배치할 수 있고,
각각 고유한 색상 점으로 표시되며
마우스를 올리면 사거리가 보입니다. 시작을 누르면
라운드를 시작하기 위해 시작을 누르세요. 자, 다트
타워는 단일 대상에게 빠른 연속 공격을 가합니다.
캐논은 느리지만 광역 데미지를 줍니다. 얼음은 적을 감속시키고,
스나이퍼는 긴 사거리에 높은 데미지를 주며,
레이저는 시각적 레이저 라인과 함께
지속적인 빔을 발사합니다. 자, 한번 시도해볼까요?
여기 있네요. 그래픽은 매우 단순하지만
잘 작동할 거예요. 우리는
웨이브 수, 보유 금액,
그리고 남은 생명력을 볼 수 있어요. 먼저
다트 타워를 놓아볼까요?
여기에 하나 놓고, 두 번째
다트 타워를 여기에 놓겠습니다. 라운드를
시작해볼까요? 첫 라운드는 꽤 쉽네요.
적을 처치할 때마다
돈을 더 얻을 수 있어요. 이제
더 강력한 적들이
나타나고 있네요. 첫 번째 웨이브
완료! 이제 210달러가 있습니다. 얼음 타워를
여기에 추가해볼까요? 적들이
코너를 돌 때 바로 맞도록 하고,
스나이퍼 타워를
여기에 추가하겠습니다. 자,
다음 라운드를 시작해볼까요?
얼음 타워가 적들을 감속시키고
다른 타워들이 적을 처치하고 있네요.
더 강력한 적들이
등장했지만 잘 해내고 있어요.
좋아요, 완료됐습니다. 이제
꽤 멋질 것 같은 레이저 타워를
여기에 추가해보겠습니다.
그리고 두 번째 레이저 타워를
여기에 놓고, 시작
버튼을 누르겠습니다.
레이저가 발사되네요! 멋지지 않나요?
한 번에 완성된 건 아니었어요.
해결해야 할 문제들이 있었죠.
처음에는 스크린샷만 제공했는데,
경로나 라운드 시작이 안 됐어요.
콘솔 에러도 없었고요.
그게 전부였어요. 그 다음
우클릭으로 선택 해제가
가능하게 했어요. 이전에는
타워를 설치하면 다른 것을
클릭할 수 없었거든요. 이런
작은 수정들을 거쳤죠. 아마도
2-3번 정도 수정했던 것 같아요.
그리고 마침내 이
게임이 완성됐습니다. 아직도 진행 중이네요.
다음으로, 이 드로잉 앱을 위한
기본적인 스케치를 만들었습니다.
상단에 색상들이 있고,
여기 실제 스케치 영역이 있으며,
다양한 도구와 크기 옵션이 있어요.
정말 대충 그린 스케치였죠.
'이 앱을 코딩해줄 수 있나요?'라고 물었더니
정확히, 정확히 우리가 요청한 대로
만들어줬어요. 파란색, 노란색,
주황색, 빨간색도 있네요. 이제
크레용을 써볼까요? 좀 더
두꺼워졌네요. 여기
브러시도 있고 물통 도구도 있어요.
이렇게 크기도 조절할 수 있고요. 그리고
단 하나의 이미지만으로
이 모든 인터랙티브 웹 앱을 만들었어요.
다음으로, AI 스튜디오의
프론트엔드를 재현하고 싶었어요. 이
버전의 모델이 프론트엔드에
더 뛰어나다고 하더군요. 어떻게 했냐고요?
구글 AI 스튜디오의 프론트엔드를 재구현해달라고
입력하고 스크린샷을 찍었어요.
매우 메타적이죠. 13초가 걸렸고
이상한 결과가 나왔어요. 저는
구글 AI 스튜디오의 프론트엔드를 재구현해달라고
잘 작동하지 않았네요. 뭔가 이상한
점들만 표시했어요. 그래서 제가 다시
전체 HTML 파일로
다시 만들어달라고 했죠. 22초 후에
결과가 나왔는데, 꽤 정확하네요.
완벽하진 않지만,
매우 정확한 수준입니다.
API 키도 있고, 여러 설정도
조정할 수 있어요.
구조화된 출력 토글,
코드 실행, 함수 호출 기능이 있고
중지 시퀀스 추가, top P 조정,
출력 길이 변경도 가능하죠.
제로샷으로 한 번에 AI 스튜디오를
스크린샷만으로 재현한 것을 보면
10점 만점에 8점을 주겠습니다.
꽤 훌륭하죠. 하지만 제가
어떤 모델도 통과하지 못하는 테스트를
발견했어요. 온라인에서 봤는데
이 버전의 Gemini도 풀지 못했죠.
큐브를 완성하려면 몇 개가 더 필요할까요?
세어보면 이건 4x5x3 크기예요.
총 60개의 큐브가 있는 거죠.
빠진 큐브 수를
세어야 하는데, 재미있게도
저는 이미지의 질문에 대한
답을 달라고만 했어요.
질문 내용도 주지 않았는데
정답은 14개예요. 직접 세어보면 됩니다.
하나씩 설명해드릴게요.
크기를 보면, 64개의 작은 큐브라고 했는데
이미 크기를 잘못 계산했네요.
4x4x4가 아니라 4x5x3인데
20개가 없다는 답은 당연히 틀렸죠.
이게 새로운 벤치마크가 될 것 같아요.
이 문제를 풀 수 있는 모델이
아마도 최고의 모델이 될 거예요.
오늘은 여기까지입니다.
최고의 모델이 더 좋아졌네요.
여러분의 생각을 댓글로 알려주세요.
이 영상이 마음에 드셨다면
좋아요와 구독 부탁드립니다.
감사합니다.