구글, Gemini 2.5 Pro IO Edition 업데이트 공개 – 놀라운 성능

채널 아이콘
Matthew Berman 구독자 419,000명

요약

이번 영상에서는 구글이 5월 6일 공개한 Gemini 2.5 Pro IO Edition의 새로운 기능과 성능을 집중적으로 살펴봅니다. 발표자는 20×20 루빅스 큐브 해결부터 다양한 웹 앱·게임·시뮬레이션 데모까지 직접 테스트하며 모델의 우수성을 증명합니다. 특히 대화형 웹 애플리케이션 지원 강화, 백만 토큰 컨텍스트 윈도우, 멀티모달 입력, 도구 호출 개선 등 코딩 역량이 획기적으로 향상된 점을 강조합니다. 마지막에는 모델 능력을 검증할 퍼즐 문제까지 제시하며 현 AI 최강자임을 확인합니다.

주요 키워드

Gemini 2.5 Pro IO Edition Interactive Web Apps LM Arena 벤치마크 백만 토큰 컨텍스트 윈도우 멀티모달 입력 도구 호출(Tool Calling) Three.js Box AI Agentic 코딩

하이라이트

  • 🚀 Gemini 2.5 Pro IO Edition은 20×20 루빅스 큐브도 단번에 해결해 인상적인 계산 능력을 입증했습니다.
  • 🌐 웹 앱 구축에 최적화된 기능이 대폭 강화돼 Three.js를 활용한 대화형 UI 생성이 손쉬워졌습니다.
  • 📊 LM Arena 점수가 1437에서 1448로, Web Dev Arena는 1272에서 1419로 각각 대폭 상승하며 벤치마크 최상위 자리를 지켰습니다.
  • 💸 입력 토큰 당 $2.50, 출력 토큰 당 $15의 저렴한 비용으로 동급 최강 AI를 경제적으로 활용할 수 있습니다.
  • 🎮 Three.js 기반 비행 시뮬레이터, Python Pygame 스네이크 게임, HTML5 타워 디펜스까지 폭넓은 데모를 단 한번의 프롬프트로 생성했습니다.
  • 📷 동영상 업로드만으로 원본 입자 시뮬레이션을 완벽히 재현하고, 추가 요구사항(마우스 회전·슬라이더)까지 유연하게 대응했습니다.
  • 🏗️ Lego 빌딩 시뮬레이터와 드로잉 앱, Google AI Studio 클론 프론트엔드를 단일 HTML 파일로 제로샷 생성해냅니다.
  • 🧩 마지막 퍼즐 문제로 제시된 4×5×3 큐브에서 빠진 14개 조각을 정확히 찾아내며 비주얼 이해력까지 뛰어남을 보여줍니다.

용어 설명

Gemini 2.5 Pro IO Edition

구글의 최신 멀티모달 AI 모델로, 대규모 컨텍스트 윈도우와 향상된 코딩 역량을 갖춤

LM Arena

언어 모델 성능을 종합 평가하는 벤치마크 플랫폼

Web Dev Arena

웹 개발 관련 AI 성능을 평가하는 전용 벤치마크

컨텍스트 윈도우(Context Window)

AI가 기억하고 처리할 수 있는 입력 토큰의 최대 길이

멀티모달(Multimodal) 입력

텍스트뿐 아니라 이미지·비디오·오디오 등 복합 데이터를 동시에 처리하는 기능

함수 호출(Function Calling)

모델이 외부 API나 사용자 정의 함수를 직접 호출해 작업을 수행하는 기법

도구 호출(Tool Calling)

모델이 코드 에디터·디버거 등 외부 도구를 연동해 사용하는 기능

Agentic 코딩

AI가 스스로 애플리케이션 전체를 설계·구현·조정하는 자동화 코딩 워크플로

[00:00:00] 소개 및 루빅스 큐브 시연

영상 오프닝에서 구글이 Gemini 2.5 Pro IO Edition을 발표했음을 알리고, 10×10에 이어 20×20 완전 스크램블 루빅스 큐브를 직접 풀어 모델의 즉각적인 계산 능력을 보여줍니다.

[00:01:12] 업데이트 개요 및 IO Edition 특징

새 버전은 Google I/O Preview용으로 웹 앱 제작에 초점을 맞췄으며, 강화된 도구 호출, 코드 변환·편집 성능, 백만 토큰 컨텍스트 윈도우, 멀티모달 입력·출력 등을 탑재했습니다.

[00:02:09] 벤치마크 성능 비교

LM Arena에서 1448점을 기록(이전 대비 +11), Web Dev Arena에서 1419점(+147)을 달성하며 AI 모델 최상위권을 유지합니다. GPQA·MMLU 등 주요 벤치마크에서도 동급 성능을 보입니다.

[00:03:48] 비용 경쟁력

입력 토큰당 $2.50, 출력 토큰당 $15로 GPT-3.5 대비 3∼4배 저렴한 가격을 제시합니다. Deepseek R1을 제외하면 가장 경제적인 프리미엄 모델입니다.

[00:04:36] Box AI 통합 소개

스폰서 Box AI를 통해 문서를 저장·검색·자동화 워크플로 구축까지 지원합니다. 간편한 API로 RAG 파이프라인을 처리하며, 엔터프라이즈급 보안·컴플라이언스를 제공합니다.

[00:05:48] 웹 앱 데모 I: 3D 플로팅 아일랜드 & Galton Board

Three.js로 구현한 저폴리 플로팅 아일랜드에 광원·애니메이션·슬라이더 UI를 추가했습니다. Matter.js 기반 Galton 보드 시뮬레이션도 인터랙티브 슬라이더로 제어합니다.

[00:09:44] 웹 앱 데모 II: 비행 시뮬레이터 & 스네이크 게임

세 번째인 flight simulator는 3인칭 카메라·간단 조작이 적용된 작은 비행기 시뮬레이터를, Python Pygame 기반 스네이크 게임에는 다채로운 파티클·전력 아이템 효과를 삽입했습니다.

[00:11:54] 시각 효과·물리 엔진: 입자 시뮬레이션 & Lego 빌딩

36초짜리 입자 시뮬레이션 비디오를 업로드해 동일한 Three.js 버전을 단일 파일로 재생성하고, 3D Lego 빌딩 환경에 충돌 감지·스냅 시스템·음향 효과를 더했습니다.

[00:15:20] 레트로 게임 & 타워 디펜스

90년대 Tamagotchi 키체인 게임을 Python으로 재현해 진화·수면·배설 메커니즘을 구현하고, HTML5 Canvas 기반 타워 디펜스에서 다섯 가지 타워 타입·범위 프리뷰 등을 실시간으로 체험합니다.

[00:22:07] 웹 앱 제작: 드로잉 앱 & AI Studio 클론

매우 간단한 스케치 UI 이미지를 제시하고 드로잉 앱을 한 번에 생성했으며, Google AI Studio 프론트엔드 스크린샷만으로도 거의 완전한 클론을 단일 HTML 파일로 무리 없이 만들어냈습니다.

[00:24:09] 최종 퍼즐 & 마무리

4×5×3 큐브 총 60개 중 결손된 14개를 정확히 찾아내는 퍼즐을 통해 멀티모달 사고력을 검증하고, 시청자에게 의견과 구독 요청으로 영상을 마무리합니다.