[00:00]
구글이 올해 열심히 작업해왔고
[00:03]
오늘 드디어
[00:04]
제미나이 2.5 플래시 프리뷰를 공개했는데요
[00:07]
정말 훌륭한 올라운더 모델이라고 할 수 있습니다
[00:10]
하지만 이 모델이 돋보이는 점은 성능이 아닌
[00:13]
가격 정책에 있습니다
[00:15]
낮은 지연시간과
[00:17]
비용 효율적인 워크호스 모델로 포지셔닝되었죠
[00:20]
제미나이 2.5 플래시는 대용량
[00:24]
실시간 애플리케이션을 위해 설계되었으며
[00:26]
챗봇, 분석, 에이전트 워크플로우에서
[00:29]
강력한 잠재력을 보여줍니다
[00:32]
고급 추론에 강점이 있는
[00:34]
제미나이 2.5 시리즈를 기반으로 하며
[00:37]
제미나이 2.5 프로와 같은
[00:38]
대형 모델에 버금가는 품질을 제공하면서도
[00:41]
더 빠른 속도와 획기적으로 낮은
[00:44]
비용을 자랑합니다. AI 분야에서 큰 진전이죠
[00:46]
여기서 중요한 점은 두 가지 가격대가 있다는 겁니다
[00:49]
사고 모드의 경우
[00:51]
입력 토큰 백만 개당 15센트
[00:56]
출력 토큰 백만 개당 3.5달러를 지불하는데
[00:59]
이 수준의 성능에 비하면 매우 저렴합니다
[01:01]
두 번째로 비사고 모드가 있는데
[01:03]
이 모드에서는
[01:05]
입력 토큰 백만 개당 15센트,
[01:07]
출력 토큰 백만 개당
[01:10]
놀랍게도 단 60센트밖에 들지 않습니다
[01:13]
이는 정말 믿기 힘들 정도로 저렴한 가격이며
[01:15]
특히 실시간 애플리케이션에 적합합니다
[01:18]
구글은 플래시를
[01:20]
차세대 다양한 종류의
[01:22]
에이전트 워크플로우와 챗봇,
[01:24]
그리고 이 채널에서 본 모든 것들을
[01:26]
구동하기 위한 것임을 분명히 하고 있습니다
[01:29]
또한 좋은 점은 구글 팀이
[01:31]
이 모델의 일일 요청 한도를
[01:33]
늘렸다는 것입니다
[01:36]
무료 티어에서도
[01:38]
하루 500개의 요청이 가능한데
[01:41]
이는 이전보다
[01:43]
훨씬 많은 양입니다
[01:45]
벤치마크 점수에 관해서는
[01:47]
크기와 가격 대비
[01:50]
매우 강력한 모델입니다
[01:53]
컨텍스트 윈도우는
[01:55]
100만 토큰이며
[01:57]
다른 많은 모델들과 비교했을 때
[01:59]
OpenAI의 04 Mini
[02:02]
Claude 3.7 Sonnet, Gra 3 Beta,
[02:05]
Deepseek R1과 비교해도 좋은 성능을 보입니다
[02:08]
대부분의 경우 더 뛰어난 성능을 보이지만
[02:11]
유일하게 뒤처지는 부분은
[02:14]
라이브 코드벤치입니다
[02:16]
하지만 다른 분야에서는
[02:18]
다국어 장문 처리와
[02:21]
수학, 과학 분야에서
[02:24]
다른 모델들을 능가합니다
[02:26]
코딩에서는 약간 뒤처지지만
[02:29]
가격을 고려하면 Claude 3.7 Sonnet의
[02:31]
훌륭한 대안이 될 수 있습니다
[02:34]
좋은 점은 이제
[02:36]
구글 AI 스튜디오에서 이 모델을 사용할 수 있다는 것입니다
[02:38]
드롭다운 메뉴를 클릭하면
[02:40]
새로운 2.5 플래시 프리뷰를
[02:42]
볼 수 있고, 선택하면
[02:44]
두 가지 모드 옵션이 있습니다
[02:47]
사고 모드를 사용하거나
[02:48]
사고 예산을 설정하여
[02:50]
실제 모드를 사용하지 않고
[02:51]
더 저렴한 옵션을 선택할 수 있습니다
[02:54]
이제 추론부터 프론트엔드까지
[02:56]
다양한 프롬프트를
[02:57]
살펴보도록 하겠습니다
[02:59]
수학까지 다양한 분야를 평가해보겠습니다.
[03:01]
이 모델을 여러 벤치마크 테스트로
[03:03]
평가해서 성능을 확인해보겠습니다.
[03:04]
어제 우리는 03 모델을 살펴보았는데
[03:06]
그 모델이 꽤 괜찮은 성능을 보여주었고
[03:09]
다른 메트릭 점수들을 능가했습니다.
[03:12]
이제 Gemini 2 플래시가
[03:14]
이것을 해낼 수 있는지 확인해보겠습니다.
[03:16]
먼저 현대적인 노트 앱의
[03:18]
프론트엔드를 만들어보겠습니다.
[03:20]
스티커 노트를 추가할 수 있게 할 건데,
[03:22]
이를 통해 사용자 인터페이스 구축,
[03:24]
UI/UX 디자인 로직 처리 능력을
[03:26]
평가할 수 있습니다.
[03:28]
어떤 결과가 나오는지 확인해보죠.
[03:30]
생성이 완료되면 파일을 열어보겠습니다.
[03:33]
자, 첫 번째 스티커 노트 앱이
[03:35]
생성되었네요.
[03:37]
정말 멋지게 만들어졌습니다.
[03:39]
기능도 제대로 작동하는데요,
[03:41]
여러 종류의 노트를 추가할 수 있고
[03:43]
드래그 앤 드롭 기능이 있으며
[03:45]
다양한 색상도 선택할 수 있습니다.
[03:47]
특히 마음에 드는 건
[03:49]
노트 잠금 기능을 추가한 거예요.
[03:51]
노트의 잠금을 해제하고
[03:54]
'유튜브 영상 만들기'와 같은
[03:57]
내용을 작성할 수 있습니다.
[03:59]
그리고 다시 잠그고 이동시킬 수 있죠.
[04:02]
물론 드롭다운 메뉴의
[04:04]
색상 텍스트 같은 작은 부분들은
[04:08]
수정이 필요하지만,
[04:10]
전반적으로 고급 스티커 노트 앱을
[04:12]
잘 생성했습니다.
[04:14]
기능성과 프론트엔드 모두
[04:16]
훌륭하게 구현됐네요.
[04:18]
이건 확실히 합격입니다.
[04:20]
다음으로는 콘웨이의 생명 게임을
[04:22]
파이썬으로 구현해보겠습니다.
[04:26]
이건 코딩 시뮬레이션 터미널 애플리케이션
[04:28]
카테고리에 속하는데요,
[04:31]
모델이 파이썬 스크립트와
[04:33]
알고리즘 설계를 얼마나 잘 처리하는지
[04:35]
확인해보려고 합니다.
[04:38]
코드가 파이썬 파일로 출력되었네요.
[04:40]
실행해보도록 하겠습니다.
[04:42]
여기서 특이한 점은 사용 가능한
[04:44]
패턴들이 생성된다는 건데요,
[04:46]
대부분의 모델에서는 보지 못했던 기능입니다.
[04:49]
글라이더 패턴을 생성하고
[04:51]
엔터를 눌러보겠습니다.
[04:53]
원하는 세대 수를 추가할 수 있는데
[04:54]
100을 입력해보죠.
[04:57]
그러면 터미널에서
[04:58]
시뮬레이션이 실행됩니다.
[05:01]
정말 놀랍네요.
[05:03]
이것도 확실히 합격입니다.
[05:07]
이제 여러분이 기다리던 프롬프트인데요,
[05:10]
코드 실행을 활성화하고
[05:12]
나비 모양의 SVG 코드를
[05:14]
생성해보도록 하겠습니다.
[05:17]
나비는 대칭이어야 하는데,
[05:19]
이건 대부분의 모델들이
[05:21]
어려워하는 프롬프트입니다.
[05:23]
이를 통해 모델의
[05:25]
공간 추론 능력, 대칭 로직,
[05:28]
SVG 문법 이해도와
[05:30]
기하학적 지식을 평가할 수 있습니다.
[05:32]
대부분의 모델이 완성하기 어려운
[05:35]
과제라는 걸 알고 있죠.
[05:37]
여기서는 모델이 공간 추론,
[05:40]
대칭 로직, SVG 문법,
[05:42]
기하학에 대해 얼마나 잘 이해하는지
[05:47]
자, 실제로 어떤 결과가 나오는지 살펴보겠습니다.
[05:48]
답변을 생성할 때 주목할 만한 점은,
[05:50]
답변이 생성되는 과정에서
[05:52]
모델의 추론 과정, 계획, 그리고
[05:54]
구조화 방식을 확인할 수 있다는 것입니다.
[05:56]
이제 답변이 생성되었으니
[05:59]
이 코드를 복사해서
[06:00]
어떤 결과물이 나왔는지 확인해보겠습니다.
[06:02]
시작하기 전에 한 가지 말씀드리고 싶은데,
[06:04]
월드 오브 AI 뉴스레터를
[06:06]
꼭 구독하시길 추천드립니다.
[06:08]
매주 다양한 내용의
[06:10]
뉴스레터를 발행하고 있습니다.
[06:13]
이를 통해 AI 분야의
[06:15]
최신 동향을 쉽게
[06:17]
파악하실 수 있습니다. 완전 무료이니
[06:19]
꼭 구독해 보시기 바랍니다.
[06:21]
여기 온라인 SVG 뷰어가 있습니다.
[06:23]
코드를 붙여넣어 보겠습니다. 자, 보시죠.
[06:25]
놀랍게도 나비 모양을 제대로 구현했네요.
[06:27]
색상 구성이 아주 매력적이진 않지만
[06:29]
나비 날개의 기능적인 부분은
[06:32]
정확하게 구현했습니다.
[06:34]
이는 기존의 Gemini 2.5 Pro가
[06:36]
생성할 수 있었던 것과 비슷한 수준입니다.
[06:39]
전반적으로 이런 결과물을
[06:41]
만들어낼 수 있다는 게 놀랍습니다.
[06:42]
지금까지 세 가지 다른 생성 결과를 봤는데
[06:45]
모두 인상적인 답변을 보여줬습니다.
[06:47]
다음은 다른 프롬프트입니다.
[06:48]
"한 기차가 A도시를 오전 9시에 출발하여
[06:51]
시속 60km로 달리고 있습니다.
[06:54]
다른 기차는 B도시를 오전 11시에 출발해
[06:56]
A도시를 향해 시속 90km로 달립니다.
[06:59]
A도시와 B도시 사이의 거리는 450km입니다.
[07:01]
두 기차는 몇 시에 만나게 될까요?"라는
[07:04]
문제를 제시했습니다.
[07:07]
이 프롬프트는 기본적으로
[07:09]
속도, 거리, 시간의 관계를 이해하고
[07:11]
대수 방정식을 푸는 능력을 테스트합니다.
[07:14]
모델이 보여준 문제 해결 단계를 보면
[07:16]
정답인 오후 1시 12분을
[07:18]
정확하게 도출해냈습니다.
[07:20]
이는 확실히 통과로 평가할 수 있습니다.
[07:23]
다음은 창의적 코딩 프롬프트입니다.
[07:26]
여기서는 제가 0에서 9까지의 숫자 키로
[07:29]
채널을 변경할 수 있는
[07:30]
TV를 코딩해달라고 요청했습니다.
[07:32]
p5.js 스케치로 구현해달라고 했죠.
[07:36]
이는 기본적으로 창의적 코딩 프롬프트로,
[07:39]
모델이 인터랙티브 프로그래밍과
[07:41]
p5.js 캔버스 조작을 얼마나 잘
[07:43]
이해하고 있는지 테스트합니다.
[07:45]
어떤 결과물이 나오는지 확인해보겠습니다.
[07:48]
자, 결과가 나왔네요.
[07:50]
이게 모델이 생성한 결과물입니다.
[07:52]
제가 보기에는 꽤 괜찮아 보이고,
[07:54]
이 TV 앱에서
[07:56]
다양한 창의적인 생성물을
[07:58]
만들어낼 수 있었습니다.
[08:00]
보시다시피 다양한 종류의 결과물을
[08:03]
출력할 수 있었죠.
[08:05]
이것도 확실히 통과입니다.
[08:07]
다음 프롬프트는 독해력과
[08:09]
과학적 추론에 관한 것입니다.
[08:11]
기후 모델링 논문의 세 섹션을 읽고
[08:13]
하이브리드 모델이 왜 더 나은지
[08:15]
설명하는 것이 과제였습니다.
[08:17]
모델의 접근 방식과 답변 생성 능력을
[08:20]
테스트해보고자 했죠.
[08:22]
보시다시피 모델이 매우 빠르게
[08:24]
응답을 생성했고,
[08:26]
답변을 생성하는 과정에서
[08:30]
전체 논문을 읽고
[08:33]
세 가지 유형의 단락에 집중하여
[08:35]
여러 섹션의 정보를 종합하고
[08:38]
추론을 도출했으며
[08:39]
이렇게 명확한 답변을 제시했습니다.
[08:42]
보시다시피 이 모델이
[08:44]
생성한 답변의 품질이
[08:46]
상당히 합리적입니다.
[08:48]
실제로 답변을 읽어보면
[08:50]
확실히 유효한 답변이기 때문에
[08:52]
이 테스트는 통과라고 할 수 있습니다. 마지막 프롬프트는
[08:55]
연역적 추론 프롬프트입니다.
[08:57]
기본적으로 5명의 용의자가 있는
[08:59]
탐정 사건이며 서로 상충되는
[09:01]
진술이 있습니다. 단 한 명만이
[09:03]
진실을 말하고 있습니다. 누가 범인일까요?
[09:06]
여기서 우리는 모델의
[09:07]
조건부 진술 처리
[09:09]
능력을 평가하고 있습니다. 한 사람은
[09:11]
"다른 사람이 범인이다"라고 말하고
[09:12]
다른 사람은 "나는 범인이 아니다"라고 하며
[09:14]
또 다른 사람은 "나는
[09:15]
현장에 없었다"고 말합니다.
[09:17]
우리는 모델이
[09:19]
주어진 여러 제약 조건을 바탕으로
[09:21]
논리적으로
[09:22]
진실을 추론할 수 있는지 테스트합니다.
[09:24]
최종적으로 데이비드가
[09:26]
범인이라는 정확한 답을 도출했고
[09:29]
이는 실제 답과 100% 일치합니다.
[09:33]
또한 모든 가능성에 대해
[09:35]
잘 설명하고 있습니다. 따라서 이 마지막
[09:37]
프롬프트도 확실히 통과입니다.
[09:39]
이 영상이 마음에 드셨다면
[09:41]
채널을 지원해주실 수 있습니다.
[09:43]
아래 슈퍼 땡스 옵션을 통해
[09:45]
후원하실 수 있고, 또는
[09:48]
저희 프라이빗 디스코드에 가입하시면
[09:50]
다양한 AI 도구 구독 서비스를
[09:52]
매월 무료로 이용하실 수 있습니다.
[09:54]
거기에 일간 AI 뉴스와 독점 콘텐츠도 제공되며
[09:57]
더 많은 혜택이 있습니다. 이처럼
[09:59]
우리는 다양한 벤치마크
[10:01]
점수를 테스트하고 평가했습니다.
[10:04]
이 모델은 모든 테스트를 통과했는데
[10:06]
이는 정말 인상적인 결과입니다.
[10:09]
제 의견으로는 이 모델을
[10:11]
더욱 인상적으로 만드는 것은
[10:13]
가격 구조입니다. 이것이
[10:15]
이 모델을 사용하고 싶은 이유입니다.
[10:17]
저렴한 가격으로 다른
[10:20]
최첨단 모델들과
[10:21]
동등한 성능을
[10:22]
얻을 수 있습니다. Gemini나
[10:25]
Gemini 2.0 Flash, Gemini 2.5 Pro,
[10:29]
그리고 벤치마크 시트에서 본
[10:31]
Rock 3나
[10:33]
Claw 3.7 Sonnet과 같은 다른 모델들과 비교해도 뒤지지 않습니다.
[10:35]
여러분, 오늘 영상이
[10:36]
도움이 되었길 바랍니다.
[10:38]
두 번째 채널도 구독하시고
[10:39]
뉴스레터도 팔로우해 주세요.
[10:41]
디스코드 가입과 트위터 팔로우도 부탁드립니다.
[10:43]
마지막으로 구독과
[10:44]
알림 설정, 좋아요 눌러주시고
[10:46]
이전 영상들도
[10:47]
확인해 주세요.
[10:48]
최신 AI 소식을
[10:50]
놓치지 않으실 수 있습니다.
[10:51]
그럼 여러분, 좋은 하루 보내시고
[10:53]
긍정적인 에너지 전파하세요.
[10:54]
곧 다시 만나요. 안녕히 계세요!