Mistral 추론 모델, Gemini 2.5 업데이트, FLUX.1 Kontext [Max], Meta의 대규모 투자 소식

채널 아이콘
Matthew Berman 구독자 419,000명

요약

이번 영상에서는 Mistral의 초고속 reasoning 모델 Magestraw 시리즈 공개, 11 Labs의 V3 Alpha TTS와 OpenAI 음성 모드 업그레이드, Gemini 2.5 Pro 성능 개선, Google VIO Fast 출시, Meta의 Scale AI 140억 달러 투자, AI 네이티브 브라우저 경쟁, Flux One Context Max 오픈소스 텍스트-이미지 모델 등 최신 AI 동향을 다룹니다. 각 모델의 성능 지표와 주요 기능, 벤치마크 결과를 비교하며 AI 개발·활용의 현주소를 짚어봅니다. 빠른 추론 속도와 감정 표현, 거대 모델 생태계 확장, 인재 확보 경쟁 등 핵심 포인트를 명확히 정리했습니다.

주요 키워드

Magestraw Chain of Thought Quantization ELO Rating Text-to-Speech Diffusion Model Scale AI AI Agent Flux One Context Max Context Length

하이라이트

  • 🔑 Mistral이 파라미터 24억(24B) 규모 Magestraw Small과 기업용 Magestraw Medium을 공개하며 reasoning 모델 시장에 진입했습니다.
  • ⚡️ Magestraw Medium은 MATH 벤치마크에서 73.6%, 다수결(64회 시도) 기준 90%를 기록했고, Small은 70%, 동일 기준 83% 성능을 보였습니다.
  • 🌟 Chain of Thought(연쇄 사고) 기능으로 전 세계 언어·알파벳에 대응하면서 경쟁 모델 대비 10배 빠른 출력 속도를 구현했습니다.
  • 🚀 11 Labs V3 Alpha TTS는 속삭임·셰익스피어 낭독·감정이 담긴 웃음까지 가능해 AI 음성의 표현력을 한 단계 끌어올렸습니다.
  • 📌 OpenAI 음성 모드는 사람처럼 ums·stutters를 재현하고, 감정·중단 태그로 대화 스타일을 세밀하게 제어할 수 있게 업그레이드되었습니다.
  • 💥 Gemini 2.5 Pro 최신 버전은 체스 ELO 1470, WebDev Arena 1443을 기록하며 여전히 최고의 코딩 AI 모델로 자리매김했습니다.
  • ⚡️ Google VIO Fast는 V3 대비 1/5 비용·속도 향상을 이루어 텍스트→비디오 생성의 접근성을 크게 높였습니다.
  • 🚀 Meta는 Scale AI에 140억 달러를 투자해 49% 지분을 확보, Alex Wang과 함께 슈퍼 인텔리전스 팀을 꾸려 AI 인재 확보 경쟁을 가속화합니다.

용어 설명

Chain of Thought(연쇄 사고)

모델이 추론 과정을 단계별로 생성해 가독성과 정확성을 높이는 기술

Quantization(양자화)

모델 파라미터를 저비트 정수로 변환해 메모리 사용량과 연산 속도를 최적화하는 방법

ELO Rating

체스 등 경쟁력 평가에 쓰이는 점수 시스템으로, AI 모델 성능 비교 지표로도 활용됨

Text-to-Speech(TTS)

텍스트를 음성으로 변환해 자연스러운 발화를 생성하는 기술

Diffusion Model(확산 모델)

노이즈가 섞인 데이터에서 점진적으로 원본 이미지를 복원하는 과정을 통해 이미지를 생성하는 알고리즘

Data Labeling(데이터 라벨링)

AI 학습용 데이터에 주석을 달아 모델 학습의 정확도와 품질을 높이는 작업

Context Length(문맥 길이)

모델이 한 번에 처리할 수 있는 최대 입력 토큰 수를 의미하는 한계치

AI Agent

사용자 요청에 따라 작업을 자동으로 수행·조율하는 소프트웨어 에이전트

[00:00:00] Mistral 추론 모델 출시

Mistral이 24B 파라미터 기반 오픈소스 reasoning 모델 Magestraw Small과 엔터프라이즈용 Medium을 공개했습니다. MATH 벤치마크 성능과 10배 빠른 Chain of Thought 속도를 소개하며 즉시 실행 가능한 경량화 모델을 강조합니다.

이번 주 AI 업계의 주요 뉴스들을 소개하며, Mistral의 첫 번째 추론 모델 출시 소식을 전합니다. 이 모델은 오픈소스로 공개되었으며 기존 추론 모델들보다 월등히 빠른 속도를 자랑합니다.
Magistral 모델의 두 가지 버전을 설명합니다. Small 버전은 240억 매개변수의 오픈소스이고, Medium 버전은 엔터프라이즈용입니다. 소비자용 컴퓨터에서도 실행 가능한 크기로 설계되었습니다.
성능 벤치마크 결과를 공개합니다. Magistral Medium은 AMI 2024에서 73.6%, 다수결 투표로 90%를 달성했으며, Small 버전도 70%와 83%의 우수한 성능을 보였습니다. 전 세계 언어를 지원하며 경쟁 모델보다 10배 빠릅니다.
실제 속도 비교 데모를 보여줍니다. Magistral이 5.3초만에 답변을 완료한 반면, OpenAI 모델은 17초 동안 사고한 후에도 여전히 출력 중이었습니다. 무료로 사용 가능합니다.
[00:01:32] 음성 AI 업데이트: 11 Labs & OpenAI

11 Labs V3 Alpha TTS는 속삭임부터 셰익스피어 낭독, 사실적인 웃음 표현을 지원합니다. 이어 OpenAI 음성 모드가 ums·stutters 같은 자연스러운 말투와 감정·중단 태그 제어 기능을 추가해 사용자 스타일을 세밀히 조정할 수 있습니다.

11 Labs의 V3 알파 텍스트 음성 변환 모델을 소개합니다. 가장 표현력이 풍부하고 감정적인 음성을 제공하며, 속삭임부터 셰익스피어 연기까지 다양한 표현이 가능합니다.
음성 AI의 현실성에 대한 우려를 표현합니다. OpenAI의 새로운 음성 모드가 너무 인간 같아서, 음과 더듬거림이 과도하다고 지적하며, 약간 더 AI다운 느낌을 선호한다고 말합니다.
새로운 음성 제어 기능들을 설명합니다. 흥미로움, 끼어들기, 놀라움, 겹침, 조심스러운 톤 등 다양한 감정 태그를 추가할 수 있는 기능이 제공됩니다.
새로운 음성 모드의 현실적인 음성 품질을 반도체 산업에 대한 질문을 통해 시연하며, AI가 실제 사람처럼 자연스러운 억양과 멈춤을 사용하는 것에 대해 감탄합니다.
AI 음성의 현실성에 대한 피드백을 나누고, 운전 중 AI와 대화하며 학습하는 개인적인 활용 사례를 공유합니다.
Gemini 2.5 Pro의 새로운 업데이트 버전이 발표되었으며, 다양한 벤치마크에서 성능이 크게 향상되어 코딩 분야에서 여전히 최고의 모델임을 강조합니다.
[00:04:08] Gemini 2.5 Pro 업그레이드

Gemini 2.5 Pro의 신규 버전이 체스 ELO 1470, WebDev Arena 1443을 달성하며 전 버전 대비 안정적 성능 향상을 입증했습니다. 여전히 뛰어난 코딩 역량으로 Rubik’s Cube 테스트 등에도 최적의 결과를 보여줍니다.

Google의 텍스트-투-비디오 AI 모델 Veo의 새로운 fast 버전이 출시되어 기존 V3 대비 5분의 1 가격으로 훨씬 빠른 속도를 제공한다고 소개합니다.
[00:04:54] Google VIO Fast 버전

Google의 텍스트→비디오 AI 모델 VIO에 비용은 1/5, 속도는 대폭 개선된 Fast 옵션이 등장했습니다. 빠른 실험과 콘텐츠 제작을 위한 효율적 대안을 제시합니다.

스폰서 Outskill을 소개하며, 전문가와 임원들을 위한 2일간의 라이브 AI 교육 프로그램의 내용과 일정을 상세히 설명하고, 이미 5만 명이 참여한 성과를 언급합니다.
[00:05:19] 스폰서: Outskill AI 교육

Outskill의 2일 라이브 AI 트레이닝은 제너레이티브 AI, 자동화, 에이전트 구축, 이미지·비디오 생성, 웹사이트 제작 등을 다룹니다. 실시간 Q&A와 멘토 세션 제공으로 50,000명 이상의 전문가가 참여했습니다.

Outskll 교육 플랫폼의 성과와 혜택을 소개하며, 5만 명의 전문가들이 참여하여 컨설팅 일자리를 얻고 AI 제품을 개발했다고 설명합니다.
Meta가 Scale AI에 140억 달러를 투자하여 49% 지분을 확보하고, 알렉스 왕 CEO를 영입해 새로운 초지능 팀을 구성한다는 대형 뉴스를 전합니다.
[00:06:20] Meta의 Scale AI 투자

Meta는 Scale AI에 140억 달러를 투자해 49% 지분을 확보하고 Alex Wang을 필두로 슈퍼 인텔리전스 팀을 신설했습니다. 톱 AI 인재를 영입해 초지능 개발 경쟁에 박차를 가합니다.

저커버그가 직접 업계 최고 AI 인재 50명을 선발하고 있으며, 연간 1천만 달러 이상의 파격적인 조건을 제시하고 있다고 보고합니다.
모든 주요 AI 회사들이 한정된 인재풀을 두고 치열한 경쟁을 벌이고 있으며, Arc 브라우저 회사에서 AI 네이티브 DIA 브라우저를 출시했다고 소개합니다.
[00:08:25] AI 네이티브 브라우저 경쟁

Ark 팀이 개발한 DIA 브라우저는 ‘탭 간 채팅’ 기능을 지원해 여러 창을 AI로 한 번에 탐색하고 요약합니다. Perplexity Comet과 경쟁할 차별화 요소를 시험해볼 필요가 있습니다.

DIA 브라우저의 핵심 기능인 '탭과의 채팅' 기능을 설명하며, 인라인 복사 편집기 등의 예시를 통해 AI 브라우저의 실용성을 평가하겠다고 합니다.
Gmail의 기본 기능들과 AI 브라우저 Dia의 기능들을 비교하며, 이미 존재하는 기능들을 한 곳에서 제공하는 것의 가치에 대해 의문을 표합니다.
[00:09:30] Flux One Context Max 모델

Black Forest Labs의 Flux One Context Max는 오픈소스로 공개된 최고 수준의 텍스트→이미지 모델입니다. Imagine 4 Ultra, GPT4o 등과 비교한 샘플 예시를 통해 세부 디테일과 수정 오류를 분석했습니다.

Flux One Context Max가 세계 최고 수준의 텍스트-이미지 모델 중 하나이며 오픈소스라고 소개하고, Artificial Analysis 순위에서 상위권을 차지했다고 설명합니다.
남극 연구 기지, 도쿄 네온사인 골목, 해적 모험가 등 다양한 예시 이미지들을 통해 Flux One Context Max와 다른 AI 이미지 생성 모델들의 성능을 비교 분석합니다.
[00:11:33] 마무리

이번 주 주요 AI 뉴스와 모델 업데이트를 간략히 정리했습니다. 영상이 유익했다면 좋아요와 구독 부탁드리며, 다음 소식으로 찾아뵙겠습니다.

타임라인 정보가 없습니다.

지난 주에 정말 많은 뉴스가 있었습니다.
모든 내용을 살펴보겠습니다. 먼저 Mistral에서
첫 번째 추론 모델을 출시했고
그 중 작은 버전을 오픈소스로 공개했습니다.
그런데 여기서 중요한 건,
제가 지금까지 사용해본 추론 모델 중
단연코 가장 빠른 모델입니다.
Gemini 2.5 Pro가 빠르다고 생각했는데, 이건 그것을 완전히 압도합니다.
자, 알아두셔야 할 것은
이 모델을 두 가지 버전으로 출시한다는 것입니다.
Magistral Small은 240억 매개변수의 오픈소스 버전입니다.
Magistral Medium은 더 강력한 엔터프라이즈 버전입니다.
이는 지금 당장
여러분의 컴퓨터에 다운로드해서 실행할 수 있습니다.
240억 매개변수는 상대적으로 작은 크기이고,
더 작은 크기로 양자화되면
대부분의 일반 컴퓨터에서도 실행할 수 있을 것입니다.
더 작은 크기로 양자화되면
대부분의 소비자용 컴퓨터에서 실행할 수 있을 것입니다.
Magistral Medium은 AMI 2024에서 73.6%를 기록했고
64번 시도에서 다수결 투표로 90%를 달성했습니다.
Magistral Small은 70%를 기록해
Magistral Medium과 거의 비슷했고, 각각 83%를 달성했습니다.
Magistral의 사고 과정은
전 세계 언어와 문자에서 작동하며
대부분의 경쟁 모델보다
10배 빠른 속도로 실행됩니다.
얼마나 빠른지 보여드리기 위해
왼쪽은 Magistral이고
오른쪽은 OpenAI의 모델 중 하나입니다.
정확히 어떤 모델인지는 명확하지 않지만
얼마나 빠른지 보세요.
보세요. 출력 속도를 보세요.
게다가 사고 과정에서 더 많은 세부사항을 얻을 수 있습니다.
5.3초 동안 생각했고
OpenAI 모델은 17초 동안 생각했고
아직도 최종 답변을 출력하고 있습니다.
한번 시도해보세요.
다운로드하거나 Mistral Le Chat 앱에서 사용하세요.
무료입니다. 여러분 생각을 알려주세요.
다음으로, 11 Labs에서
텍스트 음성 변환 모델의 V3 알파를 출시했습니다.
이는 11 Labs 역사상 가장 표현력이 풍부하고
감정적인 음성 모델입니다.
들어보세요. '안녕 제시카,
새로운 11 V3 시도해봤어? 방금 받았는데
선명도가 놀라워. 이제 속삭임도 할 수 있어.
이렇게 말이야. 오, 멋지네.
이것 좀 봐.
이제 완전한 셰익스피어도 할 수 있어.
'사느냐 죽느냐, 그것이 문제로다.' 좋네.
하지만 나는 웃음 업그레이드가 더 기대돼.
이것 들어봐.'
좋아요, 그 엄청나게 소름끼치는 웃음을 제외하고는
다른 모든 것이 정말 좋게 들렸습니다.
이런 음성 모델들이 믿을 수 없을 정도로 현실적이 되고 있어요.
거의 너무 인간 같습니다.
실제로 OpenAI는 방금
음성 모드 업그레이드를 출시했는데
정말 너무 인간 같게 들립니다.
음, 더듬거림, 실수가 너무 많아서
사실 조금 더 AI 같게 들리는 것을 선호하겠지만
이 비디오 후반에 그에 대해 이야기하겠습니다.
그래서 이제
음성과 대화가 어떻게 들리는지에 대해
훨씬 더 많은 제어권을 갖게 되었습니다.
흥미롭게, 끼어들기는
방해한다는 뜻이고, 놀라움, 겹침,
조심스럽게 등이 있습니다.
이런 작은 태그들을 추가할 수 있어서 정말 멋져요.
확인해보세요.
11 Labs의 새로운 V3 알파입니다.
다시 음성에 대해 말하자면, OpenAI가
새로운 음성 모드를 출시했고
제가 테스트해본 결과 정말 좋습니다.
무섭도록 현실적입니다. 예시를 들어보겠습니다.
어떤 소리인지 예시를 들어보겠습니다.
반도체 산업에 대해 알려주세요.
반도체 산업은 기본적으로 현대
전자제품의 근간입니다. 이 산업은
반도체 장치의 설계와 제조를 포함하며
스마트폰부터 자동차, 산업용 기계까지
모든 것에 필수적인 구성 요소입니다.
음, 이 산업은 지속적인 혁신과
경쟁으로 매우 역동적이며
미국, 한국, 대만, 유럽의 주요 업체들과 함께
정말 글로벌한 산업입니다.
좋습니다. 정말 놀라울 정도로 좋네요.
들으셨는지 모르겠지만
몇 번의 '음'이 있었어요.
현실적으로 들리는 특정한 멈춤이 있었죠.
그녀가 목록을 나열할 때도
목록 소리가... 제 말은, 지금 제가
어떻게 말하고 있는지 생각해보니
그 소리가 제가 말하는 방식과 너무 비슷했어요.
현실적으로 들린다고 생각해주셔서 기쁩니다.
그런 피드백을 듣는 것은 항상 흥미롭죠.
제가 말하는 방식을 조정하거나
선호하는 특정 스타일이 있다면 알려주세요.
좋아요. 좋아요. 조용히 해주세요.
네. 그녀는 여전히 듣고 있었지만
어, 네, 정말 정말 좋네요.
그리고 저는 운전할 때
그냥 그녀와 대화를 시작해서
여러 가지를 가르쳐 달라고 하는 습관이 생겼어요.
여러분도 그렇게 하시는지 알려주세요.
좋습니다. 다음으로 넘어가죠.
이것은 일주일도 안 되어 나왔지만
이미 오래된 뉴스처럼 보입니다.
Gemini 2.5 Pro에 완전히 새로운 버전이 나왔습니다.
이 버전은 다양한 벤치마크에서
훨씬 더 뛰어난 성능을 보여줍니다.
확실히 지금까지 최고의 Gemini 2.5 Pro
모델입니다. Alam Marina에서 24포인트 ELO 상승으로
1470점으로 1위를 유지하고 있고
WebDev Arena에서는 35포인트 ELO 상승으로 1443점으로 선두를 달리고 있습니다.
코딩 분야에서 계속 뛰어난 성능을 보이며
Ader Polyglot과 같은 어려운 코딩 벤치마크에서
선두를 유지하고 있습니다.
아직까지도 Gemini 2.5 Pro는
제가 가장 좋아하는 코딩 모델입니다.
적어도 직접 접근해서
루빅 큐브 테스트 같은 것들을
해결해 달라고 요청할 때 말이죠.
새로운 모델을 확인해보세요.
Google의 AI Studio에서 무료로 사용할 수 있습니다.
다음으로, 또 다른 Google 업데이트입니다.
Google의 매우 인기 있는 텍스트-투-비디오 AI 모델인 Veo에
새로운 빠른 버전이 나왔습니다.
이 새로운 fast 옵션은 V3 가격의 1/5이며
속도도 훨씬 빠릅니다.
이름 그대로 말이죠. 저는 Veo 비디오로
놀기를 좋아해서 분명히
이것도 시도해볼 예정입니다.
그리고 이 영상의 스폰서인
Outskill에 감사드립니다.
Outskill은 전문가, 창업자, 그리고
임원들을 위한 2일간의 라이브 AI 교육
프로그램입니다. 이 2일간의 라이브
프로그램을 통해 여러분은
생성형 AI 기초, 자동화, AI 에이전트 구축,
이미지 및 비디오 생성, 완전한
웹사이트 생성 등을 포함한
AI 기술을 마스터하게 됩니다.
2일간의 교육은 토요일과 일요일
동부 시간 오전 11시부터 오후 7시까지 진행됩니다.
그리고 금요일 오전 10시에 초기 킥오프가 있습니다.
2일, 16시간, 5세션. 정말 많은 것을 배우게 될 것입니다.
지난 6개월 동안 이미 5만 명의
전문가들이 이 세션에 참여했습니다.
그리고 그들은 컨설팅 일자리를 얻었고,
AI 제품을 만들거나 기존 직무에서
자신의 실력을 향상시켰습니다. 그들은
또한 멘토와의 라이브 Q&A 세션도
제공해서 궁금한 점을 질문하고
혹시 있을 의문점을 해결할 수 있고
헷갈릴 수 있는 주제들을
명확히 할 수 있습니다. 그러니 Outskll을
확인해보세요. 아래 링크를 달아두겠습니다.
처음 가입하는 1,000명에게는 무료입니다.
다시 한번 Outskll에 감사드립니다.
이제 영상으로 돌아가겠습니다. 좋습니다.
그리고 이번 주 대형 뉴스는 Meta가
Scale AI에 대규모 투자를 했고
AI 팀을 대폭 개편하고 있다는 것입니다.
Meta가 Scale AI CEO 알렉스 왕이 이끄는
새로운 AI 연구소를 설립한다는 보도가 나왔고
네, 이 보도는 정확한 것 같습니다.
저커버그는 Meta가 AI 경쟁에서
뒤처지고 있다고 느껴서 Scale AI에
140억 달러를 투자하여 회사의 49%를 확보했고
CEO를 영입했습니다. 그 CEO는
더 이상 Scale AI의 CEO가 아닙니다.
그는 이제 새로 설립된
초지능 팀을 이끌고 있으며
이 팀은 저커버그가 직접
선발하고 있다고 합니다. 저커버그는
업계 최고의 AI 인재 50명을 찾아
초지능을 구축하려고 합니다. 아마도
얀 르쿤이 저커버그의 기대에
부응하지 못하고 있는 것 같습니다.
49% 지분 확보가 이상하게 들리시나요?
왜 회사 전체를 인수하지 않았을까요?
음, 아마도 실제 인수를 위한
규제 허들을 피하고 싶었던 것 같습니다.
그래서 이렇게 우회적으로
소수 지분이지만 소수 지분 중에서는 다수인
49%를 확보하는 방식이 그런 규제를
우회하는 방법인 것 같습니다. 구글도
그렇게 했고, 마이크로소프트도 OpenAI와
그런 식으로 했습니다. 이게 회사 인수의
트렌드인 것 같습니다. Scale AI가
무엇인지 잘 모르신다면, 그들은
기본적으로 AI 회사들을 위한
데이터 라벨링과 주석 작업을 위한
전체 엔진을 구축했습니다. 정말 강력하고
좋은, 고품질의 풍부한 데이터입니다.
그리고 이제 Meta가 그 모든 것을 얻었습니다.
그리고 네, 저커버그는 AI 업계의
최고 인재들을 확보하기 위해 전력을 다하고 있습니다.
이건 DD에 따른 것이고 전혀 검증되지 않았지만
사실인 것 같습니다. 초지능 팀을 위한
Meta의 제안은 정말 미친 수준입니다.
저커버그가 직접 나서서 연간 1천만 달러
이상을 현금으로 제안하고 있습니다.
이런 건 본 적이 없습니다.
그래서 모든 주요 AI 회사들이
같은 한정된 인재풀을 두고 경쟁하고 있고
이는 완전히 치열한 경쟁입니다.
다음으로 Arc 브라우저를 만드는
회사에서 이제 DIA 브라우저라는
AI 네이티브 브라우저를 출시했습니다.
이는 자체 브라우저 코메트를 곧 출시할
Perplexity보다 한발 앞선 것입니다.
이 브라우저는 탭과 '채팅'할 수 있다는
점을 강조하고 있습니다. 기본적으로
여러 탭을 열어두고 AI를 사용해서
그 탭들을 가로질러 채팅할 수 있습니다.
개인적으로는 그게 뭐가 그렇게
특별한지 모르겠지만, 아직 써보지 않았으니
일단 의심의 여지를 두고
테스트해보고 싶습니다.
알려드리겠습니다. 여기 예시가 있습니다.
인라인 복사 편집기입니다. 일부분을 하이라이트하면
Gmail 이메일의 일부를 하이라이트하고
더 자신감 있게 들리도록 만들어달라고 하면 짜잔.
Gmail에서 이미 이런 기능을 제공합니다.
그래서 뭐가 그렇게 특별한지 모르겠어요.
여기서 내가 바보처럼 들리지 않게 해달라고 하면
오타나 문법 오류를 체크해줍니다.
다시 말하지만, 이런 기능들은 모두 Google Docs에 기본으로 내장되어 있어요.
여기 노션처럼 보이는 것이 있네요.
슬랙용 요약 기능입니다.
음, 요약 기능이군요.
다시 말하지만, 노션에서 이미 다 되는 기능이에요.
그래서 이런 모든 것들이 이미 기본 도구들에서 제공되고 있는데
하지만 한 곳에서 모든 걸 할 수 있다는 점이 좋을 수도 있겠네요.
아직은 잘 모르겠어요.
시도해보고 싶으시면 대기자 명단에 등록해보세요.
다음으로, Artificial Analysis에 따르면 Flux One
Context Max 모델이 세계 최고의
텍스트-이미지 모델 중 하나라고 합니다.
뿐만 아니라 오픈소스이기도 하죠.
인상적인 이미지 편집 모델일 뿐만 아니라
최고의 텍스트-이미지 모델 중 하나이기도 합니다
Google의 Imagen 4와 경쟁할 정도로
Artificial Analysis 이미지 아레나에서 말이죠.
이건 Black Forest Labs에서 개발한 것으로
약 일주일 전에 출시되었습니다.
Max와 Pro 버전은 오픈 웨이트가 아니니까
이 점 참고하세요.
이들은 API나 다른 파트너 제공업체를 통해서만
이용할 수 있습니다.
Black Forest Labs는 또한 Flux One Context Dev를 개발하고 있는데
120억 매개변수 확산 이미지
편집 모델로 곧 오픈 웨이트로
만들 계획이라고 합니다.
현재는 비공개 베타 출시 상태입니다.
OpenAI GPT-4o가 여전히 1위를 차지하고 있고요
그 다음에 Midjourney, Recraft V3, Imagen 4 Ultra와
Preview가 있습니다.
그리고 Flux One Context Max가 그 뒤를 따르고 있죠.
정말 근소한 차이로, 아주 좋은 모델입니다.
이 새로운 모델의 예시 이미지들을 보시죠.
남극 연구 기지가 떠 있는 모습입니다.
여기가 Flux One Context Max, Flux 1.1 Pro Ultra입니다.
여기는 GPT-4o와 Midjourney 3.0이고요.
모두 정말 훌륭합니다.
이건 좀 더 일러스트 같지만
네, 모두 정말 좋네요.
다른 예시도 보시죠.
애니메이션 군중들로 북적이는 도쿄의 네온사인 골목이
비 오는 하늘 아래 애니메이션 스타일로 그려진 모습입니다.
이게 Flux One Context Max이고, Flux 1.1 Pro Ultra, GPT-4o, Midjourney입니다.
다시 말하지만 네 개 모두 정말 좋아 보입니다.
이 중에서는 이게 아마 제일 좋은 것 같아요
가장 디테일이 많거든요.
Flux 1.1 Pro지만, 모두 다시 한번 말하지만
정말, 정말 좋습니다.
또 다른 예시입니다.
젊은 만화 해적 모험가가
망망대해에서 항해를 시작하는 모습이에요.
Flux One Context Max로 만든 이 이미지는 아주 좋지만
눈 위의 안대가 좀 이상하게 그려졌네요.
여기는 1.1 Pro Ultra인데 아주 좋습니다.
여기서 보이는 유일한 실수는 물이
배에서 나오는 것처럼 보인다는 거예요.
여기는 GPT-4o입니다. 해적의 다리가
배와 겹쳐 보이네요.
그리고 Midjourney 3.0입니다.
이건 별다른 실수가 안 보이네요.
오늘의 뉴스는 여기까지입니다.
이 영상이 도움이 되셨다면
좋아요와 구독을 눌러주시고, 다음 영상에서 만나요