[00:00]
오늘 저는 방금 출시된 세 가지 새로운
[00:02]
중국 AI 에이전트를 보여드리겠습니다.
[00:04]
이들은 지구상의 모든 것을
[00:05]
완전히 압도하고 있습니다. 우리가
[00:07]
이야기하는 것은 원클릭으로 넷플릭스
[00:09]
클론을 만들고, 인간 개발자보다
[00:11]
빠르게 코드를 수정하며,
[00:13]
1분 이내에 할리우드 수준의
[00:15]
동영상을 만드는 AI입니다. 그리고 가장
[00:17]
놀라운 점은, 다른 업체들이
[00:18]
한 달에 수백 달러를 청구하는 동안
[00:20]
이들은 모두 완전 무료입니다.
[00:22]
제가 직접 세 가지 모두 테스트해봤는데,
[00:25]
제가 발견한 것은 여러분을 놀라게 할 것입니다. 안녕하세요,
[00:27]
저는 SEO 에이전시 골디 에이전시 CEO
[00:29]
줄리안 골디의 디지털 아바타입니다.
[00:32]
그가 고객들이 더 많은 리드와
[00:34]
고객을 확보할 수 있도록 돕는 동안,
[00:36]
저는 여러분께 최신 AI 업데이트를
[00:39]
전해드리고 있습니다. 줄리안 골디는
[00:40]
모든 댓글을 읽으니 꼭 아래에
[00:42]
댓글을 남겨주세요. 저는 수년간 AI를
[00:45]
추적해왔습니다. ChatGPT의 폭발적 성장을
[00:48]
지켜봤고, 모든 주요 AI 출시를 봤습니다. 하지만
[00:50]
지난 몇 주 동안 중국에서 일어난 일은
[00:52]
다릅니다. 이들은 단순한
[00:54]
점진적 개선이 아닙니다.
[00:56]
하루아침에 전체 산업을 폐업시킬 수 있는
[00:58]
완전한 게임 체인저입니다. 그리고 여기
[01:00]
아무도 이야기하지 않는 점이 있습니다.
[01:02]
미국 AI 회사들이 엄청난
[01:03]
구독료를 청구하고 접근을 제한하는 동안,
[01:06]
이 중국 회사들은 모든 것을
[01:08]
더 잘하는 세 가지 도구를
[01:09]
무료로 출시했습니다. 첫 번째는
[01:11]
5만 달러짜리처럼 보이는
[01:13]
웹사이트를 만듭니다. 두 번째는
[01:15]
6자리 연봉을 받는 시니어
[01:17]
개발자보다 코드를 더 잘 작성합니다.
[01:19]
세 번째는 AI가 만든 것인지
[01:22]
구별할 수 없을 정도로 좋은 비디오를 만듭니다.
[01:23]
저는 각각이 어떻게 작동하는지,
[01:26]
다른 사람들이 알기 전에 어떻게
[01:27]
접근하는지, 그리고 이것들을
[01:30]
사용해서 경쟁자들을 완전히
[01:32]
압도할 수 있는 구체적인 방법들을
[01:34]
정확히 보여드리겠습니다.
[01:36]
제가 보여드릴 것은 단순히 인상적인 것이 아니라,
[01:38]
비즈니스를 바꾸는 것입니다.
[01:41]
Minimax M1이 방금 출시되었는데
[01:43]
정말 미친 수준입니다. 저는
[01:44]
수년간 AI 도구들을 테스트해왔지만
[01:47]
이런 것은 본 적이 없습니다.
[01:49]
상상해보세요. 저는 그냥 '재생 가능한 예고편이 있는
[01:53]
넷플릭스 클론 만들기'라고 타이핑했고,
[01:56]
약 60초 만에 실제 비디오 예고편이
[01:58]
재생되는 완전히 작동하는
[02:01]
넷플릭스 복제본을 얻었습니다.
[02:03]
어설픈 프로토타입이 아니라
[02:05]
넷플릭스와 똑같이 보이는 실제
[02:07]
작동하는 웹사이트입니다. 그리고 가장
[02:09]
놀라운 점은 단 한 푼도
[02:12]
들지 않았다는 것입니다. 이제
[02:14]
여러분은 '줄리안, 말도 안 돼.
[02:16]
또 다른 세상을 약속하는 AI 도구잖아'라고
[02:18]
생각할 수도 있습니다. 하지만 잠깐,
[02:21]
이것은 그냥 또 다른
[02:23]
ChatGPT 모방작이 아닙니다.
[02:25]
완전히 다른 것입니다.
[02:27]
배경을 설명드리면, Minimax는
[02:30]
실제로 상하이 기반의 AI 스타트업이고
[02:31]
AI 세계에서 파장을 일으키는
[02:33]
무언가를 방금 출시했습니다.
[02:36]
이들은 알리바바, 텐센트, IDG 캐피털 같은
[02:38]
거대 기업들의 지원을 받고 있습니다.
[02:39]
하지만 이것이 다른 모든 것들과
[02:41]
이게 우리에게 어떤 의미인지 설명해드릴게요. 이 모델은
[02:43]
100만 토큰의 입력을 처리할 수 있습니다.
[02:45]
마치 전체 책 시리즈를 읽어주고
[02:46]
모든 단어 하나하나를 완벽히 이해하는 것과 같죠.
[02:48]
딥시크 R1과 비교해보면, 딥시크는
[02:51]
128,000 토큰밖에 처리하지 못합니다.
[02:53]
8배나 적은 거죠. 그리고 출력은
[02:56]
한 번의 응답으로 최대 80,000 토큰을 생성할 수 있어요.
[02:58]
마치 짧은 소설을 한 번에 쓰는 것과 같습니다.
[03:01]
하지만 여기서부터가 정말 놀라운 부분이에요.
[03:03]
제가 넷플릭스 클론을 만들었다고 했던 거 기억나시죠?
[03:05]
전혀 과장이 아니었습니다.
[03:07]
디자인, 이미지, 트레일러까지
[03:09]
모든 것이 자동으로 생성되었어요.
[03:11]
그리고 단순한 정적 페이지가 아니라
[03:13]
완전히 작동하는 웹사이트를 만들었죠.
[03:15]
재생 가능한 비디오 콘텐츠까지 포함해서요.
[03:17]
줄리안, 이게 얼마나 비용이 들었냐고
[03:19]
궁금하실 텐데요? 놀라실 준비 하세요.
[03:21]
이 전체 모델의 훈련 비용은 단돈
[03:23]
534,700달러였습니다.
[03:25]
많은 돈처럼 들리겠지만
[03:27]
이걸 들어보세요. 딥시크가
[03:28]
R1 모델을 훈련하는 데 500만에서 600만 달러가 들었고
[03:31]
오픈AI의 GPT-4는 훈련에 1억 달러 이상이
[03:33]
들었습니다. 정말 놀라운 효율성이죠.
[03:37]
그리고 가장 좋은 점은
[03:39]
아파치 라이선스로 오픈소스라는 거예요.
[03:40]
상업적 용도로 사용할 수 있고
[03:42]
원하는 대로 수정할 수 있으며
[03:45]
어떤 제한이나 비용 지불도 없습니다.
[03:47]
그럼 이걸 실제로 어떻게 사용하냐고요?
[03:49]
정말 간단합니다. 그냥
[03:51]
minimax.io로 가면
[03:53]
바로 에이전트를 사용할 수 있어요.
[03:55]
제가 처음 로그인했을 때
[03:57]
1,000 크레딧을 무료로 받았습니다.
[03:59]
제가 본 바로는, 정말 멋진 것들을
[04:02]
만들기에 충분한 양이었어요.
[04:04]
제가 정확히 무엇을 했는지 보여드릴게요.
[04:06]
'재생 가능한 트레일러가 있는 넷플릭스 클론 만들기'라고
[04:09]
입력하고 엔터를 눌렀습니다.
[04:11]
그게 전부예요. 코딩도, 디자인 작업도,
[04:13]
비디오 편집도 없었습니다.
[04:16]
AI가 알아서 작업을 시작했어요.
[04:18]
웹에서 이미지를 스크래핑하고, 레이아웃을 생성하고,
[04:20]
내비게이션을 만들고, 심지어
[04:22]
맞춤형 AI 생성 트레일러와 함께
[04:24]
비디오 플레이어까지 임베드했습니다.
[04:26]
하지만 넷플릭스 클론만이 아니에요.
[04:27]
제가 본 다른 놀라운 예시들을
[04:29]
보여드릴게요. 누군가는
[04:31]
해리포터의 톰 리들 일기장을 만들었어요.
[04:33]
여러분도 아시죠, 글을 쓰면 대답을 해주는 그 일기장요.
[04:35]
네, 완전히 상호작용 가능한
[04:36]
버전을 만들었습니다.
[04:38]
또 다른 사람은 이스라엘-이란 분쟁을 실시간으로 추적하는 대시보드를 만들었어요.
[04:42]
여러 소스에서 데이터를 가져와서
[04:43]
실시간으로 업데이트하고
[04:46]
깔끔하고 전문적인 인터페이스로
[04:48]
모든 정보를 제시합니다.
[04:49]
심지어 어떤 분은
[04:51]
모든 포켓몬과 스탯,
[04:53]
애니메이션까지 포함한
[04:55]
완전한 포켓몬 도감을 만들었어요.
[04:57]
어떤 포켓몬을 클릭해도
[04:58]
게임에서처럼 모든 정보를 볼 수 있죠.
[05:00]
그리고 정말 실용적인 예시가 있어요.
[05:02]
누군가 새 사무실의
[05:04]
최적 위치를 찾아달라고 요청했는데,
[05:06]
AI가 다양한 지역을 조사하고
[05:08]
비용, 접근성, 교통 연결을 분석해서
[05:11]
최적 위치에 대한 완전한 보고서를
[05:13]
가져왔습니다. 이제 이 기술의
[05:15]
뒷받침하는 기술에 대해 잠시 이야기해볼게요.
[05:18]
Minia M1은 하이브리드 전문가 혼합 아키텍처와
[05:20]
라이트닝 어텐션 메커니즘을 결합한 기술을 사용합니다.
[05:22]
이게 간단히 말해서 무슨 뜻일까요?
[05:25]
8만 토큰으로 깊은 추론을 할 때,
[05:26]
DeepSeek R1이 필요로 하는 컴퓨팅 파워의
[05:29]
30%만 필요로 합니다.
[05:31]
10만 토큰에서는 단 25%의
[05:33]
컴퓨팅 리소스만 사용합니다. 이건 마치
[05:36]
두 배 빠르지만 연료는 절반만 쓰는
[05:38]
스포츠카를 갖는 것과 같습니다.
[05:40]
이 모델은 총 4,560억 개의 파라미터를 가지고 있지만,
[05:42]
토큰당 459억 개만 활성화합니다.
[05:45]
이런 선택적 활성화가 바로
[05:48]
효율성의 비결입니다. 하지만 제가 테스트할 때
[05:50]
정말 놀랐던 건 바로
[05:52]
속도였습니다. GenSpark 같은 다른 도구들과
[05:53]
비교했을 때, GenSpark이 아직
[05:56]
프롬프트에 대해 생각하고 있을 때 Miniax는
[05:59]
이미 완전한 웹사이트를 생성하고 있었습니다.
[06:01]
그리고 단순히 빠르기만 한 게 아니라
[06:03]
정말 똑똑합니다. 수학적 추론부터
[06:05]
실제 소프트웨어 엔지니어링까지
[06:07]
모든 것에 대해 강화학습으로 훈련되었습니다.
[06:09]
소프트웨어 엔지니어링 벤치마크에서
[06:12]
SWBench Verified에서 56% 정확도를
[06:14]
달성했으며, 다른 모델들을
[06:17]
압도적으로 능가했습니다.
[06:19]
다른 예를 들어보겠습니다.
[06:22]
예티가 브이로그를 하는
[06:23]
시네마틱 비디오 시리즈를 만들어달라고 했더니,
[06:26]
컨셉을 이해했을 뿐만 아니라
[06:28]
프롬프트를 생성하고, 비디오를 만들고,
[06:30]
이들을 하나의 긴 비디오로
[06:32]
편집까지 했습니다.
[06:34]
이 AI는 브라우저 사용이라는
[06:37]
기능도 사용하는데, 실제로 웹을 탐색하고
[06:39]
웹사이트를 보고, 그 정보를 사용해
[06:41]
더 나은 결과물을 만들어냅니다.
[06:44]
제 유튜브 채널을 조사해서
[06:46]
랜딩 페이지를 만들어달라고 했더니,
[06:48]
제 채널에 가서 콘텐츠를 분석하고,
[06:50]
링크드인을 살펴보고, 찾은 정보를
[06:52]
바탕으로 맞춤형 랜딩 페이지를
[06:54]
만들어줬습니다.
[06:56]
이 모델에는 두 가지 버전이 있습니다. Miniax M1 40K와
[06:59]
Miniax M1 80K인데, 이는 사고 예산이나
[07:01]
출력 길이를 나타냅니다.
[07:04]
80K 버전이 복잡한 작업에는
[07:06]
더 강력하지만, 40K 버전도
[07:08]
대부분의 용도에는 충분합니다.
[07:10]
API를 사용하려면 입력 토큰 백만 개당 0.55달러,
[07:13]
80K 모델의 출력 토큰 백만 개당 2.20달러입니다.
[07:16]
이는 비슷한 기능을 가진
[07:18]
다른 모델들에 비해
[07:19]
믿을 수 없을 정도로 저렴합니다.
[07:22]
또 다른 정말 멋진 점은
[07:23]
이 모델이 온라인 검색, 비디오 및
[07:25]
이미지 생성, 음성 합성, 음성 복제 등의
[07:28]
기능을 내장하고 있다는 것입니다.
[07:30]
단순한 텍스트 모델이 아니라
[07:31]
여러 가지 일을 할 수 있는
[07:33]
완전한 AI 에이전트입니다.
[07:36]
그리고 벤치마크 결과, 이 모델은
[07:38]
거대 기업들과 경쟁하고 있습니다.
[07:42]
OpenAI o3, Gemini 2.5 Pro, Claude Opus,
[07:45]
DeepSeek R1과 다양한 벤치마크에서
[07:47]
경쟁력을 보이고 있습니다.
[07:49]
때로는 이들을 이기기도 하고, 때로는
[07:51]
약간 뒤처지기도 하지만, 항상
[07:54]
같은 리그에서 경쟁하고 있습니다.
[07:56]
긴 맥락 작업에서는 경쟁사들을 완전히 압도합니다.
[07:59]
OpenAI MRCR에서 73.4%를 기록한 반면
[08:02]
다른 모델들은 겨우 27.7%였습니다.
[08:04]
이는 100만 토큰이라는
[08:06]
거대한 컨텍스트 윈도우 덕분입니다.
[08:08]
너무 좋아서 믿기 어렵다는 거죠. 저도 이해해요.
[08:10]
저도 처음엔 회의적이었거든요. 하지만 여기서 중요한 건
[08:12]
코드가 완전히 오픈소스라는 점입니다.
[08:15]
지금 당장 GitHub이나
[08:16]
HuggingFace에서 다운로드할 수 있어요.
[08:18]
모든 것을 직접 확인할 수 있습니다.
[08:20]
VLM과 트랜스포머를 위한
[08:22]
배포 가이드까지 제공해서
[08:24]
원한다면 자체 서버에서도 실행할 수 있습니다.
[08:26]
H800 GPU 8개가 장착된 서버는 최대 200만 토큰까지
[08:28]
처리할 수 있고, H20 GPU 8개로는
[08:32]
최대 500만 토큰까지 처리 가능합니다.
[08:34]
하지만 대부분의 경우
[08:35]
웹 인터페이스만으로도 충분합니다.
[08:37]
어떤 기술적 지식도 필요 없어요.
[08:39]
코딩을 알 필요도 없습니다.
[08:41]
원하는 것을 입력하기만 하면 알아서 만들어줍니다.
[08:43]
저는 AI 도구를 수년간 사용해왔는데
[08:45]
이건 정말 가장
[08:47]
인상적인 것 중 하나입니다.
[08:48]
텍스트 프롬프트만으로
[08:50]
완전히 기능적인 웹사이트를 구축할 수 있고
[08:52]
엄청난 컨텍스트 윈도우에
[08:54]
무료로 시작할 수 있다는 점까지
[08:56]
정말 게임체인저입니다.
[08:58]
이게 비즈니스에 어떤 의미인지 생각해보세요.
[09:00]
웹 애플리케이션 전체를 몇 주가 아닌 몇 분 만에
[09:02]
프로토타입으로 만들 수 있습니다.
[09:04]
개발자를 고용하지 않고도
[09:06]
클라이언트용 인터랙티브 데모를 만들 수 있고
[09:08]
코딩 지식 없이도
[09:10]
내부 도구와 대시보드를 구축할 수 있습니다.
[09:12]
그리고 저 같은 콘텐츠 크리에이터에게는
[09:14]
정말 금과 같은 존재예요.
[09:16]
청중을 위한 인터랙티브 경험을 만들고
[09:18]
강의용 맞춤 도구를 구축하며
[09:20]
아이디어를 그 어느 때보다 빠르게 프로토타입으로 만들 수 있습니다.
[09:22]
이들은 CISPO라는 새로운 훈련 방법을 사용했는데
[09:24]
기존 방법보다 훨씬 효율적입니다.
[09:26]
전체 강화학습 단계에서
[09:28]
Nvidia H800 512개만 3주간 사용했습니다.
[09:32]
이 규모의 모델치고는 놀라울 정도로 효율적이죠.
[09:34]
경쟁사들이 수천만 달러를 쓰는 동안
[09:36]
600만 달러 미만으로
[09:38]
이렇게 강력한 것을 훈련시킬 수 있었다는 것은
[09:40]
여기서 일어나고 있는 혁신이
[09:41]
얼마나 대단한지를 보여줍니다.
[09:43]
그리고 기억하세요, 이건 시작일 뿐입니다.
[09:46]
Minimax는 이걸 Minimax 위크라고 부르며
[09:48]
더 많은 제품을 출시할 계획입니다.
[09:50]
이게 시작이라면
[09:52]
다음에 나올 것들이 정말 기대됩니다.
[09:53]
하지만 ByteDance가 Seaart 1.0으로 방금 출시한 것은
[09:55]
완전히 다른 차원입니다.
[09:57]
그리고 대부분의 사람들은 이게 존재한다는 것조차
[09:59]
아직 모르고 있어요.
[10:01]
무슨 일이 일어났는지 말씀드리죠.
[10:03]
모든 사람이 OpenAI의 Sora에 대해 이야기하는 동안
[10:06]
ByteDance는 조용히
[10:07]
Sora를 장난감처럼 보이게 만들 무언가를 구축하고 있었습니다.
[10:10]
이들이 방금 출시한 Seaart 1.0은
[10:12]
기존의 모든 것보다 나을 뿐만 아니라
[10:14]
비교조차 되지 않을 정도입니다.
[10:16]
텍스트만으로
[10:18]
할리우드급 동영상을 만들어내는 동영상 생성기 말이에요.
[10:21]
하지만 여기서 핵심은
[10:22]
기존 도구들처럼 몇 시간이 걸리지 않는다는 것입니다.
[10:24]
몇 분도 걸리지 않아요.
[10:26]
이 도구는 풀 1080p 해상도로 5초짜리 동영상을
[10:29]
단일 그래픽카드에서 단 41초 만에 뽑아냅니다.
[10:32]
하지만 이것도 놀라운 부분이 아니에요.
[10:34]
정말 놀라운 것은
[10:36]
이 동영상들이 실제로 얼마나 뛰어난지입니다.
[10:37]
AI가 생성한 것인지 구별할 수 없을 정도로
[10:39]
사실적인 동영상을 만들어내는 완벽한 도구입니다.
[10:42]
완벽한 움직임, 완벽한 조명, 모든 것이
[10:43]
완벽합니다. 그리고 묻기 전에 말씀드리면, 이건
[10:46]
완벽한 조건에서만 작동하는
[10:48]
과장된 데모가 아닙니다. 이 기술은
[10:50]
방금 두 주요 비디오 생성 리더보드에서
[10:53]
1위를 차지했습니다. 구글의 V3를 이겼고,
[10:55]
런웨이의 Gen 4를 압도했습니다.
[10:59]
오픈AI의 소라를 마치 2020년
[11:01]
기술처럼 보이게 만들었습니다. 하지만 정말
[11:03]
흥미진진한 부분은 이겁니다. 이건 단순히
[11:05]
소셜미디어용 멋진 영상을 만드는 것이
[11:07]
아닙니다. 이건 누구나
[11:09]
몇 초 만에 전문가급 품질의 비디오
[11:10]
콘텐츠를 만들 수 있게 될 때
[11:12]
벌어질 일에 관한 것입니다. 이것이
[11:14]
당신의 비즈니스에 어떤 의미인지 생각해보세요.
[11:15]
마케팅에 어떤 의미인지
[11:16]
생각해보세요. 모든 것에 어떤 의미인지 말이죠.
[11:19]
제품 데모, 설명 영상,
[11:21]
소셜미디어 콘텐츠, 심지어 완전한
[11:23]
광고까지 원하는 것을
[11:25]
타이핑하는 것만으로 만들 수 있다고 상상해보세요.
[11:28]
카메라도, 편집 소프트웨어도,
[11:30]
비디오 제작팀도 필요 없이, 당신과
[11:33]
당신의 아이디어, 그리고 이 AI만 있으면 됩니다.
[11:35]
그리고 타이밍도 완벽합니다.
[11:36]
비디오 콘텐츠가 지금 완전히 시장을
[11:38]
지배하고 있습니다. 유튜브, 틱톡,
[11:40]
인스타그램 릴스, 링크드인 비디오까지,
[11:43]
모든 사람이 비디오를 원하지만 대부분은
[11:44]
좋은 비디오 콘텐츠를 만드는 것이
[11:46]
너무 어렵거나 비싸다고 생각합니다.
[11:47]
글쎄요, 그것은 이제 영원히
[11:49]
바뀌었습니다. 이제 이 기술이
[11:51]
어떻게 작동하는지, 그리고 왜 전체 콘텐츠 제작
[11:53]
산업을 뒤집으려고 하는지 정확히
[11:56]
알려드리겠습니다. 바이트댄스가 여기서
[11:58]
구축한 것은 단순한 또 다른 AI
[12:00]
도구가 아닙니다. 이건 완전한 게임체인저입니다.
[12:03]
우선, 이 기술은 텍스트를 비디오로,
[12:05]
이미지를 비디오로 모두 처리할 수 있습니다.
[12:06]
따라서 원하는 것을 텍스트로 설명하거나
[12:08]
시작 이미지를 제공하고 그 이미지를
[12:11]
어떻게 애니메이션할지 알려줄 수 있습니다.
[12:13]
두 옵션 모두 믿을 수 없을 정도로 잘 작동합니다.
[12:16]
하지만 정말 흥미로운 부분은
[12:17]
여기서부터입니다. 대부분의 AI 비디오 생성기는
[12:20]
한 번에 하나의 샷만 만들 수 있습니다.
[12:23]
하나의 연속적인 장면만 제공하고
[12:24]
그게 전부죠. 씨링 1.0은
[12:27]
멀티샷 비디오를 만들 수 있습니다.
[12:29]
즉, 여러 장면, 다양한 카메라 앵글,
[12:31]
심지어 샷 간의 부드러운
[12:33]
전환과 함께 복잡한 내러티브까지
[12:34]
포함한 비디오를 만들 수 있다는 뜻입니다.
[12:36]
이것이 무엇을 의미하는지
[12:38]
생각해보세요. 줄거리만 설명하면
[12:40]
말 그대로 미니 영화를 만들 수
[12:42]
있습니다. 제품을 다양한 각도에서
[12:44]
보여주는 여러 장면의 광고를
[12:46]
만들 수 있습니다. 하나의 개념에서
[12:47]
다른 개념으로 매끄럽게 흘러가는
[12:49]
교육 콘텐츠를 만들 수 있습니다.
[12:51]
그리고 품질에 대해서는, 이 결과물이
[12:53]
전문가 수준으로 보인다고 말할 때
[12:55]
농담이 아닙니다. 정말 마음을
[12:57]
사로잡은 것은 속도입니다. 기억하세요,
[12:59]
1080p 5초 비디오를 생성하는 데
[13:02]
41초가 걸린다는 얘기입니다. 정말 놀랍습니다.
[13:05]
대부분의 AI 비디오 도구는 이런 것을
[13:07]
만드는 데 10분에서 20분이 걸립니다.
[13:09]
어떤 것들은 몇 시간이 걸리죠.
[13:11]
이런 속도 우위는 단순히
[13:13]
편리한 것이 아닙니다. 혁명적입니다.
[13:15]
이렇게 빠르게 반복할 수 있다면, 원하는 것을
[13:17]
당신이 원하는 그대로 얻을 수 있습니다.
[13:19]
실험하고, 개선하고,
[13:21]
하루 종일 기다리지 않고도 콘텐츠를 완벽하게 만들 수 있죠.
[13:22]
그리고 여기 정말 놀라운 점이 있습니다.
[13:24]
다른 회사들이 아직도
[13:25]
쓰레기 같지 않은 AI 비디오를 만드는
[13:27]
방법을 찾으려고 애쓰고 있는 동안,
[13:29]
바이트댄스는 다른 누구도
[13:31]
존재하는 줄도 몰랐던 문제를 해결했습니다.
[13:33]
대부분의 AI 비디오 생성기는
[13:36]
이런 큰 약점을 가지고 있습니다.
[13:39]
텍스트 지시사항을 정말 잘 따르거나,
[13:40]
아니면 보기 좋고 자연스럽게 움직이는
[13:42]
비디오를 만들 수 있지만,
[13:44]
둘 다 동시에는 할 수 없습니다.
[13:46]
마치 똑똑해지거나 예뻐지거나
[13:48]
둘 중 하나를 선택해야 하는 것 같죠.
[13:51]
바이트댄스는 말했습니다. "그런 건 잊어. 우리는 둘 다 할 거야."
[13:52]
그들은 다차원 보상 시스템이라는
[13:54]
것을 구축했습니다.
[13:56]
거창하게 들리지만, 실제로는
[13:58]
이런 의미입니다.
[14:00]
대부분의 AI 시스템은 한 번에 하나씩 학습합니다.
[14:02]
보기 좋게 만드는 법을 배우고,
[14:04]
따로 지시사항 따르는 법을 배우고,
[14:06]
또 따로 자연스러운 동작을 만드는 법을 배웁니다.
[14:08]
하지만 Seance 1.0은
[14:10]
이 모든 것을 동시에 함께 학습합니다.
[14:13]
그래서 보기 좋게 만들거나
[14:15]
지시사항을 따르거나 둘 중 하나를
[14:17]
선택할 필요가 없습니다.
[14:19]
그냥 둘 다 완벽하게 해냅니다.
[14:21]
그리고 결과가 모든 것을 말해줍니다.
[14:23]
AI 비디오 생성기의 올림픽이라고 할 수 있는
[14:25]
인공 분석 리더보드에서
[14:27]
Seed Dance 1.0은 단순히 승리하는 게 아니라
[14:30]
경쟁자들을 완전히 압도하고 있습니다.
[14:31]
일부 카테고리에서는 2위 모델을
[14:33]
100점 이상 차이로 이기고 있어요.
[14:36]
하지만 정말 제가 흥미롭게 생각하는 부분은
[14:38]
바이트댄스가 더 나은 AI 비디오 생성기를
[14:39]
만들었다는 것이 아니라
[14:41]
어떻게 더 나아지게 만들었는지입니다.
[14:43]
왜냐하면 여기서 사용한 기술들이
[14:45]
모든 것을 바꿀 것이기 때문입니다.
[14:46]
그들은 AI가 비디오 데이터를 처리하는 방식을
[14:48]
완전히 새롭게 구상했습니다.
[14:50]
대부분 시스템이 하는 것처럼
[14:52]
비디오를 이미지들을 붙여놓은 것으로
[14:53]
다루는 대신,
[14:55]
실제로 비디오를 비디오로 이해하는
[14:57]
시스템을 구축했습니다.
[14:58]
동작을 이해하고, 사물이 시간이 흐르면서
[15:00]
공간을 통해 어떻게 움직여야 하는지 이해합니다.
[15:03]
이것은 엄청난 발전입니다. 왜냐하면 비디오에
[15:06]
컴퓨터가 생성했다는 걸 즉시 알아차리게 하는
[15:07]
이상한 AI 떨림 현상이 없기 때문입니다.
[15:09]
AI가 실제로 자연스러운 동작이
[15:11]
어떤 모습이어야 하는지 이해하기 때문에
[15:13]
동작이 자연스럽게 보입니다.
[15:15]
그들은 또한 모든 사람을 미치게 만들던
[15:17]
프롬프트 따르기 문제도 해결했습니다.
[15:19]
대부분의 AI 도구로는 구체적인 것을 요청하면
[15:21]
비슷하긴 하지만 정확하지는 않은
[15:22]
결과를 주잖아요?
[15:24]
여기서는 그런 일이 일어나지 않습니다.
[15:25]
그들은 프롬프트 엔지니어링 시스템이라는
[15:27]
것을 구축했는데, 이것은 기본적으로
[15:29]
간단한 요청을 AI가 정확히 원하는 것을
[15:31]
만들기 위해 필요한 세부 지시사항으로
[15:33]
번역해줍니다.
[15:35]
그래서 고양이가 점프하는 비디오를 만들어달라고 하면
[15:37]
아무 고양이나 점프시키는 게 아니라
[15:38]
당신이 마음속에 그리고 있던 바로 그런
[15:40]
고양이 점프를 만들어냅니다. 3일 전에
[15:43]
Moonshot AI라는 회사가
[15:45]
Kimmy Dev72B라는 것을 출시했는데
[15:48]
기존의 모든 무료 코딩 모델을 압도했습니다.
[15:49]
말 그대로
[15:50]
월 수백 달러짜리 모델들을
[15:52]
무료로 뛰어넘은 겁니다. 실제로 어떤 일이 일어났는지 보겠습니다.
[15:54]
이들은 이 모델을 가져다가
[15:56]
세계에서 가장 어려운 코딩 테스트에
[15:58]
투입했습니다. SWE bench
[16:01]
verified라고 불리는 테스트입니다.
[16:04]
이 테스트는 AI 모델에게 실제 코드베이스의
[16:07]
실제 버그를 줍니다. 장난감 문제가 아니라
[16:09]
실제 소프트웨어를 망가뜨린 진짜 버그들입니다.
[16:12]
대부분의 AI 모델은 이 테스트에서
[16:15]
처참하게 실패합니다. 비싼 모델들도 마찬가지입니다. 하지만
[16:19]
Kimdev 72B는 60.4% 정답률을 기록했습니다. 이는
[16:21]
무료 모델 중 역대 최고 점수입니다.
[16:23]
모든 다른 모델들을 압도했고
[16:24]
근소한 차이도 아닙니다. 하지만 정말 놀라운 건
[16:26]
이제부터입니다. 이 모델은 단순히 코드를 작성하는 게 아니라
[16:28]
실제 개발자처럼 망가진 코드를 고칩니다.
[16:30]
정확히 어느 파일이 망가졌는지 찾아내고
[16:32]
완벽한 수정을 작성하며
[16:34]
그 수정이 실제로 작동하는지 확인합니다.
[16:36]
저는 3일 동안 계속 테스트해봤습니다.
[16:38]
제일 엉망인 코드를 던져줬습니다.
[16:40]
몇 주 동안 해결하지 못한 버그가 있는 코드 말이죠.
[16:42]
그런데 이 녀석이 몇 초 만에 고쳐버렸습니다.
[16:45]
몇 분이 아니라 몇 초 만에요.
[16:47]
가장 좋은 점은, 다른 회사들이
[16:49]
코딩 도움으로 월 50달러를 받는 동안
[16:50]
이건 완전히 무료라는 겁니다.
[16:52]
지금 당장 다운로드할 수 있습니다.
[16:54]
본인 컴퓨터에서 실행하세요.
[16:57]
제한도 없고, 구독료도 없고, 아무것도 없습니다.
[16:59]
지금 여러분이 생각하는 걸 알겠습니다.
[17:02]
무료면 쓰레기겠지, 맞죠?
[17:03]
틀렸습니다.
[17:05]
이건 차원이 다릅니다. 이걸 만든 팀은
[17:06]
강화학습이라는 기법을 사용했습니다.
[17:08]
기본적으로 수백만 개의 실제 버그를
[17:10]
고치도록 해서 코딩을 가르쳤습니다.
[17:12]
버그를 올바르게 고칠 때마다 보상을 받고
[17:13]
실수할 때마다 처벌을 받았습니다.
[17:15]
이런 과정을 수백만 번 반복해서
[17:18]
코딩 머신으로 만들었습니다.
[17:19]
하지만 정말 놀라운 부분은 이겁니다.
[17:22]
이 모델에는 두 개의 뇌가 있습니다.
[17:24]
버그를 찾아서 고치는 버그 픽서라는 뇌 하나와
[17:26]
수정이 제대로 작동하는지 확인하는 테스트를
[17:28]
작성하는 테스트 라이터라는 뇌 하나가 있습니다.
[17:30]
이 둘이 태그팀처럼 함께 작업합니다.
[17:34]
대부분의 코딩 AI는 그냥 코드를 뱉어내고
[17:36]
작동하길 바랄 뿐입니다. 하지만 이 녀석은
[17:38]
실제로 자신의 작업을 테스트합니다.
[17:41]
개발자와 품질관리 담당자가
[17:42]
하나의 모델에 내장된 것 같습니다.
[17:44]
어제 테스트를 해봤습니다.
[17:46]
완전히 망가진 파이썬 스크립트를 줬습니다.
[17:49]
여러 버그, 이상한 엣지 케이스들,
[17:51]
저라면 디버깅하는 데 몇 시간 걸릴 그런 것들 말이죠.
[17:53]
30초 만에 모든 버그를 찾아내고
[17:55]
완벽한 수정을 작성하고
[17:57]
작동한다는 걸 증명하는 테스트까지 줬습니다.
[17:59]
그리고 코드 품질은 대부분의 사람이 작성하는 것보다 나았습니다.
[18:01]
깔끔하고, 간단하고, 실제로 읽기 쉬웠습니다.
[18:03]
대부분의 AI 모델이 만들어내는
[18:04]
엉망진창 쓰레기가 아니라 말이죠.
[18:06]
이걸 만든 회사는 Moonshot AI입니다.
[18:08]
Kimmy 챗봇을 만든 바로 그 팀이죠.
[18:10]
하지만 이건 챗봇이 아닙니다. 이건 코드를 위한
[18:12]
외과용 도구입니다. 이들은 1500억 개의
[18:14]
실제 코드 토큰으로 훈련시켰습니다. GitHub
[18:17]
이슈, 풀 리퀘스트, 개발자들이
[18:18]
버그를 수정할 때의 과정을 말이죠. 단순히
[18:20]
코딩하는 방법만 아는 게 아니라, 개발자처럼
[18:23]
사고하는 방법을 알고 있어요. 이게 왜
[18:25]
여러분의 비즈니스에 중요한지 말씀드릴게요.
[18:27]
지금 개발자들에게 비용을 지불하고 있다면,
[18:28]
이 도구로 비용을 절반으로 줄일 수 있어요.
[18:30]
코딩을 배우려고 한다면, 이게 바로
[18:32]
최고의 선생님이 될 거예요. 소프트웨어를
[18:34]
개발하고 있다면, 이게 바로 여러분의
[18:36]
비밀병기가 될 거예요. 저는 이미 제
[18:38]
에이전시에서 사용하기 시작했어요. 저희
[18:40]
개발자들은 더 빠르게 버그를 수정하고,
[18:42]
더 나은 코드를 작성하고 있으며,
[18:44]
더 이상 문제에 몇 시간씩 매달리지
[18:46]
않게 되었어요. 하지만 더 좋은 점이 있어요.
[18:48]
이 도구는 로컬에서 실행됩니다. 즉, 여러분의
[18:49]
코드가 절대 컴퓨터를 떠나지 않아요.
[18:51]
프라이버시 걱정도, 데이터 유출 우려도 없죠.
[18:53]
여러분의 지적 재산권은 여러분 것으로 남아있어요.
[18:55]
대형 AI 회사들과 비교해보세요.
[18:57]
그들은 여러분이 업로드하는 모든 것을 봅니다.
[18:58]
여러분의 코드로 학습하죠. 여러분의 아이디어를
[19:01]
경쟁사에게 줄 수도 있어요. 킴데브를 사용하면
[19:04]
여러분의 코드는 비공개로 유지되고, 설정은
[19:05]
비디오 게임을 설치하는 것보다 쉬워요.
[19:08]
다운로드하고 명령어 하나만 실행하면
[19:10]
지구상 최고의 AI 모델과 함께 코딩할 수 있어요.
[19:12]
어떻게 설정하는지, 어떻게 사용하는지,
[19:14]
그리고 최고의 결과를 얻는
[19:16]
구체적인 프롬프트를 보여드릴게요. 하지만 먼저
[19:17]
이 도구가 실제로 무엇을 할 수 있는지 보여드릴게요.
[19:21]
실제 예시를 들어보겠습니다. 어제
[19:22]
제가 맡은 고객의 이커머스 사이트가
[19:25]
고장났었어요. 결제 프로세스가 실패하고 있었죠.
[19:27]
사용자들이 장바구니에 상품을 담았지만
[19:28]
구매를 완료할 수 없어서 매출 손실과
[19:31]
화난 고객들이 생겼죠. 뻔한 상황이잖아요.
[19:33]
저희 개발자가 버그를 찾으려고
[19:35]
4시간을 보냈어요. 4시간이나요.
[19:37]
인건비로 400달러가 들었는데, 여전히
[19:40]
고치지 못했어요. 그래서 저는 코드를
[19:41]
킴데브에 입력했어요. 2분도 안 되어서
[19:43]
정확한 문제를 찾아냈어요. 결제 처리에서
[19:45]
발생한 레이스 컨디션이었어요. 완벽한
[19:47]
수정 코드를 작성했고, 심지어 버그가
[19:49]
다시 발생하지 않도록 테스트 코드까지
[19:51]
작성해줬어요. 2분 대 4시간. 이건 단순히
[19:53]
인상적인 게 아니라, 비즈니스를
[19:55]
바꾸는 수준이에요. 하지만 정말 저를 놀라게 한 건
[19:57]
수정 코드가 단순히 정확할 뿐만 아니라
[19:58]
우아하고 깔끔해서 전체 시스템을
[20:01]
더 좋게 만들었다는 점이에요. 대부분의 AI 모델은
[20:03]
작동은 하지만 기술 부채를 만드는
[20:05]
지저분한 패치를 제공해요. 이 도구는 제품
[20:07]
수준의 코드를 제공했어요. 이건 단지
[20:09]
하나의 예시일 뿐이에요. 저는 모든 것에
[20:11]
테스트해봤어요. 자바스크립트 버그,
[20:14]
파이썬 크래시, 영원히 실행되는 데이터베이스 쿼리,
[20:16]
쓰레기 값을 반환하는 API 엔드포인트까지.
[20:18]
이 도구는 모든 걸 고쳐줍니다. 이제
[20:20]
이 마법이 실제로 어떻게 작동하는지
[20:22]
설명해드릴게요. 이걸 이해하면
[20:23]
왜 다른 것들보다 훨씬 뛰어난지
[20:25]
알 수 있을 거예요. 대부분의 코딩 AI 모델은
[20:28]
기본적으로 고급 자동완성 기능이에요.
[20:29]
타이핑을 시작하면 다음에 올 내용을
[20:30]
추측하죠. 때로는 맞기도 하지만
[20:32]
보통은 틀리고, 틀렸을 때는 그들의
[20:35]
실수를 고치느라 몇 시간을 낭비하게 돼요.
[20:37]
킴데브는 완전히 다르게 작동해요.
[20:39]
실제 개발자가 일하는 방식을 모방한
[20:41]
2단계 프로세스를 갖고 있어요. 1단계는
[20:43]
파일 로컬라이제이션이라고 불러요. 무작정
[20:45]
코드를 무작정 수정하는 대신
[20:46]
정확히 어떤 파일을 수정해야 하는지 먼저 파악합니다.
[20:48]
버그 리포트를 읽고 코드베이스를 분석하며
[20:50]
시스템의 구조를 이해합니다.
[20:52]
시스템 각 부분 간의
[20:54]
관계를 파악하죠. 대부분의 AI 모델은
[20:56]
무작위로 파일을 수정하며
[20:59]
뭔가 작동하길 바라기만 합니다. 하지만 Kimmy Dev는 외과적으로 정확합니다.
[21:02]
무엇을 고치기 전에 문제가 정확히 어디에 있는지
[21:04]
알고 있습니다. 2단계는
[21:06]
코드 편집입니다. 어떤 파일을
[21:09]
변경할지 알게 되면 실제 수정을 진행합니다. 하지만
[21:11]
여기서 놀라운 점은
[21:12]
단순히 즉각적인 문제만 해결하는 게 아니라는 것입니다.
[21:14]
예외 상황을 고려하고
[21:17]
수정이 시스템의 다른 부분에 미치는
[21:19]
영향을 생각합니다. 실제 프로덕션에서
[21:21]
사용할 수 있는 코드를 작성하죠.
[21:23]
그리고 제가 언급한 두 개의 뇌, 버그
[21:25]
수정기와 테스트 작성기가 이 전체 과정에서
[21:27]
함께 작업합니다. 버그 수정기는
[21:29]
문제를 찾아서 해결하고, 테스트 작성기는
[21:31]
수정이 실제로 작동하는지 확인하고
[21:33]
다시 문제가 발생하지 않도록 합니다. 이는 정말 중요한데
[21:35]
대부분의 코딩 실패는 하나의 버그를
[21:37]
고쳤지만 새로운 버그 세 개를 만들 때 발생합니다.
[21:40]
Kimmy Dev에서는 그런 일이 일어나지 않습니다. 테스트
[21:42]
작성기 뇌가 지속적으로
[21:44]
버그 수정기 뇌의 작업을 확인합니다. 하지만 더 있습니다.
[21:46]
이 모델은
[21:48]
강화학습이라고 불리는 기법을 사용해
[21:50]
Docker 컨테이너에서 훈련되었습니다. 이는
[21:52]
실제 환경에서 코딩하도록
[21:54]
가르치는 고급 기법입니다. 다른 모델들처럼
[21:56]
단순히 코드 예제만 학습시킨 게 아닙니다.
[21:58]
실제로 망가진 저장소와 실제 회사들이
[22:00]
직면한 진짜 버그를 제공했습니다. 그리고
[22:02]
버그를 완전히 수정했을 때만
[22:04]
보상을 주었습니다. 부분적으로가 아닌 완전히 말이죠.
[22:07]
즉, 이 모델이 제안하는 모든 수정사항은
[22:10]
실전에서 검증되었습니다.
[22:12]
수백만 개의 실제 상황에서 학습했죠.
[22:14]
버그를 제공하면 아마도
[22:15]
비슷한 것을 본 적이 있을 겁니다.
[22:17]
인터넷의 무작위 코드로
[22:18]
훈련된 다른 모델들과 비교해보세요.
[22:20]
그 코드의 절반은 아마 이미 망가져 있을 겁니다.
[22:22]
Kimmy Dev는 실제로 작동하는 코드에서 학습했고
[22:24]
결과가 그것을 증명합니다.
[22:26]
제가 언급한 SWE 벤치 검증 테스트에서
[22:28]
경쟁 모델들과 어떻게 비교되는지 보겠습니다.
[22:30]
이전의 최고 오픈소스 모델은
[22:32]
이 테스트에서 약 40%를 받았습니다.
[22:34]
Kimmy Dev는 60.4%를 받았습니다. 이는
[22:37]
50% 향상입니다. AI 관점에서 보면
[22:40]
자전거에서 페라리로 업그레이드한 것과 같습니다.
[22:42]
심지어 대부분의 유료 모델도
[22:44]
이 성능에 근접하지 못합니다. Claude는 약 50%,
[22:46]
GPT-4는 약 55%를 받습니다. Kimmy Dev는 둘 다
[22:49]
이기며 무료입니다. 더 나은 성능을 보이는
[22:51]
모델들은 절대 최고급
[22:54]
클로즈드 소스 모델들뿐입니다. 구글의 Gemini
[22:56]
Pro와 Anthropic의 Claude Opus인데
[22:59]
본격적으로 사용하려면 한 달에
[23:01]
수백 달러가 듭니다. 결론은
[23:03]
이것입니다. 이 세 개의 중국 AI 에이전트가
[23:06]
모든 것을 바꾸었습니다. ByteDance의 Seed
[23:08]
Coder, Kimmy Dev, 그리고 Minimax M1이
[23:10]
수천 달러의 비용이 들고
[23:12]
몇 주가 걸리던 기능들을
[23:14]
무료로 제공합니다.
[23:16]
미국 회사들이 수백 달러를 청구하는 동안 말이죠.
[23:17]
매월 수백 달러를 청구하죠. 이걸
[23:20]
먼저 파악한 기업들이
[23:21]
시장을 지배하게 될 거예요.
[23:23]
이런 도구들을 마스터한 기업가들은
[23:25]
제국을 건설할 거고요.
[23:27]
이걸 구현하는 에이전시들은
[23:29]
경쟁사들을 완전히 따돌릴 겁니다.
[23:31]
다른 사람들이 여전히
[23:33]
열등한 도구에 돈을 쓰고 있는 동안
[23:35]
뒤처지지 마세요. 시청해 주셔서
[23:36]
정말 감사합니다. 오늘 사용한
[23:38]
모든 프롬프트와 다양한 테스트에
[23:40]
접근하고 싶으시다면, AI 성공
[23:42]
랩에서 확인하실 수 있어요.
[23:44]
왼쪽에서 보시는 것처럼
[23:45]
다른 많은 교육 과정들도
[23:47]
함께 제공됩니다. 그리고 교실 안에는
[23:49]
다양한 교육 과정들이 있어요.
[23:50]
추가로, 커뮤니티 내에서는
[23:52]
매일 새로운 무료 교육을 제공하고 있어요.
[23:55]
보시는 것처럼요. 그래서 우리는
[23:57]
항상 새로운 교육을 공유하고 있습니다.
[24:00]
매일 무료 선물을 받고 싶고,
[24:02]
11,500명의 커뮤니티와
[24:04]
저와 개인적으로 연결되고 싶으시다면,
[24:05]
댓글 설명란에 있는 AI 프로핏
[24:08]
보드룸 링크로 언제든지 참여하세요.
[24:10]
750명이 되면 가격이 오를 예정이니까
[24:12]
지금 바로 할인가로 등록하세요.
[24:14]
그 안에서는 실제로
[24:16]
자동화를 요청할 수 있어요.
[24:17]
매주 이 스레드에 보고 싶은
[24:19]
자동화를 게시하기만 하면
[24:21]
개인화된 비디오를 녹화하고
[24:23]
그 자동화를 만들어 드립니다.
[24:25]
또한, 저에게 DM을 보낼 수 있고
[24:26]
어떤 질문이든 물어볼 수 있어요.
[24:28]
이 커뮤니티가 얼마나 활발한지
[24:29]
보실 수 있을 거예요. 그 안에는
[24:31]
정말 멋진 것들이 많이 있어요.
[24:33]
그리고 제가 이걸 만든 이유는
[24:35]
AI로 비즈니스를 확장하고
[24:37]
더 많은 돈을 벌고, 매일
[24:40]
승리하고 배우고 성장하는 데
[24:41]
관심 있는 진지한 기업가들의
[24:44]
커뮤니티를 연결하기 위해서입니다.
[24:46]
그리고 이 섹션에서 보시는 것처럼
[24:48]
우리의 최고 에이전트들,
[24:50]
템플릿, 워크플로우들이 있어요.
[24:52]
예를 들어, 우리가 추가하고 있는
[24:55]
이 모든 새로운 워크플로우들 말이에요.
[24:58]
예를 들어, 페이스북 광고 생성기,
[25:00]
비디오 워크플로우, 퍼플렉시티
[25:02]
스크래퍼 봇, 비디오 쇼츠 클리퍼,
[25:04]
AI 음악 생성기, 원클릭
[25:06]
책 생성기 등 온갖
[25:07]
놀라운 것들이 있어요. 그리고 추가로,
[25:09]
이에 대한 실시간 도움을 원하시고,
[25:12]
실시간 지원을 원하시고,
[25:13]
질문을 하고 실시간으로
[25:14]
튜토리얼을 받고 싶으시다면,
[25:17]
실제로 주 3회 라이브 코칭 콜이
[25:19]
있어요. 그리고 시청할 수 없거나
[25:21]
참여할 수 없다면, 실제로
[25:23]
여기서 콜 녹화본을 시청할 수 있고
[25:25]
코칭 콜과 Q&A도 받을 수 있어요.
[25:27]
그러니까 댓글 설명란의 링크를
[25:29]
자유롭게 확인해 보세요. 그리고
[25:31]
저희가 이 모든 것을 자동화해 주길
[25:34]
원하신다면, 댓글 설명란에 있는
[25:35]
무료 AI 전략 세션 링크로
[25:37]
예약하세요. 그 통화에서 우리가
[25:39]
할 일은 기본적으로
[25:40]
당신이 시간을 어디에 쓰는지 보고,
[25:42]
무엇을 자동화해야 하는지 파악하는 거예요.
[25:44]
게임 플랜을 세우고, 우리가
[25:45]
하는 게 합리적이라면, 구현해서 고객이 되실 수 있어요. 댓글 설명란의 링크를 확인해 보시고, 시청해 주셔서 감사합니다.