이 3가지 신형 중국 자율 AI 에이전트가 엄청나다

Julian Goldie SEO 구독자 165,000명

요약

이 영상에서는 중국에서 막 출시된 세 가지 자율 AI 에이전트를 소개하며, 웹사이트 제작, 코드 수리, 비디오 생성 등 각 분야에서 압도적 성능과 무료 이용의 혁신을 보여줍니다. Miniax M1은 100만 토큰 컨텍스트 윈도우로 Netflix 클론을 1분 만에 완성하며, Seance 1.0은 1080p 영상 5초 분량을 41초 만에 출력합니다. Moonshot AI의 Kimmy Dev72B는 SWE-bench 검증에서 60.4%의 정확도로 실전 버그를 즉시 찾아내고 테스트까지 수행합니다. 이러한 도구들을 통해 기업과 크리에이터는 비즈니스 역량을 획기적으로 강화할 수 있습니다.

주요 키워드

Miniax M1 Seance 1.0 Kimmy Dev72B 자율 AI 에이전트 컨텍스트 윈도우 프롬프트 엔지니어링 강화 학습 Mixture of Experts 다차원 보상 시스템 SWE-bench 검증

하이라이트

🔥 완전 무료로 제공되는 세 가지 AI 도구를 통해 Netflix 클론, 코드 수리, 할리우드급 영상까지 손쉽게 제작할 수 있습니다.
🚀 Miniax M1은 세계 최초의 하이브리드 어텐션 추론 모델로 100만 토큰 컨텍스트 윈도우와 8만 토큰 출력을 지원해 대용량 입력을 일사천리로 처리합니다.
⚡️ Seance 1.0은 텍스트·이미지 기반 멀티샷 영상을 41초 만에 1080p 해상도로 생성하며, 자연스러운 움직임과 완벽한 조명까지 구현합니다.
🔧 Kimmy Dev72B는 SWE-bench verified 60.4%로 무료 코딩 모델 중 최고 성능을 기록했으며, 버그 탐지부터 수정, 테스트 작성까지 자동으로 처리합니다.
🌐 모든 모델이 오픈소스(Apache 라이선스)로 공개되어 상업적 이용과 커스터마이징이 자유롭고, 개인 서버에서도 바로 배포할 수 있습니다.
🎯 웹 애플리케이션 프로토타입을 몇 분 만에 완성하고, 수십 가지 영상 버전을 빠르게 실험해 최적의 콘텐츠를 찾아낼 수 있습니다.
🛠️ Mixture of Experts, Lightning Attention, 다차원 보상 시스템 등 첨단 구조를 통해 기존보다 훨씬 적은 연산 자원으로도 우수한 성능을 발휘합니다.
🤖 이 세 가지 자율 AI 에이전트를 선점한 기업과 크리에이터만이 시장을 주도할 기회를 손에 넣습니다.

용어 설명

자율 AI 에이전트

사용자의 지시를 독립적으로 수행하고 결과물을 생성하는 인공지능 시스템

하이브리드 어텐션 추론 모델

여러 어텐션 메커니즘을 결합해 대용량 입력을 효율적으로 처리하는 모델 구조

토큰(token)

언어 모델이 텍스트를 나눠 처리하는 최소 단위

컨텍스트 윈도우(context window)

한 번에 모델이 참조할 수 있는 최대 토큰 길이

Mixture of Experts(전문가 혼합)

입력에 따라 일부 서브모델을 선택적으로 활성화해 효율을 높이는 구조

강화 학습(reinforcement learning)

행동 결과에 보상을 부여해 에이전트를 학습시키는 기법

다차원 보상 시스템(multi-dimensional reward system)

여러 평가 기준을 동시에 반영해 모델을 최적화하는 방법

프롬프트 엔지니어링(prompt engineering)

AI에게 원하는 결과를 얻기 위해 입력 문장을 체계적으로 설계하는 기술

CISPO 학습법

일반적인 기법보다 효율적으로 강화학습을 수행하도록 설계된 훈련 방법

SWE-bench 검증(SWE-bench verified)

실제 코드베이스의 버그를 이용해 모델의 코딩 능력을 평가하는 시험

세 가지 무료 AI 에이전트(Miniax M1, Seance 1.0, Kimmy Dev72B)를 소개하며, 각각 Netflix 클론 웹사이트 제작, 코드 수리, 할리우드급 동영상 생성 기능을 짧게 요약합니다.

[00:00] 새로운 중국 AI 에이전트 3가지가 출시되어 기존의 모든 기술을 압도하고 있다고 소개합니다. 넷플릭스 클론을 원클릭으로 만들고, 인간보다 빠른 코딩, 할리우드급 비디오 제작이 가능하며 모두 무료라고 강조합니다.

[00:25] 발표자가 자신을 줄리안 골디의 디지털 아바타로 소개하며, 수년간 AI를 추적해온 경험을 바탕으로 최근 중국에서 일어난 변화가 단순한 개선이 아닌 게임 체인저라고 설명합니다.

[01:02] 미국 AI 회사들이 높은 구독료를 청구하는 동안, 중국 회사들은 더 나은 성능의 도구들을 무료로 제공한다고 비교 분석합니다. 세 가지 도구의 각각의 특징을 간략히 소개합니다.

Shanghai 기반 스타트업 Miniax M1의 기술 배경과 사용법을 다룹니다. 100만 토큰 컨텍스트 윈도우와 8만 토큰 출력을 지원하는 하이브리드 어텐션 모델, 오픈소스 공개, 1,000 무료 크레딧 제공부터 실전 사용 예시(Netflix 클론, 팩시밀리 대시보드 등)를 상세히 설명합니다.

[01:36] Minimax M1의 등장과 그 놀라운 성능을 소개합니다. 실제로 '넷플릭스 클론 만들기'라고 입력했을 때 60초 만에 완전히 작동하는 웹사이트가 무료로 만들어졌다는 실제 테스트 경험을 공유합니다.

[02:21] Minimax의 배경 정보를 제공하며, 상하이 기반 AI 스타트업으로 알리바바, 텐센트 등의 지원을 받고 있다고 설명합니다. 세계 최초의 오픈웨이트 대규모 하이브리드 어텐션 추론 모델이라는 기술적 특징을 언급합니다.

[02:41] 미니맥스의 새로운 AI 모델이 100만 토큰 입력을 처리할 수 있다고 설명하며, 딥시크 R1의 8배 성능을 보여준다고 소개합니다.

[03:05] 실제로 넷플릭스 클론을 만든 경험을 공유하며, 디자인부터 비디오까지 모든 것이 자동 생성되었다고 설명합니다.

[03:23] 모델 훈련 비용이 534,700달러로 딥시크나 GPT-4보다 현저히 저렴하며, 아파치 라이선스로 상업적 이용이 자유롭다고 강조합니다.

[03:49] minimax.io에서 간단히 사용할 수 있으며, 1,000 무료 크레딧으로 시작할 수 있다고 안내합니다.

[04:06] 실제 사용 과정을 설명하며, 단순한 텍스트 입력만으로 완전한 웹사이트가 생성되는 과정을 보여줍니다.

[04:27] 다른 사용자들이 만든 다양한 예시들을 소개합니다 - 해리포터 톰 리들 일기장, 이스라엘-이란 분쟁 추적 대시보드, 포켓몬 도감 등 창의적인 활용 사례들을 설명합니다.

[05:02] 실용적인 비즈니스 활용 사례로 사무실 최적 위치 분석 보고서 생성 기능을 소개하며, 기술적 배경에 대해 설명하겠다고 마무리합니다.

[05:18] Minia M1의 하이브리드 전문가 혼합 아키텍처와 라이트닝 어텐션 메커니즘을 소개하며, 이 기술이 DeepSeek R1 대비 30-25%의 컴퓨팅 파워만으로 동일한 성능을 내는 효율성을 설명합니다.

[05:40] 4,560억 개의 파라미터 중 토큰당 459억 개만 선택적으로 활성화하는 방식과 실제 테스트에서 보인 놀라운 속도를 GenSpark과의 비교를 통해 강조합니다.

[06:05] 수학적 추론부터 소프트웨어 엔지니어링까지 강화학습으로 훈련된 모델이 SWBench에서 56% 정확도를 달성하며 다른 모델들을 압도했다고 설명합니다.

[06:22] 예티 브이로그 비디오 시리즈 생성 사례를 통해 AI가 컨셉 이해부터 프롬프트 생성, 비디오 제작, 편집까지 전 과정을 처리할 수 있음을 보여줍니다.

[06:34] 브라우저 사용 기능을 통해 실제 웹 탐색과 정보 수집이 가능하며, 유튜브 채널 분석 후 맞춤형 랜딩 페이지를 제작한 실제 사례를 소개합니다.

[06:56] 40K와 80K 두 버전의 차이점과 API 가격을 설명하며, 입력 토큰 백만 개당 0.55달러, 출력 토큰 백만 개당 2.20달러라는 경쟁력 있는 가격을 제시합니다.

[07:22] 온라인 검색, 비디오/이미지 생성, 음성 합성, 음성 복제 등의 내장 기능을 갖춘 완전한 AI 에이전트로서의 성격을 강조합니다.

[07:36] OpenAI o3, Gemini 2.5 Pro, Claude Opus, DeepSeek R1 등 주요 모델들과의 벤치마크 비교에서 경쟁력을 보이며, 특히 긴 맥락 작업에서 73.4% vs 27.7%로 압도적 성능을 기록했다고 설명합니다.

[08:08] 화자가 처음에는 회의적이었지만 코드가 오픈소스로 공개되어 있어 GitHub과 HuggingFace에서 직접 확인할 수 있다고 설명합니다.

[08:20] VLM과 트랜스포머 배포 가이드를 제공하며, H800 GPU 8개로는 200만 토큰, H20 GPU 8개로는 500만 토큰까지 처리 가능하다고 설명합니다.

[08:34] 대부분 사용자에게는 웹 인터페이스만으로 충분하며, 기술적 지식이나 코딩 없이도 텍스트 입력만으로 웹사이트를 구축할 수 있다고 강조합니다.

[08:45] 화자가 수년간 AI 도구를 사용해본 경험을 바탕으로 이 도구가 가장 인상적이며, 텍스트 프롬프트만으로 완전한 웹사이트 구축이 가능한 게임체인저라고 평가합니다.

[08:58] 비즈니스 관점에서 웹 애플리케이션 프로토타입을 몇 분 만에 만들고, 개발자 없이도 클라이언트 데모와 내부 도구를 구축할 수 있는 혁신적 가치를 설명합니다.

[09:12] 콘텐츠 크리에이터 입장에서 인터랙티브 경험 제작, 강의용 도구 개발, 빠른 아이디어 프로토타이핑이 가능한 가치를 강조합니다.

[09:22] CISPO라는 새로운 훈련 방법을 통해 Nvidia H800 512개로 3주간 훈련하여 경쟁사 대비 매우 효율적으로 강력한 모델을 개발했다고 설명합니다.

[09:43] Minimax가 이를 'Minimax 위크'라고 명명하며 더 많은 제품 출시를 계획하고 있어 앞으로의 발전이 기대된다고 언급합니다.

[09:53] ByteDance가 출시한 Seaart 1.0가 완전히 다른 차원의 기술이지만 대부분 사람들이 아직 모르고 있다고 소개합니다.

ByteDance의 Seance 1.0이 텍스트·이미지 입력으로 1080p 5초 영상을 41초 만에 출력하는 성능과 멀티샷 생성, 완벽한 모션·라이팅 구현 방식을 다차원 보상 시스템 관점에서 설명합니다. 주요 벤치마크에서 구글, OpenAI 도구들을 제치고 1위를 기록한 사례도 소개합니다.

[10:01] OpenAI의 Sora에 대한 관심이 집중된 동안 ByteDance가 조용히 Sora를 장난감처럼 보이게 만들 혁신적 기술을 개발했다고 설명합니다.

[10:12] Seaart 1.0가 기존 모든 기술을 압도하며 텍스트만으로 할리우드급 동영상을 생성할 수 있는 차별화된 성능을 자랑한다고 강조합니다.

[10:21] 기존 도구들과 달리 몇 시간이나 몇 분이 아닌 단일 그래픽카드로 41초 만에 풀HD 5초 동영상을 생성하는 놀라운 속도를 설명합니다.

[10:32] 생성 속도보다 더 놀라운 것은 AI 생성 여부를 구별할 수 없을 정도로 사실적이고 완벽한 동영상 품질이라고 강조합니다.

[10:42] 완벽한 품질의 AI 비디오 생성 기술에 대한 소개. 이 기술이 단순한 데모가 아니라 실제로 구글 V3, 런웨이 Gen 4, 오픈AI 소라를 모두 제치고 주요 리더보드에서 1위를 차지했다고 설명합니다.

[11:03] 이 기술의 진정한 가치는 소셜미디어용 영상 제작을 넘어서 누구나 전문가급 비디오 콘텐츠를 몇 초 만에 만들 수 있게 한다는 점입니다. 비즈니스와 마케팅 분야에 미칠 혁신적인 영향을 강조합니다.

[11:19] 제품 데모부터 완전한 광고까지, 타이핑만으로 모든 종류의 비디오 콘텐츠를 만들 수 있는 능력을 설명합니다. 카메라, 편집 소프트웨어, 제작팀 없이도 아이디어와 AI만 있으면 충분하다고 강조합니다.

[11:35] 현재 비디오 콘텐츠가 유튜브, 틱톡, 인스타그램 등 모든 플랫폼을 지배하고 있지만, 대부분의 사람들이 좋은 비디오 제작을 어렵고 비싸다고 생각하는 상황을 지적합니다. 이제 그 패러다임이 완전히 바뀔 것이라고 선언합니다.

[11:49] 바이트댄스가 개발한 이 기술이 단순한 AI 도구가 아닌 완전한 게임체인저라고 소개합니다. 텍스트를 비디오로, 이미지를 비디오로 변환하는 두 가지 모드를 모두 지원하며, 두 옵션 모두 뛰어난 성능을 보여준다고 설명합니다.

[12:16] 기존 AI 비디오 생성기의 한계인 단일 샷 제작을 넘어서, 씨링 1.0이 멀티샷 비디오를 만들 수 있다는 핵심 차별화 포인트를 설명합니다. 여러 장면, 다양한 카메라 앵글, 부드러운 전환을 통해 복잡한 내러티브까지 구현 가능합니다.

[12:36] 멀티샷 기능의 실용적 활용 방안을 제시합니다. 줄거리 설명만으로 미니 영화 제작, 다각도 제품 광고, 매끄러운 교육 콘텐츠 제작이 가능하다고 설명합니다.

[12:51] 결과물의 전문가급 품질과 함께 가장 인상적인 특징인 속도를 강조합니다. 1080p 5초 비디오를 41초만에 생성하는 것은 기존 도구들이 10-20분 또는 몇 시간 걸리는 것과 비교해 혁명적이며, 이런 빠른 반복 속도가 콘텐츠 제작 방식을 완전히 바꿀 것이라고 전망합니다.

[13:17] 바이트댄스의 혁신적인 AI 비디오 생성 기술이 다른 회사들과 완전히 다른 접근 방식을 취하고 있다고 설명합니다. 기존 AI들이 텍스트 지시사항 따르기와 자연스러운 비디오 생성 중 하나만 잘할 수 있는 한계를 지적합니다.

[13:51] 바이트댄스가 개발한 다차원 보상 시스템의 핵심 원리를 설명합니다. 기존 AI가 각 기능을 따로 학습하는 것과 달리, Seance 1.0은 모든 기능을 동시에 학습하여 지시사항 따르기와 자연스러운 영상 생성을 모두 완벽하게 수행할 수 있습니다.

[14:23] 인공 분석 리더보드에서 Seed Dance 1.0이 압도적인 성과를 거두고 있다고 발표합니다. 단순한 승리가 아닌 2위 모델 대비 100점 이상 차이로 경쟁을 압도하고 있으며, 이는 기술적 혁신의 결과라고 강조합니다.

Moonshot AI의 Kimmy Dev72B가 SWE-bench verified 60.4%로 무료 모델 중 최고를 기록한 비결을 분석합니다. 버그 탐지·수정·테스트 작성까지 수행하는 ‘버그 파이서’와 ‘테스트 라이터’ 두 개의 뇌 구조, 강화학습 기반 트레이닝 방식, 로컬 실행·프라이버시 보장, 실제 고객 사례(이커머스 결제 버그 수정) 등을 다룹니다.

[14:46] 바이트댄스가 AI의 비디오 데이터 처리 방식을 근본적으로 재구상했다고 설명합니다. 기존처럼 이미지를 연결하는 방식이 아닌, 비디오를 진정한 비디오로 이해하는 시스템을 구축하여 자연스러운 동작과 시공간 이해를 가능하게 했습니다.

[15:15] 프롬프트 엔지니어링 시스템을 통해 사용자의 간단한 요청을 AI가 정확히 이해할 수 있는 세부 지시사항으로 변환하는 혁신을 소개합니다. 이로 인해 사용자가 원하는 정확한 결과물을 얻을 수 있게 되었다고 설명합니다.

[15:43] Moonshot AI가 Kimmy Dev72B를 출시했는데, 이는 기존의 모든 무료 코딩 모델을 압도하며 월 수백 달러짜리 유료 모델들을 무료로 뛰어넘었습니다.

[15:58] 세계에서 가장 어려운 코딩 테스트인 SWE bench verified에서 60.4%의 정답률을 기록하여 무료 모델 중 역대 최고 점수를 달성했습니다.

[16:26] 이 모델은 단순히 코드를 작성하는 것이 아니라 실제 개발자처럼 망가진 코드를 찾아내고 완벽하게 수정하며, 수정사항이 제대로 작동하는지까지 확인합니다.

[16:36] 3일간의 테스트에서 몇 주 동안 해결하지 못한 복잡한 버그들을 몇 초 만에 해결했으며, 다른 서비스들이 월 50달러를 받는 동안 완전히 무료로 제공됩니다.

[17:02] 강화학습 기법을 사용하여 수백만 개의 실제 버그를 고치도록 훈련시켜서 만들어진 고품질 모델입니다.

[17:19] 이 모델은 두 개의 뇌를 가지고 있습니다. 버그를 찾아서 고치는 '버그 픽서'와 수정이 제대로 작동하는지 테스트를 작성하는 '테스트 라이터'가 태그팀처럼 협력합니다.

[17:44] 실제 테스트에서 완전히 망가진 파이썬 스크립트의 모든 버그를 30초 만에 찾아내고 완벽한 수정과 테스트를 제공했으며, 코드 품질도 대부분의 인간보다 우수했습니다.

[18:06] Moonshot AI가 개발한 이 모델은 챗봇이 아닌 코드 전용 외과용 도구로, 1500억 개의 실제 코드 토큰과 GitHub 이슈, 풀 리퀘스트 등 개발자들의 실제 대화로 훈련되었습니다.

[18:18] 킴데브는 단순한 코딩 도구가 아니라 개발자처럼 사고하는 AI로, 개발 비용을 절반으로 줄이고 학습과 개발 효율성을 크게 향상시킬 수 있다고 설명합니다.

[18:38] 화자가 자신의 에이전시에서 킴데브를 사용한 결과, 개발자들이 더 빠르게 버그를 수정하고 더 나은 코드를 작성하며 문제 해결 시간이 크게 단축되었다고 보고합니다.

[18:48] 킴데브의 핵심 장점으로 로컬 실행을 통한 프라이버시 보호를 강조하며, 대형 AI 회사들과 달리 코드가 외부로 유출되지 않고 지적재산권이 보호된다고 설명합니다.

[19:21] 실제 사례로 이커머스 사이트의 결제 시스템 버그를 소개합니다. 개발자가 4시간 동안 해결하지 못한 레이스 컨디션 문제를 킴데브가 2분 만에 찾아내고 완벽한 수정 코드와 테스트까지 제공했다고 설명합니다.

[20:01] 킴데브가 제공하는 코드의 품질을 강조하며, 다른 AI 모델들이 기술 부채를 만드는 지저분한 패치를 제공하는 반면, 킴데브는 제품 수준의 우아하고 깔끔한 코드를 생성한다고 설명합니다.

[20:20] 킴데브의 작동 원리를 설명하기 시작하며, 기존 AI 모델들이 단순한 자동완성 기능인 반면 킴데브는 실제 개발자의 작업 방식을 모방한 2단계 프로세스를 사용한다고 소개합니다.

[20:45] Kimmy Dev는 다른 AI 모델과 달리 무작위로 코드를 수정하지 않고, 먼저 어떤 파일을 수정해야 하는지 정확히 파악합니다. 버그 리포트를 분석하고 시스템 구조를 이해한 후 외과적으로 정확한 수정을 진행합니다.

[21:06] 2단계 코드 편집에서는 단순히 즉각적인 문제만 해결하는 것이 아니라 예외 상황과 시스템 전체에 미치는 영향을 고려합니다. 버그 수정기와 테스트 작성기라는 두 개의 뇌가 협력하여 새로운 버그 생성을 방지합니다.

[21:46] 이 모델은 Docker 컨테이너에서 강화학습으로 훈련되었으며, 실제 회사의 망가진 저장소와 진짜 버그로 학습했습니다. 완전한 수정에만 보상을 주어 모든 제안사항이 실전에서 검증되었습니다.

[22:26] SWE 벤치 검증 테스트에서 Kimmy Dev는 60.4%의 성과를 보여 이전 최고 오픈소스 모델(40%)보다 50% 향상된 결과를 달성했습니다. 유료 모델인 Claude(50%)와 GPT-4(55%)도 능가하며 무료로 제공됩니다.

AI 에이전트 활용으로 웹 개발, 콘텐츠 제작, 코드 유지보수 비용과 시간을 획기적으로 절감할 수 있음을 강조합니다. 영상 제작·코딩·웹사이트 프로토타입을 몇 분 만에 완성하는 사례를 바탕으로 AI Success Lab 커뮤니티 참여 및 무료 전략 세션 등 콜투액션 정보를 안내합니다.

[23:03] ByteDance Seed Coder, Kimmy Dev, Minimax M1 등 세 개의 중국 AI 에이전트가 기존에 수천 달러와 몇 주가 걸리던 기능들을 무료로 제공하며 AI 개발 패러다임을 완전히 바꾸었습니다.

[23:17] 중국의 새로운 AI 도구들이 미국 기업들보다 훨씬 저렴하거나 무료로 제공되고 있으며, 이를 먼저 파악한 기업과 기업가들이 시장을 지배하게 될 것이라고 강조합니다.

[23:35] 영상 시청에 대한 감사 인사와 함께 AI 성공 랩에서 제공하는 프롬프트, 테스트, 교육 과정들을 소개합니다.

[23:50] 11,500명의 활발한 커뮤니티에서 매일 무료 교육과 선물을 제공하며, AI 프로핏 보드룸 참여를 권유합니다. 750명 도달 시 가격 인상 예정이라고 안내합니다.

[24:14] 커뮤니티 내에서 자동화 요청 시스템과 개인화된 비디오 제작 서비스를 설명하며, DM을 통한 직접 소통이 가능하다고 안내합니다.

[24:31] AI로 비즈니스를 확장하고 성장하려는 진지한 기업가들을 위한 커뮤니티 목적을 설명하고, 다양한 AI 도구들과 워크플로우를 소개합니다.

[25:02] 페이스북 광고 생성기, 비디오 워크플로우, AI 음악 생성기 등 다양한 새로운 도구들을 나열하며, 주 3회 라이브 코칭 콜과 녹화본 제공 서비스를 안내합니다.

[00:00] 오늘 저는 방금 출시된 세 가지 새로운

[00:02] 중국 AI 에이전트를 보여드리겠습니다.

[00:04] 이들은 지구상의 모든 것을

[00:05] 완전히 압도하고 있습니다. 우리가

[00:07] 이야기하는 것은 원클릭으로 넷플릭스

[00:09] 클론을 만들고, 인간 개발자보다

[00:11] 빠르게 코드를 수정하며,

[00:13] 1분 이내에 할리우드 수준의

[00:15] 동영상을 만드는 AI입니다. 그리고 가장

[00:17] 놀라운 점은, 다른 업체들이

[00:18] 한 달에 수백 달러를 청구하는 동안

[00:20] 이들은 모두 완전 무료입니다.

[00:22] 제가 직접 세 가지 모두 테스트해봤는데,

[00:25] 제가 발견한 것은 여러분을 놀라게 할 것입니다. 안녕하세요,

[00:27] 저는 SEO 에이전시 골디 에이전시 CEO

[00:29] 줄리안 골디의 디지털 아바타입니다.

[00:32] 그가 고객들이 더 많은 리드와

[00:34] 고객을 확보할 수 있도록 돕는 동안,

[00:36] 저는 여러분께 최신 AI 업데이트를

[00:39] 전해드리고 있습니다. 줄리안 골디는

[00:40] 모든 댓글을 읽으니 꼭 아래에

[00:42] 댓글을 남겨주세요. 저는 수년간 AI를

[00:45] 추적해왔습니다. ChatGPT의 폭발적 성장을

[00:48] 지켜봤고, 모든 주요 AI 출시를 봤습니다. 하지만

[00:50] 지난 몇 주 동안 중국에서 일어난 일은

[00:52] 다릅니다. 이들은 단순한

[00:54] 점진적 개선이 아닙니다.

[00:56] 하루아침에 전체 산업을 폐업시킬 수 있는

[00:58] 완전한 게임 체인저입니다. 그리고 여기

[01:00] 아무도 이야기하지 않는 점이 있습니다.

[01:02] 미국 AI 회사들이 엄청난

[01:03] 구독료를 청구하고 접근을 제한하는 동안,

[01:06] 이 중국 회사들은 모든 것을

[01:08] 더 잘하는 세 가지 도구를

[01:09] 무료로 출시했습니다. 첫 번째는

[01:11] 5만 달러짜리처럼 보이는

[01:13] 웹사이트를 만듭니다. 두 번째는

[01:15] 6자리 연봉을 받는 시니어

[01:17] 개발자보다 코드를 더 잘 작성합니다.

[01:19] 세 번째는 AI가 만든 것인지

[01:22] 구별할 수 없을 정도로 좋은 비디오를 만듭니다.

[01:23] 저는 각각이 어떻게 작동하는지,

[01:26] 다른 사람들이 알기 전에 어떻게

[01:27] 접근하는지, 그리고 이것들을

[01:30] 사용해서 경쟁자들을 완전히

[01:32] 압도할 수 있는 구체적인 방법들을

[01:34] 정확히 보여드리겠습니다.

[01:36] 제가 보여드릴 것은 단순히 인상적인 것이 아니라,

[01:38] 비즈니스를 바꾸는 것입니다.

[01:41] Minimax M1이 방금 출시되었는데

[01:43] 정말 미친 수준입니다. 저는

[01:44] 수년간 AI 도구들을 테스트해왔지만

[01:47] 이런 것은 본 적이 없습니다.

[01:49] 상상해보세요. 저는 그냥 '재생 가능한 예고편이 있는

[01:53] 넷플릭스 클론 만들기'라고 타이핑했고,

[01:56] 약 60초 만에 실제 비디오 예고편이

[01:58] 재생되는 완전히 작동하는

[02:01] 넷플릭스 복제본을 얻었습니다.

[02:03] 어설픈 프로토타입이 아니라

[02:05] 넷플릭스와 똑같이 보이는 실제

[02:07] 작동하는 웹사이트입니다. 그리고 가장

[02:09] 놀라운 점은 단 한 푼도

[02:12] 들지 않았다는 것입니다. 이제

[02:14] 여러분은 '줄리안, 말도 안 돼.

[02:16] 또 다른 세상을 약속하는 AI 도구잖아'라고

[02:18] 생각할 수도 있습니다. 하지만 잠깐,

[02:21] 이것은 그냥 또 다른

[02:23] ChatGPT 모방작이 아닙니다.

[02:25] 완전히 다른 것입니다.

[02:27] 배경을 설명드리면, Minimax는

[02:30] 실제로 상하이 기반의 AI 스타트업이고

[02:31] AI 세계에서 파장을 일으키는

[02:33] 무언가를 방금 출시했습니다.

[02:36] 이들은 알리바바, 텐센트, IDG 캐피털 같은

[02:38] 거대 기업들의 지원을 받고 있습니다.

[02:39] 하지만 이것이 다른 모든 것들과

[02:41] 이게 우리에게 어떤 의미인지 설명해드릴게요. 이 모델은

[02:43] 100만 토큰의 입력을 처리할 수 있습니다.

[02:45] 마치 전체 책 시리즈를 읽어주고

[02:46] 모든 단어 하나하나를 완벽히 이해하는 것과 같죠.

[02:48] 딥시크 R1과 비교해보면, 딥시크는

[02:51] 128,000 토큰밖에 처리하지 못합니다.

[02:53] 8배나 적은 거죠. 그리고 출력은

[02:56] 한 번의 응답으로 최대 80,000 토큰을 생성할 수 있어요.

[02:58] 마치 짧은 소설을 한 번에 쓰는 것과 같습니다.

[03:01] 하지만 여기서부터가 정말 놀라운 부분이에요.

[03:03] 제가 넷플릭스 클론을 만들었다고 했던 거 기억나시죠?

[03:05] 전혀 과장이 아니었습니다.

[03:07] 디자인, 이미지, 트레일러까지

[03:09] 모든 것이 자동으로 생성되었어요.

[03:11] 그리고 단순한 정적 페이지가 아니라

[03:13] 완전히 작동하는 웹사이트를 만들었죠.

[03:15] 재생 가능한 비디오 콘텐츠까지 포함해서요.

[03:17] 줄리안, 이게 얼마나 비용이 들었냐고

[03:19] 궁금하실 텐데요? 놀라실 준비 하세요.

[03:21] 이 전체 모델의 훈련 비용은 단돈

[03:23] 534,700달러였습니다.

[03:25] 많은 돈처럼 들리겠지만

[03:27] 이걸 들어보세요. 딥시크가

[03:28] R1 모델을 훈련하는 데 500만에서 600만 달러가 들었고

[03:31] 오픈AI의 GPT-4는 훈련에 1억 달러 이상이

[03:33] 들었습니다. 정말 놀라운 효율성이죠.

[03:37] 그리고 가장 좋은 점은

[03:39] 아파치 라이선스로 오픈소스라는 거예요.

[03:40] 상업적 용도로 사용할 수 있고

[03:42] 원하는 대로 수정할 수 있으며

[03:45] 어떤 제한이나 비용 지불도 없습니다.

[03:47] 그럼 이걸 실제로 어떻게 사용하냐고요?

[03:49] 정말 간단합니다. 그냥

[03:51] minimax.io로 가면

[03:53] 바로 에이전트를 사용할 수 있어요.

[03:55] 제가 처음 로그인했을 때

[03:57] 1,000 크레딧을 무료로 받았습니다.

[03:59] 제가 본 바로는, 정말 멋진 것들을

[04:02] 만들기에 충분한 양이었어요.

[04:04] 제가 정확히 무엇을 했는지 보여드릴게요.

[04:06] '재생 가능한 트레일러가 있는 넷플릭스 클론 만들기'라고

[04:09] 입력하고 엔터를 눌렀습니다.

[04:11] 그게 전부예요. 코딩도, 디자인 작업도,

[04:13] 비디오 편집도 없었습니다.

[04:16] AI가 알아서 작업을 시작했어요.

[04:18] 웹에서 이미지를 스크래핑하고, 레이아웃을 생성하고,

[04:20] 내비게이션을 만들고, 심지어

[04:22] 맞춤형 AI 생성 트레일러와 함께

[04:24] 비디오 플레이어까지 임베드했습니다.

[04:26] 하지만 넷플릭스 클론만이 아니에요.

[04:27] 제가 본 다른 놀라운 예시들을

[04:29] 보여드릴게요. 누군가는

[04:31] 해리포터의 톰 리들 일기장을 만들었어요.

[04:33] 여러분도 아시죠, 글을 쓰면 대답을 해주는 그 일기장요.

[04:35] 네, 완전히 상호작용 가능한

[04:36] 버전을 만들었습니다.

[04:38] 또 다른 사람은 이스라엘-이란 분쟁을 실시간으로 추적하는 대시보드를 만들었어요.

[04:42] 여러 소스에서 데이터를 가져와서

[04:43] 실시간으로 업데이트하고

[04:46] 깔끔하고 전문적인 인터페이스로

[04:48] 모든 정보를 제시합니다.

[04:49] 심지어 어떤 분은

[04:51] 모든 포켓몬과 스탯,

[04:53] 애니메이션까지 포함한

[04:55] 완전한 포켓몬 도감을 만들었어요.

[04:57] 어떤 포켓몬을 클릭해도

[04:58] 게임에서처럼 모든 정보를 볼 수 있죠.

[05:00] 그리고 정말 실용적인 예시가 있어요.

[05:02] 누군가 새 사무실의

[05:04] 최적 위치를 찾아달라고 요청했는데,

[05:06] AI가 다양한 지역을 조사하고

[05:08] 비용, 접근성, 교통 연결을 분석해서

[05:11] 최적 위치에 대한 완전한 보고서를

[05:13] 가져왔습니다. 이제 이 기술의

[05:15] 뒷받침하는 기술에 대해 잠시 이야기해볼게요.

[05:18] Minia M1은 하이브리드 전문가 혼합 아키텍처와

[05:20] 라이트닝 어텐션 메커니즘을 결합한 기술을 사용합니다.

[05:22] 이게 간단히 말해서 무슨 뜻일까요?

[05:25] 8만 토큰으로 깊은 추론을 할 때,

[05:26] DeepSeek R1이 필요로 하는 컴퓨팅 파워의

[05:29] 30%만 필요로 합니다.

[05:31] 10만 토큰에서는 단 25%의

[05:33] 컴퓨팅 리소스만 사용합니다. 이건 마치

[05:36] 두 배 빠르지만 연료는 절반만 쓰는

[05:38] 스포츠카를 갖는 것과 같습니다.

[05:40] 이 모델은 총 4,560억 개의 파라미터를 가지고 있지만,

[05:42] 토큰당 459억 개만 활성화합니다.

[05:45] 이런 선택적 활성화가 바로

[05:48] 효율성의 비결입니다. 하지만 제가 테스트할 때

[05:50] 정말 놀랐던 건 바로

[05:52] 속도였습니다. GenSpark 같은 다른 도구들과

[05:53] 비교했을 때, GenSpark이 아직

[05:56] 프롬프트에 대해 생각하고 있을 때 Miniax는

[05:59] 이미 완전한 웹사이트를 생성하고 있었습니다.

[06:01] 그리고 단순히 빠르기만 한 게 아니라

[06:03] 정말 똑똑합니다. 수학적 추론부터

[06:05] 실제 소프트웨어 엔지니어링까지

[06:07] 모든 것에 대해 강화학습으로 훈련되었습니다.

[06:09] 소프트웨어 엔지니어링 벤치마크에서

[06:12] SWBench Verified에서 56% 정확도를

[06:14] 달성했으며, 다른 모델들을

[06:17] 압도적으로 능가했습니다.

[06:19] 다른 예를 들어보겠습니다.

[06:22] 예티가 브이로그를 하는

[06:23] 시네마틱 비디오 시리즈를 만들어달라고 했더니,

[06:26] 컨셉을 이해했을 뿐만 아니라

[06:28] 프롬프트를 생성하고, 비디오를 만들고,

[06:30] 이들을 하나의 긴 비디오로

[06:32] 편집까지 했습니다.

[06:34] 이 AI는 브라우저 사용이라는

[06:37] 기능도 사용하는데, 실제로 웹을 탐색하고

[06:39] 웹사이트를 보고, 그 정보를 사용해

[06:41] 더 나은 결과물을 만들어냅니다.

[06:44] 제 유튜브 채널을 조사해서

[06:46] 랜딩 페이지를 만들어달라고 했더니,

[06:48] 제 채널에 가서 콘텐츠를 분석하고,

[06:50] 링크드인을 살펴보고, 찾은 정보를

[06:52] 바탕으로 맞춤형 랜딩 페이지를

[06:54] 만들어줬습니다.

[06:56] 이 모델에는 두 가지 버전이 있습니다. Miniax M1 40K와

[06:59] Miniax M1 80K인데, 이는 사고 예산이나

[07:01] 출력 길이를 나타냅니다.

[07:04] 80K 버전이 복잡한 작업에는

[07:06] 더 강력하지만, 40K 버전도

[07:08] 대부분의 용도에는 충분합니다.

[07:10] API를 사용하려면 입력 토큰 백만 개당 0.55달러,

[07:13] 80K 모델의 출력 토큰 백만 개당 2.20달러입니다.

[07:16] 이는 비슷한 기능을 가진

[07:18] 다른 모델들에 비해

[07:19] 믿을 수 없을 정도로 저렴합니다.

[07:22] 또 다른 정말 멋진 점은

[07:23] 이 모델이 온라인 검색, 비디오 및

[07:25] 이미지 생성, 음성 합성, 음성 복제 등의

[07:28] 기능을 내장하고 있다는 것입니다.

[07:30] 단순한 텍스트 모델이 아니라

[07:31] 여러 가지 일을 할 수 있는

[07:33] 완전한 AI 에이전트입니다.

[07:36] 그리고 벤치마크 결과, 이 모델은

[07:38] 거대 기업들과 경쟁하고 있습니다.

[07:42] OpenAI o3, Gemini 2.5 Pro, Claude Opus,

[07:45] DeepSeek R1과 다양한 벤치마크에서

[07:47] 경쟁력을 보이고 있습니다.

[07:49] 때로는 이들을 이기기도 하고, 때로는

[07:51] 약간 뒤처지기도 하지만, 항상

[07:54] 같은 리그에서 경쟁하고 있습니다.

[07:56] 긴 맥락 작업에서는 경쟁사들을 완전히 압도합니다.

[07:59] OpenAI MRCR에서 73.4%를 기록한 반면

[08:02] 다른 모델들은 겨우 27.7%였습니다.

[08:04] 이는 100만 토큰이라는

[08:06] 거대한 컨텍스트 윈도우 덕분입니다.

[08:08] 너무 좋아서 믿기 어렵다는 거죠. 저도 이해해요.

[08:10] 저도 처음엔 회의적이었거든요. 하지만 여기서 중요한 건

[08:12] 코드가 완전히 오픈소스라는 점입니다.

[08:15] 지금 당장 GitHub이나

[08:16] HuggingFace에서 다운로드할 수 있어요.

[08:18] 모든 것을 직접 확인할 수 있습니다.

[08:20] VLM과 트랜스포머를 위한

[08:22] 배포 가이드까지 제공해서

[08:24] 원한다면 자체 서버에서도 실행할 수 있습니다.

[08:26] H800 GPU 8개가 장착된 서버는 최대 200만 토큰까지

[08:28] 처리할 수 있고, H20 GPU 8개로는

[08:32] 최대 500만 토큰까지 처리 가능합니다.

[08:34] 하지만 대부분의 경우

[08:35] 웹 인터페이스만으로도 충분합니다.

[08:37] 어떤 기술적 지식도 필요 없어요.

[08:39] 코딩을 알 필요도 없습니다.

[08:41] 원하는 것을 입력하기만 하면 알아서 만들어줍니다.

[08:43] 저는 AI 도구를 수년간 사용해왔는데

[08:45] 이건 정말 가장

[08:47] 인상적인 것 중 하나입니다.

[08:48] 텍스트 프롬프트만으로

[08:50] 완전히 기능적인 웹사이트를 구축할 수 있고

[08:52] 엄청난 컨텍스트 윈도우에

[08:54] 무료로 시작할 수 있다는 점까지

[08:56] 정말 게임체인저입니다.

[08:58] 이게 비즈니스에 어떤 의미인지 생각해보세요.

[09:00] 웹 애플리케이션 전체를 몇 주가 아닌 몇 분 만에

[09:02] 프로토타입으로 만들 수 있습니다.

[09:04] 개발자를 고용하지 않고도

[09:06] 클라이언트용 인터랙티브 데모를 만들 수 있고

[09:08] 코딩 지식 없이도

[09:10] 내부 도구와 대시보드를 구축할 수 있습니다.

[09:12] 그리고 저 같은 콘텐츠 크리에이터에게는

[09:14] 정말 금과 같은 존재예요.

[09:16] 청중을 위한 인터랙티브 경험을 만들고

[09:18] 강의용 맞춤 도구를 구축하며

[09:20] 아이디어를 그 어느 때보다 빠르게 프로토타입으로 만들 수 있습니다.

[09:22] 이들은 CISPO라는 새로운 훈련 방법을 사용했는데

[09:24] 기존 방법보다 훨씬 효율적입니다.

[09:26] 전체 강화학습 단계에서

[09:28] Nvidia H800 512개만 3주간 사용했습니다.

[09:32] 이 규모의 모델치고는 놀라울 정도로 효율적이죠.

[09:34] 경쟁사들이 수천만 달러를 쓰는 동안

[09:36] 600만 달러 미만으로

[09:38] 이렇게 강력한 것을 훈련시킬 수 있었다는 것은

[09:40] 여기서 일어나고 있는 혁신이

[09:41] 얼마나 대단한지를 보여줍니다.

[09:43] 그리고 기억하세요, 이건 시작일 뿐입니다.

[09:46] Minimax는 이걸 Minimax 위크라고 부르며

[09:48] 더 많은 제품을 출시할 계획입니다.

[09:50] 이게 시작이라면

[09:52] 다음에 나올 것들이 정말 기대됩니다.

[09:53] 하지만 ByteDance가 Seaart 1.0으로 방금 출시한 것은

[09:55] 완전히 다른 차원입니다.

[09:57] 그리고 대부분의 사람들은 이게 존재한다는 것조차

[09:59] 아직 모르고 있어요.

[10:01] 무슨 일이 일어났는지 말씀드리죠.

[10:03] 모든 사람이 OpenAI의 Sora에 대해 이야기하는 동안

[10:06] ByteDance는 조용히

[10:07] Sora를 장난감처럼 보이게 만들 무언가를 구축하고 있었습니다.

[10:10] 이들이 방금 출시한 Seaart 1.0은

[10:12] 기존의 모든 것보다 나을 뿐만 아니라

[10:14] 비교조차 되지 않을 정도입니다.

[10:16] 텍스트만으로

[10:18] 할리우드급 동영상을 만들어내는 동영상 생성기 말이에요.

[10:21] 하지만 여기서 핵심은

[10:22] 기존 도구들처럼 몇 시간이 걸리지 않는다는 것입니다.

[10:24] 몇 분도 걸리지 않아요.

[10:26] 이 도구는 풀 1080p 해상도로 5초짜리 동영상을

[10:29] 단일 그래픽카드에서 단 41초 만에 뽑아냅니다.

[10:32] 하지만 이것도 놀라운 부분이 아니에요.

[10:34] 정말 놀라운 것은

[10:36] 이 동영상들이 실제로 얼마나 뛰어난지입니다.

[10:37] AI가 생성한 것인지 구별할 수 없을 정도로

[10:39] 사실적인 동영상을 만들어내는 완벽한 도구입니다.

[10:42] 완벽한 움직임, 완벽한 조명, 모든 것이

[10:43] 완벽합니다. 그리고 묻기 전에 말씀드리면, 이건

[10:46] 완벽한 조건에서만 작동하는

[10:48] 과장된 데모가 아닙니다. 이 기술은

[10:50] 방금 두 주요 비디오 생성 리더보드에서

[10:53] 1위를 차지했습니다. 구글의 V3를 이겼고,

[10:55] 런웨이의 Gen 4를 압도했습니다.

[10:59] 오픈AI의 소라를 마치 2020년

[11:01] 기술처럼 보이게 만들었습니다. 하지만 정말

[11:03] 흥미진진한 부분은 이겁니다. 이건 단순히

[11:05] 소셜미디어용 멋진 영상을 만드는 것이

[11:07] 아닙니다. 이건 누구나

[11:09] 몇 초 만에 전문가급 품질의 비디오

[11:10] 콘텐츠를 만들 수 있게 될 때

[11:12] 벌어질 일에 관한 것입니다. 이것이

[11:14] 당신의 비즈니스에 어떤 의미인지 생각해보세요.

[11:15] 마케팅에 어떤 의미인지

[11:16] 생각해보세요. 모든 것에 어떤 의미인지 말이죠.

[11:19] 제품 데모, 설명 영상,

[11:21] 소셜미디어 콘텐츠, 심지어 완전한

[11:23] 광고까지 원하는 것을

[11:25] 타이핑하는 것만으로 만들 수 있다고 상상해보세요.

[11:28] 카메라도, 편집 소프트웨어도,

[11:30] 비디오 제작팀도 필요 없이, 당신과

[11:33] 당신의 아이디어, 그리고 이 AI만 있으면 됩니다.

[11:35] 그리고 타이밍도 완벽합니다.

[11:36] 비디오 콘텐츠가 지금 완전히 시장을

[11:38] 지배하고 있습니다. 유튜브, 틱톡,

[11:40] 인스타그램 릴스, 링크드인 비디오까지,

[11:43] 모든 사람이 비디오를 원하지만 대부분은

[11:44] 좋은 비디오 콘텐츠를 만드는 것이

[11:46] 너무 어렵거나 비싸다고 생각합니다.

[11:47] 글쎄요, 그것은 이제 영원히

[11:49] 바뀌었습니다. 이제 이 기술이

[11:51] 어떻게 작동하는지, 그리고 왜 전체 콘텐츠 제작

[11:53] 산업을 뒤집으려고 하는지 정확히

[11:56] 알려드리겠습니다. 바이트댄스가 여기서

[11:58] 구축한 것은 단순한 또 다른 AI

[12:00] 도구가 아닙니다. 이건 완전한 게임체인저입니다.

[12:03] 우선, 이 기술은 텍스트를 비디오로,

[12:05] 이미지를 비디오로 모두 처리할 수 있습니다.

[12:06] 따라서 원하는 것을 텍스트로 설명하거나

[12:08] 시작 이미지를 제공하고 그 이미지를

[12:11] 어떻게 애니메이션할지 알려줄 수 있습니다.

[12:13] 두 옵션 모두 믿을 수 없을 정도로 잘 작동합니다.

[12:16] 하지만 정말 흥미로운 부분은

[12:17] 여기서부터입니다. 대부분의 AI 비디오 생성기는

[12:20] 한 번에 하나의 샷만 만들 수 있습니다.

[12:23] 하나의 연속적인 장면만 제공하고

[12:24] 그게 전부죠. 씨링 1.0은

[12:27] 멀티샷 비디오를 만들 수 있습니다.

[12:29] 즉, 여러 장면, 다양한 카메라 앵글,

[12:31] 심지어 샷 간의 부드러운

[12:33] 전환과 함께 복잡한 내러티브까지

[12:34] 포함한 비디오를 만들 수 있다는 뜻입니다.

[12:36] 이것이 무엇을 의미하는지

[12:38] 생각해보세요. 줄거리만 설명하면

[12:40] 말 그대로 미니 영화를 만들 수

[12:42] 있습니다. 제품을 다양한 각도에서

[12:44] 보여주는 여러 장면의 광고를

[12:46] 만들 수 있습니다. 하나의 개념에서

[12:47] 다른 개념으로 매끄럽게 흘러가는

[12:49] 교육 콘텐츠를 만들 수 있습니다.

[12:51] 그리고 품질에 대해서는, 이 결과물이

[12:53] 전문가 수준으로 보인다고 말할 때

[12:55] 농담이 아닙니다. 정말 마음을

[12:57] 사로잡은 것은 속도입니다. 기억하세요,

[12:59] 1080p 5초 비디오를 생성하는 데

[13:02] 41초가 걸린다는 얘기입니다. 정말 놀랍습니다.

[13:05] 대부분의 AI 비디오 도구는 이런 것을

[13:07] 만드는 데 10분에서 20분이 걸립니다.

[13:09] 어떤 것들은 몇 시간이 걸리죠.

[13:11] 이런 속도 우위는 단순히

[13:13] 편리한 것이 아닙니다. 혁명적입니다.

[13:15] 이렇게 빠르게 반복할 수 있다면, 원하는 것을

[13:17] 당신이 원하는 그대로 얻을 수 있습니다.

[13:19] 실험하고, 개선하고,

[13:21] 하루 종일 기다리지 않고도 콘텐츠를 완벽하게 만들 수 있죠.

[13:22] 그리고 여기 정말 놀라운 점이 있습니다.

[13:24] 다른 회사들이 아직도

[13:25] 쓰레기 같지 않은 AI 비디오를 만드는

[13:27] 방법을 찾으려고 애쓰고 있는 동안,

[13:29] 바이트댄스는 다른 누구도

[13:31] 존재하는 줄도 몰랐던 문제를 해결했습니다.

[13:33] 대부분의 AI 비디오 생성기는

[13:36] 이런 큰 약점을 가지고 있습니다.

[13:39] 텍스트 지시사항을 정말 잘 따르거나,

[13:40] 아니면 보기 좋고 자연스럽게 움직이는

[13:42] 비디오를 만들 수 있지만,

[13:44] 둘 다 동시에는 할 수 없습니다.

[13:46] 마치 똑똑해지거나 예뻐지거나

[13:48] 둘 중 하나를 선택해야 하는 것 같죠.

[13:51] 바이트댄스는 말했습니다. "그런 건 잊어. 우리는 둘 다 할 거야."

[13:52] 그들은 다차원 보상 시스템이라는

[13:54] 것을 구축했습니다.

[13:56] 거창하게 들리지만, 실제로는

[13:58] 이런 의미입니다.

[14:00] 대부분의 AI 시스템은 한 번에 하나씩 학습합니다.

[14:02] 보기 좋게 만드는 법을 배우고,

[14:04] 따로 지시사항 따르는 법을 배우고,

[14:06] 또 따로 자연스러운 동작을 만드는 법을 배웁니다.

[14:08] 하지만 Seance 1.0은

[14:10] 이 모든 것을 동시에 함께 학습합니다.

[14:13] 그래서 보기 좋게 만들거나

[14:15] 지시사항을 따르거나 둘 중 하나를

[14:17] 선택할 필요가 없습니다.

[14:19] 그냥 둘 다 완벽하게 해냅니다.

[14:21] 그리고 결과가 모든 것을 말해줍니다.

[14:23] AI 비디오 생성기의 올림픽이라고 할 수 있는

[14:25] 인공 분석 리더보드에서

[14:27] Seed Dance 1.0은 단순히 승리하는 게 아니라

[14:30] 경쟁자들을 완전히 압도하고 있습니다.

[14:31] 일부 카테고리에서는 2위 모델을

[14:33] 100점 이상 차이로 이기고 있어요.

[14:36] 하지만 정말 제가 흥미롭게 생각하는 부분은

[14:38] 바이트댄스가 더 나은 AI 비디오 생성기를

[14:39] 만들었다는 것이 아니라

[14:41] 어떻게 더 나아지게 만들었는지입니다.

[14:43] 왜냐하면 여기서 사용한 기술들이

[14:45] 모든 것을 바꿀 것이기 때문입니다.

[14:46] 그들은 AI가 비디오 데이터를 처리하는 방식을

[14:48] 완전히 새롭게 구상했습니다.

[14:50] 대부분 시스템이 하는 것처럼

[14:52] 비디오를 이미지들을 붙여놓은 것으로

[14:53] 다루는 대신,

[14:55] 실제로 비디오를 비디오로 이해하는

[14:57] 시스템을 구축했습니다.

[14:58] 동작을 이해하고, 사물이 시간이 흐르면서

[15:00] 공간을 통해 어떻게 움직여야 하는지 이해합니다.

[15:03] 이것은 엄청난 발전입니다. 왜냐하면 비디오에

[15:06] 컴퓨터가 생성했다는 걸 즉시 알아차리게 하는

[15:07] 이상한 AI 떨림 현상이 없기 때문입니다.

[15:09] AI가 실제로 자연스러운 동작이

[15:11] 어떤 모습이어야 하는지 이해하기 때문에

[15:13] 동작이 자연스럽게 보입니다.

[15:15] 그들은 또한 모든 사람을 미치게 만들던

[15:17] 프롬프트 따르기 문제도 해결했습니다.

[15:19] 대부분의 AI 도구로는 구체적인 것을 요청하면

[15:21] 비슷하긴 하지만 정확하지는 않은

[15:22] 결과를 주잖아요?

[15:24] 여기서는 그런 일이 일어나지 않습니다.

[15:25] 그들은 프롬프트 엔지니어링 시스템이라는

[15:27] 것을 구축했는데, 이것은 기본적으로

[15:29] 간단한 요청을 AI가 정확히 원하는 것을

[15:31] 만들기 위해 필요한 세부 지시사항으로

[15:33] 번역해줍니다.

[15:35] 그래서 고양이가 점프하는 비디오를 만들어달라고 하면

[15:37] 아무 고양이나 점프시키는 게 아니라

[15:38] 당신이 마음속에 그리고 있던 바로 그런

[15:40] 고양이 점프를 만들어냅니다. 3일 전에

[15:43] Moonshot AI라는 회사가

[15:45] Kimmy Dev72B라는 것을 출시했는데

[15:48] 기존의 모든 무료 코딩 모델을 압도했습니다.

[15:49] 말 그대로

[15:50] 월 수백 달러짜리 모델들을

[15:52] 무료로 뛰어넘은 겁니다. 실제로 어떤 일이 일어났는지 보겠습니다.

[15:54] 이들은 이 모델을 가져다가

[15:56] 세계에서 가장 어려운 코딩 테스트에

[15:58] 투입했습니다. SWE bench

[16:01] verified라고 불리는 테스트입니다.

[16:04] 이 테스트는 AI 모델에게 실제 코드베이스의

[16:07] 실제 버그를 줍니다. 장난감 문제가 아니라

[16:09] 실제 소프트웨어를 망가뜨린 진짜 버그들입니다.

[16:12] 대부분의 AI 모델은 이 테스트에서

[16:15] 처참하게 실패합니다. 비싼 모델들도 마찬가지입니다. 하지만

[16:19] Kimdev 72B는 60.4% 정답률을 기록했습니다. 이는

[16:21] 무료 모델 중 역대 최고 점수입니다.

[16:23] 모든 다른 모델들을 압도했고

[16:24] 근소한 차이도 아닙니다. 하지만 정말 놀라운 건

[16:26] 이제부터입니다. 이 모델은 단순히 코드를 작성하는 게 아니라

[16:28] 실제 개발자처럼 망가진 코드를 고칩니다.

[16:30] 정확히 어느 파일이 망가졌는지 찾아내고

[16:32] 완벽한 수정을 작성하며

[16:34] 그 수정이 실제로 작동하는지 확인합니다.

[16:36] 저는 3일 동안 계속 테스트해봤습니다.

[16:38] 제일 엉망인 코드를 던져줬습니다.

[16:40] 몇 주 동안 해결하지 못한 버그가 있는 코드 말이죠.

[16:42] 그런데 이 녀석이 몇 초 만에 고쳐버렸습니다.

[16:45] 몇 분이 아니라 몇 초 만에요.

[16:47] 가장 좋은 점은, 다른 회사들이

[16:49] 코딩 도움으로 월 50달러를 받는 동안

[16:50] 이건 완전히 무료라는 겁니다.

[16:52] 지금 당장 다운로드할 수 있습니다.

[16:54] 본인 컴퓨터에서 실행하세요.

[16:57] 제한도 없고, 구독료도 없고, 아무것도 없습니다.

[16:59] 지금 여러분이 생각하는 걸 알겠습니다.

[17:02] 무료면 쓰레기겠지, 맞죠?

[17:03] 틀렸습니다.

[17:05] 이건 차원이 다릅니다. 이걸 만든 팀은

[17:06] 강화학습이라는 기법을 사용했습니다.

[17:08] 기본적으로 수백만 개의 실제 버그를

[17:10] 고치도록 해서 코딩을 가르쳤습니다.

[17:12] 버그를 올바르게 고칠 때마다 보상을 받고

[17:13] 실수할 때마다 처벌을 받았습니다.

[17:15] 이런 과정을 수백만 번 반복해서

[17:18] 코딩 머신으로 만들었습니다.

[17:19] 하지만 정말 놀라운 부분은 이겁니다.

[17:22] 이 모델에는 두 개의 뇌가 있습니다.

[17:24] 버그를 찾아서 고치는 버그 픽서라는 뇌 하나와

[17:26] 수정이 제대로 작동하는지 확인하는 테스트를

[17:28] 작성하는 테스트 라이터라는 뇌 하나가 있습니다.

[17:30] 이 둘이 태그팀처럼 함께 작업합니다.

[17:34] 대부분의 코딩 AI는 그냥 코드를 뱉어내고

[17:36] 작동하길 바랄 뿐입니다. 하지만 이 녀석은

[17:38] 실제로 자신의 작업을 테스트합니다.

[17:41] 개발자와 품질관리 담당자가

[17:42] 하나의 모델에 내장된 것 같습니다.

[17:44] 어제 테스트를 해봤습니다.

[17:46] 완전히 망가진 파이썬 스크립트를 줬습니다.

[17:49] 여러 버그, 이상한 엣지 케이스들,

[17:51] 저라면 디버깅하는 데 몇 시간 걸릴 그런 것들 말이죠.

[17:53] 30초 만에 모든 버그를 찾아내고

[17:55] 완벽한 수정을 작성하고

[17:57] 작동한다는 걸 증명하는 테스트까지 줬습니다.

[17:59] 그리고 코드 품질은 대부분의 사람이 작성하는 것보다 나았습니다.

[18:01] 깔끔하고, 간단하고, 실제로 읽기 쉬웠습니다.

[18:03] 대부분의 AI 모델이 만들어내는

[18:04] 엉망진창 쓰레기가 아니라 말이죠.

[18:06] 이걸 만든 회사는 Moonshot AI입니다.

[18:08] Kimmy 챗봇을 만든 바로 그 팀이죠.

[18:10] 하지만 이건 챗봇이 아닙니다. 이건 코드를 위한

[18:12] 외과용 도구입니다. 이들은 1500억 개의

[18:14] 실제 코드 토큰으로 훈련시켰습니다. GitHub

[18:17] 이슈, 풀 리퀘스트, 개발자들이

[18:18] 버그를 수정할 때의 과정을 말이죠. 단순히

[18:20] 코딩하는 방법만 아는 게 아니라, 개발자처럼

[18:23] 사고하는 방법을 알고 있어요. 이게 왜

[18:25] 여러분의 비즈니스에 중요한지 말씀드릴게요.

[18:27] 지금 개발자들에게 비용을 지불하고 있다면,

[18:28] 이 도구로 비용을 절반으로 줄일 수 있어요.

[18:30] 코딩을 배우려고 한다면, 이게 바로

[18:32] 최고의 선생님이 될 거예요. 소프트웨어를

[18:34] 개발하고 있다면, 이게 바로 여러분의

[18:36] 비밀병기가 될 거예요. 저는 이미 제

[18:38] 에이전시에서 사용하기 시작했어요. 저희

[18:40] 개발자들은 더 빠르게 버그를 수정하고,

[18:42] 더 나은 코드를 작성하고 있으며,

[18:44] 더 이상 문제에 몇 시간씩 매달리지

[18:46] 않게 되었어요. 하지만 더 좋은 점이 있어요.

[18:48] 이 도구는 로컬에서 실행됩니다. 즉, 여러분의

[18:49] 코드가 절대 컴퓨터를 떠나지 않아요.

[18:51] 프라이버시 걱정도, 데이터 유출 우려도 없죠.

[18:53] 여러분의 지적 재산권은 여러분 것으로 남아있어요.

[18:55] 대형 AI 회사들과 비교해보세요.

[18:57] 그들은 여러분이 업로드하는 모든 것을 봅니다.

[18:58] 여러분의 코드로 학습하죠. 여러분의 아이디어를

[19:01] 경쟁사에게 줄 수도 있어요. 킴데브를 사용하면

[19:04] 여러분의 코드는 비공개로 유지되고, 설정은

[19:05] 비디오 게임을 설치하는 것보다 쉬워요.

[19:08] 다운로드하고 명령어 하나만 실행하면

[19:10] 지구상 최고의 AI 모델과 함께 코딩할 수 있어요.

[19:12] 어떻게 설정하는지, 어떻게 사용하는지,

[19:14] 그리고 최고의 결과를 얻는

[19:16] 구체적인 프롬프트를 보여드릴게요. 하지만 먼저

[19:17] 이 도구가 실제로 무엇을 할 수 있는지 보여드릴게요.

[19:21] 실제 예시를 들어보겠습니다. 어제

[19:22] 제가 맡은 고객의 이커머스 사이트가

[19:25] 고장났었어요. 결제 프로세스가 실패하고 있었죠.

[19:27] 사용자들이 장바구니에 상품을 담았지만

[19:28] 구매를 완료할 수 없어서 매출 손실과

[19:31] 화난 고객들이 생겼죠. 뻔한 상황이잖아요.

[19:33] 저희 개발자가 버그를 찾으려고

[19:35] 4시간을 보냈어요. 4시간이나요.

[19:37] 인건비로 400달러가 들었는데, 여전히

[19:40] 고치지 못했어요. 그래서 저는 코드를

[19:41] 킴데브에 입력했어요. 2분도 안 되어서

[19:43] 정확한 문제를 찾아냈어요. 결제 처리에서

[19:45] 발생한 레이스 컨디션이었어요. 완벽한

[19:47] 수정 코드를 작성했고, 심지어 버그가

[19:49] 다시 발생하지 않도록 테스트 코드까지

[19:51] 작성해줬어요. 2분 대 4시간. 이건 단순히

[19:53] 인상적인 게 아니라, 비즈니스를

[19:55] 바꾸는 수준이에요. 하지만 정말 저를 놀라게 한 건

[19:57] 수정 코드가 단순히 정확할 뿐만 아니라

[19:58] 우아하고 깔끔해서 전체 시스템을

[20:01] 더 좋게 만들었다는 점이에요. 대부분의 AI 모델은

[20:03] 작동은 하지만 기술 부채를 만드는

[20:05] 지저분한 패치를 제공해요. 이 도구는 제품

[20:07] 수준의 코드를 제공했어요. 이건 단지

[20:09] 하나의 예시일 뿐이에요. 저는 모든 것에

[20:11] 테스트해봤어요. 자바스크립트 버그,

[20:14] 파이썬 크래시, 영원히 실행되는 데이터베이스 쿼리,

[20:16] 쓰레기 값을 반환하는 API 엔드포인트까지.

[20:18] 이 도구는 모든 걸 고쳐줍니다. 이제

[20:20] 이 마법이 실제로 어떻게 작동하는지

[20:22] 설명해드릴게요. 이걸 이해하면

[20:23] 왜 다른 것들보다 훨씬 뛰어난지

[20:25] 알 수 있을 거예요. 대부분의 코딩 AI 모델은

[20:28] 기본적으로 고급 자동완성 기능이에요.

[20:29] 타이핑을 시작하면 다음에 올 내용을

[20:30] 추측하죠. 때로는 맞기도 하지만

[20:32] 보통은 틀리고, 틀렸을 때는 그들의

[20:35] 실수를 고치느라 몇 시간을 낭비하게 돼요.

[20:37] 킴데브는 완전히 다르게 작동해요.

[20:39] 실제 개발자가 일하는 방식을 모방한

[20:41] 2단계 프로세스를 갖고 있어요. 1단계는

[20:43] 파일 로컬라이제이션이라고 불러요. 무작정

[20:45] 코드를 무작정 수정하는 대신

[20:46] 정확히 어떤 파일을 수정해야 하는지 먼저 파악합니다.

[20:48] 버그 리포트를 읽고 코드베이스를 분석하며

[20:50] 시스템의 구조를 이해합니다.

[20:52] 시스템 각 부분 간의

[20:54] 관계를 파악하죠. 대부분의 AI 모델은

[20:56] 무작위로 파일을 수정하며

[20:59] 뭔가 작동하길 바라기만 합니다. 하지만 Kimmy Dev는 외과적으로 정확합니다.

[21:02] 무엇을 고치기 전에 문제가 정확히 어디에 있는지

[21:04] 알고 있습니다. 2단계는

[21:06] 코드 편집입니다. 어떤 파일을

[21:09] 변경할지 알게 되면 실제 수정을 진행합니다. 하지만

[21:11] 여기서 놀라운 점은

[21:12] 단순히 즉각적인 문제만 해결하는 게 아니라는 것입니다.

[21:14] 예외 상황을 고려하고

[21:17] 수정이 시스템의 다른 부분에 미치는

[21:19] 영향을 생각합니다. 실제 프로덕션에서

[21:21] 사용할 수 있는 코드를 작성하죠.

[21:23] 그리고 제가 언급한 두 개의 뇌, 버그

[21:25] 수정기와 테스트 작성기가 이 전체 과정에서

[21:27] 함께 작업합니다. 버그 수정기는

[21:29] 문제를 찾아서 해결하고, 테스트 작성기는

[21:31] 수정이 실제로 작동하는지 확인하고

[21:33] 다시 문제가 발생하지 않도록 합니다. 이는 정말 중요한데

[21:35] 대부분의 코딩 실패는 하나의 버그를

[21:37] 고쳤지만 새로운 버그 세 개를 만들 때 발생합니다.

[21:40] Kimmy Dev에서는 그런 일이 일어나지 않습니다. 테스트

[21:42] 작성기 뇌가 지속적으로

[21:44] 버그 수정기 뇌의 작업을 확인합니다. 하지만 더 있습니다.

[21:46] 이 모델은

[21:48] 강화학습이라고 불리는 기법을 사용해

[21:50] Docker 컨테이너에서 훈련되었습니다. 이는

[21:52] 실제 환경에서 코딩하도록

[21:54] 가르치는 고급 기법입니다. 다른 모델들처럼

[21:56] 단순히 코드 예제만 학습시킨 게 아닙니다.

[21:58] 실제로 망가진 저장소와 실제 회사들이

[22:00] 직면한 진짜 버그를 제공했습니다. 그리고

[22:02] 버그를 완전히 수정했을 때만

[22:04] 보상을 주었습니다. 부분적으로가 아닌 완전히 말이죠.

[22:07] 즉, 이 모델이 제안하는 모든 수정사항은

[22:10] 실전에서 검증되었습니다.

[22:12] 수백만 개의 실제 상황에서 학습했죠.

[22:14] 버그를 제공하면 아마도

[22:15] 비슷한 것을 본 적이 있을 겁니다.

[22:17] 인터넷의 무작위 코드로

[22:18] 훈련된 다른 모델들과 비교해보세요.

[22:20] 그 코드의 절반은 아마 이미 망가져 있을 겁니다.

[22:22] Kimmy Dev는 실제로 작동하는 코드에서 학습했고

[22:24] 결과가 그것을 증명합니다.

[22:26] 제가 언급한 SWE 벤치 검증 테스트에서

[22:28] 경쟁 모델들과 어떻게 비교되는지 보겠습니다.

[22:30] 이전의 최고 오픈소스 모델은

[22:32] 이 테스트에서 약 40%를 받았습니다.

[22:34] Kimmy Dev는 60.4%를 받았습니다. 이는

[22:37] 50% 향상입니다. AI 관점에서 보면

[22:40] 자전거에서 페라리로 업그레이드한 것과 같습니다.

[22:42] 심지어 대부분의 유료 모델도

[22:44] 이 성능에 근접하지 못합니다. Claude는 약 50%,

[22:46] GPT-4는 약 55%를 받습니다. Kimmy Dev는 둘 다

[22:49] 이기며 무료입니다. 더 나은 성능을 보이는

[22:51] 모델들은 절대 최고급

[22:54] 클로즈드 소스 모델들뿐입니다. 구글의 Gemini

[22:56] Pro와 Anthropic의 Claude Opus인데

[22:59] 본격적으로 사용하려면 한 달에

[23:01] 수백 달러가 듭니다. 결론은

[23:03] 이것입니다. 이 세 개의 중국 AI 에이전트가

[23:06] 모든 것을 바꾸었습니다. ByteDance의 Seed

[23:08] Coder, Kimmy Dev, 그리고 Minimax M1이

[23:10] 수천 달러의 비용이 들고

[23:12] 몇 주가 걸리던 기능들을

[23:14] 무료로 제공합니다.

[23:16] 미국 회사들이 수백 달러를 청구하는 동안 말이죠.

[23:17] 매월 수백 달러를 청구하죠. 이걸

[23:20] 먼저 파악한 기업들이

[23:21] 시장을 지배하게 될 거예요.

[23:23] 이런 도구들을 마스터한 기업가들은

[23:25] 제국을 건설할 거고요.

[23:27] 이걸 구현하는 에이전시들은

[23:29] 경쟁사들을 완전히 따돌릴 겁니다.

[23:31] 다른 사람들이 여전히

[23:33] 열등한 도구에 돈을 쓰고 있는 동안

[23:35] 뒤처지지 마세요. 시청해 주셔서

[23:36] 정말 감사합니다. 오늘 사용한

[23:38] 모든 프롬프트와 다양한 테스트에

[23:40] 접근하고 싶으시다면, AI 성공

[23:42] 랩에서 확인하실 수 있어요.

[23:44] 왼쪽에서 보시는 것처럼

[23:45] 다른 많은 교육 과정들도

[23:47] 함께 제공됩니다. 그리고 교실 안에는

[23:49] 다양한 교육 과정들이 있어요.

[23:50] 추가로, 커뮤니티 내에서는

[23:52] 매일 새로운 무료 교육을 제공하고 있어요.

[23:55] 보시는 것처럼요. 그래서 우리는

[23:57] 항상 새로운 교육을 공유하고 있습니다.

[24:00] 매일 무료 선물을 받고 싶고,

[24:02] 11,500명의 커뮤니티와

[24:04] 저와 개인적으로 연결되고 싶으시다면,

[24:05] 댓글 설명란에 있는 AI 프로핏

[24:08] 보드룸 링크로 언제든지 참여하세요.

[24:10] 750명이 되면 가격이 오를 예정이니까

[24:12] 지금 바로 할인가로 등록하세요.

[24:14] 그 안에서는 실제로

[24:16] 자동화를 요청할 수 있어요.

[24:17] 매주 이 스레드에 보고 싶은

[24:19] 자동화를 게시하기만 하면

[24:21] 개인화된 비디오를 녹화하고

[24:23] 그 자동화를 만들어 드립니다.

[24:25] 또한, 저에게 DM을 보낼 수 있고

[24:26] 어떤 질문이든 물어볼 수 있어요.

[24:28] 이 커뮤니티가 얼마나 활발한지

[24:29] 보실 수 있을 거예요. 그 안에는

[24:31] 정말 멋진 것들이 많이 있어요.

[24:33] 그리고 제가 이걸 만든 이유는

[24:35] AI로 비즈니스를 확장하고

[24:37] 더 많은 돈을 벌고, 매일

[24:40] 승리하고 배우고 성장하는 데

[24:41] 관심 있는 진지한 기업가들의

[24:44] 커뮤니티를 연결하기 위해서입니다.

[24:46] 그리고 이 섹션에서 보시는 것처럼

[24:48] 우리의 최고 에이전트들,

[24:50] 템플릿, 워크플로우들이 있어요.

[24:52] 예를 들어, 우리가 추가하고 있는

[24:55] 이 모든 새로운 워크플로우들 말이에요.

[24:58] 예를 들어, 페이스북 광고 생성기,

[25:00] 비디오 워크플로우, 퍼플렉시티

[25:02] 스크래퍼 봇, 비디오 쇼츠 클리퍼,

[25:04] AI 음악 생성기, 원클릭

[25:06] 책 생성기 등 온갖

[25:07] 놀라운 것들이 있어요. 그리고 추가로,

[25:09] 이에 대한 실시간 도움을 원하시고,

[25:12] 실시간 지원을 원하시고,

[25:13] 질문을 하고 실시간으로

[25:14] 튜토리얼을 받고 싶으시다면,

[25:17] 실제로 주 3회 라이브 코칭 콜이

[25:19] 있어요. 그리고 시청할 수 없거나

[25:21] 참여할 수 없다면, 실제로

[25:23] 여기서 콜 녹화본을 시청할 수 있고

[25:25] 코칭 콜과 Q&A도 받을 수 있어요.

[25:27] 그러니까 댓글 설명란의 링크를

[25:29] 자유롭게 확인해 보세요. 그리고

[25:31] 저희가 이 모든 것을 자동화해 주길

[25:34] 원하신다면, 댓글 설명란에 있는

[25:35] 무료 AI 전략 세션 링크로

[25:37] 예약하세요. 그 통화에서 우리가

[25:39] 할 일은 기본적으로

[25:40] 당신이 시간을 어디에 쓰는지 보고,

[25:42] 무엇을 자동화해야 하는지 파악하는 거예요.

[25:44] 게임 플랜을 세우고, 우리가

[25:45] 하는 게 합리적이라면, 구현해서 고객이 되실 수 있어요. 댓글 설명란의 링크를 확인해 보시고, 시청해 주셔서 감사합니다.