영상은 인사와 함께 Grok-3의 출시 소식을 전합니다. 간단한 인트로로 시작하여 주목할 기능들을 예고합니다.
[00:00]
그록 3가 출시되었으며, 이전 버전인 그록 2가 GPT-4와 대등한 수준이었다는 것을 소개합니다.
이전 모델인 Grok-2와의 비교를 통해, Grok-3가 기존의 100 GPU 대비 200K GPU를 사용하여 크게 강화된 학습 능력을 보여줌을 설명합니다.
[00:18]
그록 3는 예상보다 많은 200K GPU로 학습되어 10배 더 강력한 성능을 보여주며, 여러 벤치마크에서 경쟁 모델들보다 우수한 성능을 보입니다.
Grok-3와 그 미니 버전이 Gemini DeepSeek 등 경쟁 모델보다 좋은 벤치마크 결과를 보임과 동시에, 추론 모드에서 사고 과정을 출력하는 기능이 강조됩니다.
[01:05]
새로운 추론 모드와 빅 브레인 모드가 추가되어 더 복잡한 추론이 가능해졌으며, 사고 과정을 확인할 수 있습니다.
[02:13]
지구, 화성, 우주선 시뮬레이션과 게임 제작 능력을 보여주었으며, 자율적인 에이전트 개발도 진행 중입니다.
모델이 지구, 화성, 우주선 시뮬레이션과 테트리스 게임 등 다양한 시나리오에서 우수한 성능을 보였음을 예시와 함께 설명합니다. 딥서치 기능으로 다수의 페이지를 탐색해 정확한 정보를 도출하는 점을 부각합니다.
[02:38]
딥서치가 출시되어 다량의 페이지를 검색하고 분석하여 보고서를 작성할 수 있으며, 곧 사용자들에게 단계적으로 제공될 예정입니다.
프리미엄 사용자와 무료 사용자에게 차례대로 제공될 예정인 Grok-3와 별도의 슈퍼 그록 멤버십, 음성 모드 및 API 출시 계획이 언급됩니다. 다양한 기능의 출시와 활용 방법이 소개됩니다.
[03:43]
Grok은 X 멤버십과 별도로 음성 대화 모드를 개발 중이며, API 서비스도 준비하고 있습니다. 가격 정책은 추후 공개될 예정입니다.
[04:03]
Grok-3 모델은 지속적으로 개선 중이며, Grok-2는 Grok-3가 성숙화되면 오픈소스로 공개될 예정입니다.
[04:20]
벤치마크 성능은 좋지만, API 없이는 실제 성능 평가가 제한적입니다. API 가격이 높을 것으로 예상됩니다.
[04:45]
LMSys Arena에서 무료로 시험해볼 수 있으나, 20만 GPU로 학습된 것 치고는 성능이 다소 아쉽습니다.
[05:08]
다음 버전을 위해 더 큰 클러스터를 준비 중이며, 최고의 AI 제공업체로 자리매김했습니다.
[05:27]
현재는 프리미엄 회원도 사용할 수 없지만 곧 출시될 예정이며, 대규모 추론이 주요 과제가 될 것입니다.
모델의 지속적인 개선, 오픈 소스 공개, 그리고 API 가격 정책에 대한 전망이 논의됩니다. 최종적으로 구독과 의견 공유를 권유하며 영상을 마무리합니다.
[00:00]
안녕하세요, 다른 영상에 오신 것을 환영합니다. 그록 3가
[00:04]
출시되었는데요, 빠르게
[00:06]
어떤 것인지 설명해 드리겠습니다.
[00:10]
먼저 그록 2가 굉장히 뛰어나고
[00:12]
GPT-4와 대등한 수준이라는 것을 보여줬죠.
[00:15]
우리 모두는 그록 3가
[00:18]
콜로서스에서 100K H100
[00:21]
GPU로
[00:23]
학습되었을 거라 생각했지만, 실제로는
[00:26]
200K GPU로 학습되었다고 하네요. 꽤나 인상적입니다.
[00:30]
이전보다 10배 더 많은 GPU 파워로 학습되어
[00:34]
더욱 성능이 좋아졌고, 이제
[00:37]
벤치마크를 보시면
[00:39]
그록 3와 그록 3 미니가
[00:43]
제미니, 딥시크 FE3 등보다 우수하지만, 딥시크
[00:48]
R1은 비교 대상에 없다는 점이
[00:51]
흥미롭네요.
[00:52]
그들은 그록 3 모델이
[00:55]
LMS 아레나의 초콜릿 모델이었다고 밝혔고
[00:58]
ELO 점수는
[01:01]
1400점을 기록했다고 하네요.
[01:05]
이 외에도 새로운
[01:09]
그록 3 추론 모드가 있어서
[01:11]
그록이 추론할 수 있게 되었고
[01:14]
사고 과정을 출력해서
[01:17]
무엇을 생각하는지
[01:18]
볼 수 있습니다. 이 사고 과정은
[01:21]
다른 사람들이 모델을 쉽게
[01:23]
추출할 수 없도록 재작성되어 있습니다.
[01:27]
또한 빅 브레인 모드가 있어
[01:30]
더 어려운 추론을 수행할 수 있으며
[01:32]
OpenAI의 고수준 추론과 비슷한
[01:35]
능력을 보여줍니다.
[01:39]
그록 3 추론과 미니 추론은
[01:42]
적어도 벤치마크에서는 O03 미니보다
[01:45]
우수하며
[01:47]
전반적인 벤치마크에서
[01:49]
더 좋은 성능을 보여준다고 합니다.
[01:52]
위쪽 막대는 연산량의
[01:55]
변화를 나타내며, 빅 브레인 모드는
[01:57]
더 나은 결과를 얻고 아래쪽은
[02:00]
낮은 점수를
[02:01]
보여줍니다.
[02:03]
MMLU
[02:06]
2025에서도 꽤 좋은 성능을 보여주는데
[02:09]
이는 상대적으로 새로운
[02:12]
벤치마크라
[02:13]
고무적입니다. 지구와
[02:15]
화성, 우주선의 시뮬레이션을
[02:18]
만드는 예시도
[02:19]
보여주었고
[02:21]
테트리스 같은 게임도 만들었는데
[02:24]
꽤 잘 작동했습니다. 또한
[02:27]
에이전트 개발도 진행 중인데, 이는
[02:29]
다양한 도구를 사용해 end-to-end 작업을
[02:32]
수행하고 인간처럼 할 수 있지만 자율적으로
[02:36]
작동한다고 합니다.
[02:38]
또한 딥서치도 출시했는데
[02:41]
OpenAI의 딥 리서치와 비슷합니다.
[02:44]
수많은 페이지를 검색하여 정보를 찾고
[02:46]
약 100개의 페이지와 X 프로필 등을
[02:49]
검색할 수 있으며
[02:52]
이를 분석하여 추론을 수행하고
[02:55]
보고서를 작성할 수 있습니다.
[02:58]
몇 가지 좋은 예시를 보여주었는데
[03:02]
스타십이 언제
[03:04]
발사될 것인지에 대한
[03:05]
질문에 정확한 답변을 제공했고
[03:09]
여러 출처를 검토하여
[03:11]
결론을 도출했다는 점이
[03:14]
인상적입니다.
[03:14]
모델의 사고 과정도
[03:17]
볼 수 있어서 꽤 흥미롭습니다.
[03:20]
이 모델은 곧 사용자들에게 제공될 예정이며
[03:23]
첫 번째 웨이브에서는
[03:25]
프리미엄 사용자에게 우선 제공됩니다.
[03:28]
곧 무료 사용자들에게도
[03:30]
출시될 예정이며
[03:32]
새로운 슈퍼 그록이라는
[03:35]
별도의 그록 멤버십도 있어서
[03:37]
X 멤버십과 별개로 그록 프리미엄의
[03:40]
모든 기능을 이용할 수 있습니다.
[03:43]
그들은 또한 X 멤버십과는 별도로
[03:45]
음성 대 음성 모드를 개발 중인데,
[03:47]
이를 통해 직접 대화하며 작업할 수 있습니다.
[03:51]
API 지원도 개발 중이며,
[03:54]
시간이 좀 걸린 후에
[03:56]
가격 정책이 어떻게 될지 지켜봐야 할 것 같습니다.
[04:00]
그런 부분들이 어떻게 진행될지 보겠습니다.
[04:03]
그들은 여전히 Grok-3 모델을
[04:05]
개발 중이며 지속적으로
[04:07]
개선될 예정입니다. 또한 Grok-2 모델은
[04:09]
Grok-3가 성숙해지면
[04:12]
몇 달 안에 오픈소스로 공개될 예정이라
[04:15]
마찬가지로
[04:16]
사용할 수 있게 될 것입니다. 벤치마크에서는
[04:20]
좋은 성능을 보여주고 있지만,
[04:23]
일반적인 작업에서 제대로 평가하려면
[04:25]
API가 나올 때까지 기다려야 합니다.
[04:28]
Claude나 Anthropic과 같은 서비스에서는
[04:31]
사용할 수 없기 때문입니다.
[04:35]
이것이 그다지 좋지 않은 점이라고 생각하며,
[04:38]
API 가격도 꽤 높을 것으로 예상되지만
[04:42]
어떻게 될지 지켜보겠습니다.
[04:45]
현재 LMSys Arena에서
[04:48]
무료로 모델을 시험해볼 수 있으며
[04:51]
잘 작동하고 있습니다. 제 생각에는
[04:54]
좋은 편이지만, 20만 개의
[04:56]
GPU로 학습된 것을
[04:58]
고려하면 조금 기대에 미치지 못하는
[05:01]
것 같습니다.
[05:02]
다음 버전을 위해 더 큰 규모의
[05:04]
클러스터도 준비 중이며
[05:07]
어떤 성능을 보여줄지
[05:08]
지켜봐야겠지만, 확실히 최고의
[05:11]
AI 제공업체 중 하나로 자리매김했습니다.
[05:15]
어떻게 작동하고 사람들이
[05:17]
좋아하는지, 그리고 우리가 생각하는
[05:19]
만큼 좋은지 지켜보겠습니다.
[05:22]
이 모델이 어떻게 발전하고
[05:24]
에이전트 기능들이 어떻게 작동하는지 보겠습니다.
[05:27]
현재는 프리미엄 회원을 포함한
[05:30]
누구도 사용할 수 없지만
[05:32]
곧 출시될 예정이므로 지켜보도록 하겠습니다.
[05:37]
출시되면 잘 작동하는지
[05:39]
확인해보겠습니다. 대규모 추론이
[05:43]
그들에게는 도전이 될 것입니다.
[05:46]
채널 구독과 여러분의 생각을
[05:48]
공유해 주시기 바랍니다. 다음 영상에서 뵙겠습니다.
[05:53]
[음악]
[05:58]
안녕히 계세요