Grok-3, 빅 브레인 모드, 5분 만에 딥서치 (+무료 활용법)

AISeeKing 구독자 3,340명

요약

영상에서는 최신 AI 모델인 Grok-3의 출시와 그 주요 기능들을 소개합니다. Grok-3는 200K GPU를 활용한 향상된 학습 능력과 독창적인 추론 모드를 탑재하여 기존 모델들보다 우수한 성능을 보입니다. 또한, 딥서치 기능과 에이전트 도구, 음성 모드 등 다양한 부가 기능들이 포함되어 있으며, 프리미엄 사용자와 무료 사용자에게 빠르게 제공될 예정입니다. 앞으로 API 출시 및 지속적인 모델 개선, 오픈 소스 공개 계획도 언급되어 AI 시장에서의 강력한 입지를 다질 전망입니다.

주요 키워드

Grok-3 GPU 추론 모드 딥서치 벤치마크 시뮬레이션 API 에이전트 슈퍼 그록 오픈 소스

하이라이트

🔑 Grok-3는 기존 Grok-2와 비교해 200K GPU를 사용하여 학습 효율을 크게 향상시켰습니다.
⚡️ 벤치마크 결과, Grok-3 및 그 미니 버전은 Gemini DeepSeek 등 경쟁 모델보다 우수한 성능을 보입니다.
🌟 새로운 추론 모드에서는 모델의 사고 과정을 출력하여, 외부에서 모델을 쉽게 역추적하지 못하도록 보호합니다.
🚀 딥서치 기능은 다수의 페이지를 탐색해 정보를 종합, 보고서를 생성하는 등 심층 검색 능력을 제공합니다.
📌 향후 음성 기반 상호작용, API 제공 및 별도의 슈퍼 그록 멤버십 등 추가 기능들이 순차적으로 도입될 예정입니다.
🌟 무료 시범 사용은 LMS Arena를 통해 제공되며, 프리미엄 사용자에게 먼저 선보입니다.

용어 설명

Grok-3

최신 AI 언어 모델로, 향상된 GPU 학습과 다양한 추론 및 검색 기능을 포함한 모델.

빅 브레인 모드

모델이 더욱 복잡한 문제 해결과 추론을 수행할 수 있도록 돕는 고급 추론 모드.

딥서치

여러 페이지를 탐색해 정확한 정보를 보고서 형태로 제공하는 심층 검색 기능.

추론 모드

모델이 자신의 사고 과정을 출력하며 문제를 해결하는 모드로, 보안을 위해 일부 내용은 재작성됨.

ELO 스코어

모델의 성능을 수치화한 평가 지표로, 다양한 벤치마크에서 모델의 능력을 비교할 때 사용됨.

API

응용 프로그램 인터페이스로, 개발자들이 모델 기능을 프로그램적으로 활용할 수 있도록 제공하는 도구.

영상은 인사와 함께 Grok-3의 출시 소식을 전합니다. 간단한 인트로로 시작하여 주목할 기능들을 예고합니다.

[00:00] 그록 3가 출시되었으며, 이전 버전인 그록 2가 GPT-4와 대등한 수준이었다는 것을 소개합니다.

이전 모델인 Grok-2와의 비교를 통해, Grok-3가 기존의 100 GPU 대비 200K GPU를 사용하여 크게 강화된 학습 능력을 보여줌을 설명합니다.

[00:18] 그록 3는 예상보다 많은 200K GPU로 학습되어 10배 더 강력한 성능을 보여주며, 여러 벤치마크에서 경쟁 모델들보다 우수한 성능을 보입니다.

Grok-3와 그 미니 버전이 Gemini DeepSeek 등 경쟁 모델보다 좋은 벤치마크 결과를 보임과 동시에, 추론 모드에서 사고 과정을 출력하는 기능이 강조됩니다.

[01:05] 새로운 추론 모드와 빅 브레인 모드가 추가되어 더 복잡한 추론이 가능해졌으며, 사고 과정을 확인할 수 있습니다.

[02:13] 지구, 화성, 우주선 시뮬레이션과 게임 제작 능력을 보여주었으며, 자율적인 에이전트 개발도 진행 중입니다.

모델이 지구, 화성, 우주선 시뮬레이션과 테트리스 게임 등 다양한 시나리오에서 우수한 성능을 보였음을 예시와 함께 설명합니다. 딥서치 기능으로 다수의 페이지를 탐색해 정확한 정보를 도출하는 점을 부각합니다.

[02:38] 딥서치가 출시되어 다량의 페이지를 검색하고 분석하여 보고서를 작성할 수 있으며, 곧 사용자들에게 단계적으로 제공될 예정입니다.

프리미엄 사용자와 무료 사용자에게 차례대로 제공될 예정인 Grok-3와 별도의 슈퍼 그록 멤버십, 음성 모드 및 API 출시 계획이 언급됩니다. 다양한 기능의 출시와 활용 방법이 소개됩니다.

[03:43] Grok은 X 멤버십과 별도로 음성 대화 모드를 개발 중이며, API 서비스도 준비하고 있습니다. 가격 정책은 추후 공개될 예정입니다.

[04:03] Grok-3 모델은 지속적으로 개선 중이며, Grok-2는 Grok-3가 성숙화되면 오픈소스로 공개될 예정입니다.

[04:20] 벤치마크 성능은 좋지만, API 없이는 실제 성능 평가가 제한적입니다. API 가격이 높을 것으로 예상됩니다.

[04:45] LMSys Arena에서 무료로 시험해볼 수 있으나, 20만 GPU로 학습된 것 치고는 성능이 다소 아쉽습니다.

[05:08] 다음 버전을 위해 더 큰 클러스터를 준비 중이며, 최고의 AI 제공업체로 자리매김했습니다.

[05:27] 현재는 프리미엄 회원도 사용할 수 없지만 곧 출시될 예정이며, 대규모 추론이 주요 과제가 될 것입니다.

모델의 지속적인 개선, 오픈 소스 공개, 그리고 API 가격 정책에 대한 전망이 논의됩니다. 최종적으로 구독과 의견 공유를 권유하며 영상을 마무리합니다.

타임라인 정보가 없습니다.

[00:00] 안녕하세요, 다른 영상에 오신 것을 환영합니다. 그록 3가

[00:04] 출시되었는데요, 빠르게

[00:06] 어떤 것인지 설명해 드리겠습니다.

[00:10] 먼저 그록 2가 굉장히 뛰어나고

[00:12] GPT-4와 대등한 수준이라는 것을 보여줬죠.

[00:15] 우리 모두는 그록 3가

[00:18] 콜로서스에서 100K H100

[00:21] GPU로

[00:23] 학습되었을 거라 생각했지만, 실제로는

[00:26] 200K GPU로 학습되었다고 하네요. 꽤나 인상적입니다.

[00:30] 이전보다 10배 더 많은 GPU 파워로 학습되어

[00:34] 더욱 성능이 좋아졌고, 이제

[00:37] 벤치마크를 보시면

[00:39] 그록 3와 그록 3 미니가

[00:43] 제미니, 딥시크 FE3 등보다 우수하지만, 딥시크

[00:48] R1은 비교 대상에 없다는 점이

[00:51] 흥미롭네요.

[00:52] 그들은 그록 3 모델이

[00:55] LMS 아레나의 초콜릿 모델이었다고 밝혔고

[00:58] ELO 점수는

[01:01] 1400점을 기록했다고 하네요.

[01:05] 이 외에도 새로운

[01:09] 그록 3 추론 모드가 있어서

[01:11] 그록이 추론할 수 있게 되었고

[01:14] 사고 과정을 출력해서

[01:17] 무엇을 생각하는지

[01:18] 볼 수 있습니다. 이 사고 과정은

[01:21] 다른 사람들이 모델을 쉽게

[01:23] 추출할 수 없도록 재작성되어 있습니다.

[01:27] 또한 빅 브레인 모드가 있어

[01:30] 더 어려운 추론을 수행할 수 있으며

[01:32] OpenAI의 고수준 추론과 비슷한

[01:35] 능력을 보여줍니다.

[01:39] 그록 3 추론과 미니 추론은

[01:42] 적어도 벤치마크에서는 O03 미니보다

[01:45] 우수하며

[01:47] 전반적인 벤치마크에서

[01:49] 더 좋은 성능을 보여준다고 합니다.

[01:52] 위쪽 막대는 연산량의

[01:55] 변화를 나타내며, 빅 브레인 모드는

[01:57] 더 나은 결과를 얻고 아래쪽은

[02:00] 낮은 점수를

[02:01] 보여줍니다.

[02:03] MMLU

[02:06] 2025에서도 꽤 좋은 성능을 보여주는데

[02:09] 이는 상대적으로 새로운

[02:12] 벤치마크라

[02:13] 고무적입니다. 지구와

[02:15] 화성, 우주선의 시뮬레이션을

[02:18] 만드는 예시도

[02:19] 보여주었고

[02:21] 테트리스 같은 게임도 만들었는데

[02:24] 꽤 잘 작동했습니다. 또한

[02:27] 에이전트 개발도 진행 중인데, 이는

[02:29] 다양한 도구를 사용해 end-to-end 작업을

[02:32] 수행하고 인간처럼 할 수 있지만 자율적으로

[02:36] 작동한다고 합니다.

[02:38] 또한 딥서치도 출시했는데

[02:41] OpenAI의 딥 리서치와 비슷합니다.

[02:44] 수많은 페이지를 검색하여 정보를 찾고

[02:46] 약 100개의 페이지와 X 프로필 등을

[02:49] 검색할 수 있으며

[02:52] 이를 분석하여 추론을 수행하고

[02:55] 보고서를 작성할 수 있습니다.

[02:58] 몇 가지 좋은 예시를 보여주었는데

[03:02] 스타십이 언제

[03:04] 발사될 것인지에 대한

[03:05] 질문에 정확한 답변을 제공했고

[03:09] 여러 출처를 검토하여

[03:11] 결론을 도출했다는 점이

[03:14] 인상적입니다.

[03:14] 모델의 사고 과정도

[03:17] 볼 수 있어서 꽤 흥미롭습니다.

[03:20] 이 모델은 곧 사용자들에게 제공될 예정이며

[03:23] 첫 번째 웨이브에서는

[03:25] 프리미엄 사용자에게 우선 제공됩니다.

[03:28] 곧 무료 사용자들에게도

[03:30] 출시될 예정이며

[03:32] 새로운 슈퍼 그록이라는

[03:35] 별도의 그록 멤버십도 있어서

[03:37] X 멤버십과 별개로 그록 프리미엄의

[03:40] 모든 기능을 이용할 수 있습니다.

[03:43] 그들은 또한 X 멤버십과는 별도로

[03:45] 음성 대 음성 모드를 개발 중인데,

[03:47] 이를 통해 직접 대화하며 작업할 수 있습니다.

[03:51] API 지원도 개발 중이며,

[03:54] 시간이 좀 걸린 후에

[03:56] 가격 정책이 어떻게 될지 지켜봐야 할 것 같습니다.

[04:00] 그런 부분들이 어떻게 진행될지 보겠습니다.

[04:03] 그들은 여전히 Grok-3 모델을

[04:05] 개발 중이며 지속적으로

[04:07] 개선될 예정입니다. 또한 Grok-2 모델은

[04:09] Grok-3가 성숙해지면

[04:12] 몇 달 안에 오픈소스로 공개될 예정이라

[04:15] 마찬가지로

[04:16] 사용할 수 있게 될 것입니다. 벤치마크에서는

[04:20] 좋은 성능을 보여주고 있지만,

[04:23] 일반적인 작업에서 제대로 평가하려면

[04:25] API가 나올 때까지 기다려야 합니다.

[04:28] Claude나 Anthropic과 같은 서비스에서는

[04:31] 사용할 수 없기 때문입니다.

[04:35] 이것이 그다지 좋지 않은 점이라고 생각하며,

[04:38] API 가격도 꽤 높을 것으로 예상되지만

[04:42] 어떻게 될지 지켜보겠습니다.

[04:45] 현재 LMSys Arena에서

[04:48] 무료로 모델을 시험해볼 수 있으며

[04:51] 잘 작동하고 있습니다. 제 생각에는

[04:54] 좋은 편이지만, 20만 개의

[04:56] GPU로 학습된 것을

[04:58] 고려하면 조금 기대에 미치지 못하는

[05:01] 것 같습니다.

[05:02] 다음 버전을 위해 더 큰 규모의

[05:04] 클러스터도 준비 중이며

[05:07] 어떤 성능을 보여줄지

[05:08] 지켜봐야겠지만, 확실히 최고의

[05:11] AI 제공업체 중 하나로 자리매김했습니다.

[05:15] 어떻게 작동하고 사람들이

[05:17] 좋아하는지, 그리고 우리가 생각하는

[05:19] 만큼 좋은지 지켜보겠습니다.

[05:22] 이 모델이 어떻게 발전하고

[05:24] 에이전트 기능들이 어떻게 작동하는지 보겠습니다.

[05:27] 현재는 프리미엄 회원을 포함한

[05:30] 누구도 사용할 수 없지만

[05:32] 곧 출시될 예정이므로 지켜보도록 하겠습니다.

[05:37] 출시되면 잘 작동하는지

[05:39] 확인해보겠습니다. 대규모 추론이

[05:43] 그들에게는 도전이 될 것입니다.

[05:46] 채널 구독과 여러분의 생각을

[05:48] 공유해 주시기 바랍니다. 다음 영상에서 뵙겠습니다.

[05:53] [음악]

[05:58] 안녕히 계세요