[00:00]
[음악]
[00:03]
[박수]
[00:04]
안녕하세요, 오늘은 Grok-3의 API가
[00:09]
이제 사용 가능해졌다는 소식을 전해드리려고 합니다.
[00:13]
Grok-3가 얼마 전에 출시되었지만
[00:15]
API는 제공되지 않았었는데
[00:18]
이제 드디어 사용할 수 있게 되었습니다.
[00:21]
그리고 기술적으로 새로운 모델도
[00:23]
출시되어서 이에 대해 이야기하고
[00:26]
가격 정책과 제가 발견한
[00:28]
흥미로운 점들에 대해서도
[00:30]
공유하고자 합니다.
[00:32]
여기에는 두 가지 모델이 있는데
[00:37]
첫 번째는 정식 Grok-3 모델입니다.
[00:40]
이 모델은 Claude와 동일한 가격으로
[00:43]
입력 토큰당 $3, 출력 토큰당 $15입니다.
[00:47]
입니다.
[00:48]
이 모델은 현재 추론 기능이
[00:51]
포함되어 있지 않습니다.
[00:53]
제가 기억하기로는
[00:56]
출시 당시 Grok-3의 추론 기능이
[00:59]
베타 버전이었고, 빅 브레인 모드가
[01:02]
Grok-3의 추론을 사용하는 반면
[01:05]
현재 Grok 플랫폼에서 사용 가능한
[01:08]
추론 기능은 사실
[01:09]
Grok-3 Mini의 추론 기능입니다.
[01:13]
그래서
[01:14]
그런 차이가 있습니다. 또한
[01:19]
매우 저렴한 Grok-3 Mini 모델이 있는데
[01:22]
이것이 현재 Grok 플랫폼에서
[01:24]
일반적으로 사용되는 모델이며
[01:28]
추론 기능도
[01:30]
포함되어 있습니다. 추론 수준을
[01:33]
낮음에서 높음까지 설정할 수 있고
[01:36]
추론을 수행하며 API 응답에
[01:38]
사고 과정 토큰도 출력할 수 있어서
[01:43]
정말 좋습니다. 이 모델은
[01:46]
추론 기능이 있어서 실제로 Grok-3보다
[01:49]
여러 면에서 더 뛰어난 성능을 보여주며
[01:53]
성능면에서는 실제로
[01:55]
GPT-3.5와 매우 유사하면서도
[01:58]
더 저렴합니다. 다만 사고 과정
[02:01]
토큰에 대해서도 비용이
[02:04]
청구된다는 점을 알아두세요.
[02:08]
가격은 토큰당 30센트와 50센트로
[02:11]
매우 합리적인 수준입니다.
[02:13]
또한 fast 옵션도 제공되는데
[02:17]
이는 추론 속도가 더 빠르다고 하며
[02:19]
가격은 약 두 배
[02:22]
입니다.
[02:23]
하지만 재미있는 점은 Open Router에서
[02:27]
이 옵션이 오히려 더 느린 것으로
[02:29]
나타났다는 것입니다.
[02:32]
따라서 저는 이 옵션을 사용하지 않는 것을
[02:36]
추천드립니다. 의미가 없어 보이네요.
[02:39]
Ader 리더보드에 따르면
[02:41]
Grok-3 Mini는 높은 설정에서
[02:44]
49.3점을 기록했고
[02:47]
메인 Grok-3 모델은
[02:51]
53%의 점수를 받았는데
[02:53]
이 정도의 작은 성능 차이를 위해
[02:57]
비용을 고려하면
[02:58]
그다지
[02:59]
가치가 있어 보이지는 않습니다.
[03:04]
이 모델을 무료로 사용할 수 있는
[03:06]
방법도 있습니다. Grok에서는
[03:11]
응답과 API 데이터를 공유하면 매월
[03:15]
$150 상당의 무료 크레딧을
[03:17]
제공합니다.
[03:20]
Gemini의 무료 API도 학습용
[03:23]
데이터를 수집한다는 점을 고려하면
[03:26]
꽤 좋은 조건입니다. 다만
[03:29]
아직 $5를 지출하지 않았다면
[03:32]
필요합니다.
[03:33]
12월에 무료 크레딧을 받기 위해
[03:37]
$5를 지출했던 분들은
[03:39]
추가 비용 없이도
[03:42]
이 기능을 활성화할 수 있어서
[03:45]
정말 좋은 기회가 될 것 같습니다.
[03:49]
이는 분명
[03:50]
학생들과 코드 생성에 크게 신경 쓰지 않는
[03:53]
사람들을 위해서도 유용하고
[03:55]
그런 것들이죠.
[03:57]
그래서 이게 꽤 좋은 거예요. 이것 없이도
[04:00]
사용할 수 있고, 오픈 라우터와
[04:02]
리퀘스티 모두에서 사용 가능합니다.
[04:05]
이제 클라인과 루트코드에서
[04:07]
어떻게 사용하는지 설명해드리겠습니다.
[04:09]
하지만 그전에 닌자에 대해
[04:11]
말씀드리겠습니다. 닌자는 올인원
[04:14]
AI 플랫폼으로, 월 11달러만으로
[04:16]
GPT-4, Claude 3, Sonnet,
[04:19]
Gemini 2.0 Flash와 같은 최고의 AI 모델들을
[04:23]
한 곳에서 이용할 수 있습니다. 저는
[04:26]
Gemini를 빠른 리서치에 사용하고 있는데,
[04:28]
정말 멋진 점은 그들의 AI
[04:30]
플레이그라운드에서 여러 모델의
[04:32]
응답을 나란히 비교할 수 있다는 거죠.
[04:34]
그들의 마인드맵 생성기는 복잡한 아이디어를
[04:36]
정리하는데 게임체인저입니다.
[04:39]
기본 플랜에서는 월 1,000개의
[04:41]
메시지, 30개의 이미지, 5개의 비디오를
[04:44]
제공하며, 더 많이 필요한 경우
[04:46]
상위 티어를 선택할 수 있습니다. king 25 코드로
[04:49]
모든 플랜 25% 할인, king 40 yearly로
[04:52]
연간 구독 40% 할인을 받으세요.
[04:55]
설명란의 링크를 확인해보세요.
[04:58]
자, 이제 영상으로 돌아가겠습니다. 설정을 위해
[05:02]
VS Code로 가서
[05:05]
클라인과 루트코드를 최신 버전으로
[05:08]
업그레이드하세요. 먼저 클라인부터
[05:11]
시작하겠습니다. 설정으로 가면
[05:14]
XAI를 선택하는 옵션이 보일 것입니다.
[05:17]
선택하면 Grok-3와
[05:20]
Grok-3 Mini를 선택할 수 있습니다만,
[05:23]
현재 한 가지 문제가 있습니다.
[05:27]
사용할 때 기술적으로 루트코드와 클라인은
[05:30]
Grok-3와 호환된다고 하지만
[05:33]
둘 다 Grok-3 Mini의
[05:36]
추론 노력 슬라이더가 없어서
[05:38]
기본값이 낮은 노력으로 설정되어
[05:41]
더 나쁜 응답을 제공합니다.
[05:44]
오픈 라우터도 자동으로 이를
[05:47]
처리하는 엔드포인트가 없고
[05:49]
Grok-3 Mini high 모델도 없습니다.
[05:51]
하지만 리퀘스티는 이를 지원합니다. 저는
[05:53]
주로 이것을 사용하고 있는데, 다른 추론
[05:58]
노력을 다른 모델 이름으로
[06:01]
제공하는 것이 좋네요.
[06:03]
그래서 Grok-3 Mini Low는 낮은 추론을,
[06:05]
Grok-3 Mini High는 높은 추론을 위해 선택할 수 있습니다.
[06:09]
곧 이 문제가 해결될 것 같지만,
[06:13]
그때까지는 이 옵션을 사용할 수 있습니다.
[06:15]
이제 설정이 완료되었으니
[06:18]
실제로 사용해보겠습니다.
[06:22]
Three.js로 항해하는 배 게임을
[06:25]
만들어달라고 요청해보겠습니다.
[06:27]
요청을 보내면 바로 작업을 시작하는데
[06:30]
때때로 좀 느릴 수 있지만
[06:33]
일반적으로 꽤 빠릅니다. 사고
[06:36]
과정도 볼 수 있어서
[06:38]
정말 좋습니다.
[06:41]
아무튼
[06:43]
잠시 기다리면 완성되는데,
[06:46]
실행해보면 꽤 좋아 보이네요.
[06:49]
훨씬 저렴한 비용으로 이정도면 대단합니다.
[06:51]
많은 사람들의 관심을 끌지 못했는데,
[06:55]
출시가 많이 지연되었고
[06:57]
Grok-3가 15달러라는 것을 보고
[07:00]
실망하고 떠난 사람들이 많았기 때문입니다.
[07:02]
하지만 이 미니 모델이 진짜죠.
[07:06]
매우 저렴하면서도 좋고, Gemini와 달리
[07:10]
사고 과정도 볼 수 있으며
[07:12]
검열도 덜 되어 있어서 그런 걸 중요하게 생각하는
[07:15]
사람들에게도 좋습니다.
[07:19]
Gemini Flash만큼 저렴하진 않지만
[07:22]
그래도 정말 매력적인 가격대에 있고
[07:24]
저는 확실히 제 워크플로우에
[07:26]
이것을 사용할
[07:27]
예정입니다. 영상을 너무 길게 만들어
[07:30]
테스트하고 싶지는 않지만
[07:33]
실제로 이 모델은
[07:35]
코딩에 정말 뛰어난 것 같습니다.
[07:38]
비싼 Haiku보다 훨씬 낫고
[07:41]
비용이 더 높은 GPT-3 Mini에
[07:44]
근접한 성능을 보여줍니다
[07:47]
이것과 비교하면 가격도 훨씬 저렴하고
[07:51]
월 150달러 크레딧도 정말 훌륭하며
[07:54]
많은 사람들에게 충분한 양입니다
[07:57]
또한 Requesty는 자체 API 키를
[08:00]
입력할 수 있는 옵션을 제공하는데
[08:03]
이는 150달러 딜을 받고
[08:06]
API 키를 입력해서
[08:09]
사용할 수 있다는 의미입니다
[08:10]
그래서 그것도 잘 작동할 것입니다
[08:15]
만약 RooCode와 함께 사용하고 싶다면
[08:18]
원하는 제공자를
[08:19]
X나 Open Router처럼 선택할 수 있지만
[08:22]
여기서는 추론 기능이 작동하지 않아서
[08:24]
Requesty로 이동해야 하며
[08:27]
high나 low 모델 중 하나를
[08:29]
선택해서 사용해야 합니다
[08:31]
이것도 정말 훌륭합니다
[08:34]
이것이 주요 사용 방법입니다
[08:37]
저는 최근에 많이 사용해보고 있는데
[08:40]
Mini는 정말 좋은 모델이고
[08:43]
가격도 적절하게 책정되어 있으며
[08:46]
실제로 빠르고 훌륭합니다
[08:48]
꼭 한번 사용해보시기 바랍니다
[08:51]
이 모델의 가격이
[08:53]
정말 매력적이니까요. 아직 멀티모달리티는
[08:56]
지원하지 않아서 아쉽지만
[09:00]
곧 이 기능을
[09:01]
추가할 예정이라고 합니다
[09:03]
전반적으로 꽤 괜찮습니다
[09:07]
여러분의 생각을 아래에 공유해주시고
[09:10]
채널을 구독해주세요
[09:12]
수퍼 땡스 옵션으로 기부하거나
[09:14]
채널 멤버가 되어서
[09:16]
특전을 받을 수도 있습니다
[09:18]
다음 영상에서 만나요, 안녕히 계세요
[09:20]
[음악]