Claude Code 기본 모델 설정이 토큰을 낭비합니다 — 해결 방법

Greg 구독자 700명

요약

이 영상은 Claude Code가 기본값으로 모든 요청을 가장 강력하고 비용이 높은 Opus 4 모델로만 처리해 불필요한 토큰 사용과 비용 초과를 유발하는 문제를 짚어준다. 간단한 '1+1' 테스트를 통해 Opus 4와 Sonnet 4의 비용 차이를 보여주며, 수동으로 모델을 선택해 토큰 사용을 최적화하는 방법을 단계별로 설명한다. 마지막으로 작업 성격에 맞는 모델 선택 기준과 Opus 4를 계획에, Sonnet 4를 실행에 활용하는 하이브리드 워크플로우를 제안해 생산성과 비용 효율을 모두 높이는 방안을 제시한다.

주요 키워드

Opus 4 Sonnet 4 모델 선택 토큰 비용 스마트 스위칭 하이브리드 워크플로우 LLM 비용 효율성 클라우드 코드(Claude Code) 생산성 최적화

하이라이트

🔑 Claude Code 기본 설정은 복잡도와 관계없이 모든 요청을 Opus 4로 보낸다 – 비용이 높아 토큰이 낭비된다.
⚡️ Opus 4는 Sonnet 4보다 토큰당 약 5배 비싸다 – 단일 간단 질의에도 25센트가 소모된다.
🌟 수동 모델 선택 기능을 활용하면 동일한 질의를 Sonnet 4로 처리해 5센트로 비용을 80% 절감할 수 있다.
📌 Anthropic 문서에 따르면 Claude Code에선 백엔드 로직 없이 20% 사용량 임계치에 도달해야 Sonnet 4로 전환된다.
🚀 작업 성격에 따라 모델을 구분해 사용하면 복잡한 알고리즘 설계는 Opus 4, 문서 작성이나 코드 포맷팅은 Sonnet 4로 효율화할 수 있다.
🔄 하이브리드 워크플로우로 Opus 4를 사용해 전체 설계·계획을 수립하고, 세부 구현은 Sonnet 4로 진행해 비용과 성능을 동시에 최적화한다.
📈 수동 전환이 번거롭다는 우려에는 토큰 절감 효과를 고려하면 충분히 가치 있는 거래라고 조언한다.

용어 설명

Opus 4

Anthropic의 가장 강력하고 복잡한 작업에 최적화된 LLM 모델로, 토큰당 비용이 높다.

Sonnet 4

Opus 4보다 가볍고 빠르며 단순·절차적 작업에 적합한 LLM 모델로, 비용 효율성이 높다.

토큰

LLM이 텍스트를 처리할 때 사용하는 기본 단위이며, 모델 사용량과 비용 산정의 핵심 지표다.

모델 스위칭

요청의 성격이나 외부 조건에 따라 사용할 LLM 모델을 전환하는 전략적 기능이다.

하이브리드 워크플로우

작업 단계별로 적합한 모델을 조합해 사용하는 방식으로, 비용과 성능을 동시에 관리한다.

Claude Code는 기본값으로 항상 Opus 4 모델을 사용해 단순 질의에도 높은 비용이 발생한다. 복잡도 무시, 스마트 결정 로직 부재로 토큰이 불필요하게 소모된다는 문제를 제시한다.

[00:00] Claude Code의 문제점 소개: 강력하지만 모델 선택에서 부족하며, 모든 요청을 비싼 Opus 4로 처리한다는 점을 설명합니다.

[00:21] 비용 문제를 강조하며 Opus 4가 Sonnet 4보다 5배 비싸고, 프롬프트 복잡성을 고려하지 않는 스마트하지 못한 시스템임을 지적합니다.

[00:49] 해결책 제시: Claude Code가 수동 모델 선택을 지원하므로 사용자가 요청을 최적화하고 토큰을 절약할 수 있다고 설명합니다.

[00:59] 비디오 내용 예고: 모델 선택 방법, 적절한 모델 매칭, 그리고 모델 전환 관련 우려사항 해결 방법을 다룰 예정이라고 안내합니다.

Anthropic 문서에 따르면 Claude Code는 프롬프트 내용을 평가하지 않고 초기 20% 사용량까지 Opus 4로 처리한다. 복잡도 매칭 없이 용량 임계치 기반으로만 Sonnet 4로 전환되는 구조다.

[01:24] Claude Code의 모델 결정 방식 분석: 겉보기에는 지능적일 것 같지만 실제로는 단순하게 최고 모델인 Opus 4를 기본으로 사용한다고 설명합니다.

[01:53] Anthropic 공식 문서 인용하며 Claude Code가 프롬프트 내용을 평가하지 않고 모델 기능과 작업 요구사항을 매칭하지 않는다고 명시합니다.

[02:24] 모델 전환 조건 설명: 할당량의 20%를 사용했을 때만 Sonnet 4로 자동 전환되며, 이는 전략적이 아닌 반응적 동작임을 강조합니다.

[02:59] Claude Code의 모델 전환은 전략적이지 않고 반응적입니다. 용량 부족 때문에 발생하는 것이지 Sonnet 4가 작업에 더 적합해서가 아닙니다. 대체 임계값이 100%에서 50%, 그리고 현재 20%까지 지속적으로 변경되고 있습니다.

[03:28] Anthropic은 사용 패턴을 모니터링하며 Opus 4 접근성과 할당량 소진 방지 사이의 균형을 찾고 있습니다. 이는 Cursor 같은 도구들과 대조적입니다. Cursor는 요청 성격에 따라 지능적으로 모델을 선택하여 성능과 비용을 최적화합니다.

초기에는 100%, 최근엔 50%에서 20%로 임계치가 낮아진 점을 설명한다. Cursor 같은 도구와 대비해 스마트 스위칭 부재를 강조한다.

[04:02] Anthropic이 향후 더 스마트한 모델 선택 시스템을 구현할 가능성이 있지만, 현재는 그런 기능이 없습니다. 이 동작에는 실제 비용이 따릅니다. Opus 4는 Sonnet 4보다 5배 더 비싸므로, 모든 요청이 기본적으로 Opus 4를 통해 처리되면 필요 이상의 토큰을 소비하게 됩니다.

[04:35] 기본 동작의 비효율성을 보여주는 테스트를 실행합니다. 1+1이라는 간단한 질문을 기본 모델 설정과 수동으로 Sonnet 4를 사용하여 각각 실행한 후 비용을 비교합니다. 이를 위해 빈 코드베이스인 empty project를 생성했습니다.

빈 코드베이스에서 "1+1" 질의를 기본값으로 실행해 Opus 4를 통해 처리. 단일 요청에 25센트가 소모된 실제 비용 데이터를 확인한다.

[05:22] Claude Code에서 /model로 이동하면 기본 모델 설정이 적용되어 있습니다. 이는 Anthropic이 권장하는 설정으로, 사용 한도의 20%까지 Opus 4를 사용하고 그 후 Sonnet 4로 전환하는 구성입니다. 변경사항이 없다면 이것이 기본 모델 구성입니다.

[05:55] Claude Code의 기본 모델 구성을 보여주며, 새로운 채팅 창에서 실험을 시작한다고 설명합니다.

[06:12] 간단한 1+1 계산 질문을 Claude Code에게 물어보고, 답은 당연히 2라고 설명합니다.

[06:20] 메트릭 결과를 확인해보니 단순한 1+1 프롬프트 하나에 25센트가 들었고, Claude Code가 기본적으로 Opus 4를 사용했다고 분석합니다.

[06:52] 새로운 세션에서 이번에는 수동으로 Sonnet 4를 선택하고 동일한 1+1 질문을 다시 실행합니다.

새로운 챗창에서 수동으로 Sonnet 4 모델을 선택하고 동일한 "1+1" 테스트를 실행해 5센트로 비용을 크게 절감한 결과를 보여준다.

[07:36] Sonnet 4를 사용한 결과 동일한 질문에 대해 5센트만 들었다고 메트릭을 확인합니다.

[08:00] 두 실행을 비교해보니 Opus 4는 25센트, Sonnet 4는 5센트로 약 5배의 비용 차이가 발생했다고 설명합니다.

Opus 4 실행 비용 25센트 vs Sonnet 4 실행 비용 5센트를 비교하며, 동일한 답변에도 비용이 5배 차이 나는 이유와 의미를 해석한다.

[08:29] 이런 단순한 작업에는 Opus 4를 사용할 추가 가치가 없으며, 고급 추론이 필요하지 않아 Sonnet 4나 더 오래된 모델로도 충분하다고 결론짓습니다.

[08:47] Claude Code의 기본 설정을 사용하면 항상 Opus 4를 기본으로 사용하게 되며, 백그라운드에서 스마트한 모델 전환이 일어나지 않아 프리미엄 요금을 불필요하게 지불하게 됩니다.

작업 유형별 모델 추천 규칙을 제시한다. 복잡한 알고리즘·디버깅·대규모 아키텍처 설계는 Opus 4, 구현·문서·경미한 수정 작업은 Sonnet 4 사용을 권장한다.

[09:25] 적절한 모델 선택을 위한 간단한 경험 법칙을 제시합니다. 추론이나 문제 해결이 필요한 복잡한 작업에는 Opus 4를, 절차적이고 명확한 지시사항만 따르면 되는 작업에는 Sonnet 4를 사용하세요.

[10:02] 복잡한 알고리즘 설계, 디버깅, 아키텍처 계획 등에는 강력한 모델을, 간단한 구현 작업, 문서 작성, 구문 오류 수정 등에는 가벼운 모델을 사용하여 토큰을 효율적으로 관리할 수 있습니다.

[10:44] 강력한 모델들은 복잡성을 해석하도록 최적화되어 있어 간단한 작업에도 과도하게 분석할 수 있으며, 때로는 가벼운 모델이 더 깔끔하고 직접적인 답변을 제공할 수 있습니다.

워크플로우에 단계 추가 부담, Sonnet 4의 복잡 코드 이해 부족 등 사용자가 흔히 제기하는 걱정을 정리한다. Think 모드 활용, 구체적 요청 지침으로 성능을 보완하는 전략을 제안한다.

[11:30] Claude Code에서 수동 모델 선택에 대한 일반적인 우려사항들을 다루기 시작하며, 워크플로우에 추가 단계가 생기는 것에 대한 우려를 인정합니다.

[11:43] 모델 선택에는 시간 투자가 필요하지만, 사용 한도에 자주 도달하거나 할당량을 최대한 활용하려는 사용자에게는 수동 모델 선택이 토큰 절약 측면에서 절대적으로 가치가 있다고 설명합니다.

Opus 4로 초기 기획·설계·플래닝을 수행하고, Sonnet 4로 세부 구현·테스트를 처리하는 방식으로 비용과 성능 이중 최적화를 달성하는 구체적 플로우를 설명한다.

[12:15] Sonnet 4가 Opus 4만큼 복잡한 코드베이스를 잘 이해하지 못한다는 우려에 대해, 몇 가지 스마트한 전략을 사용하면 비용을 절약하면서도 강력한 결과를 얻을 수 있다고 반박합니다.

[12:37] 첫 번째 전략으로 Sonnet 4에서 'think hard'라고 프롬프트에 입력하여 씽킹 모드를 활성화하는 방법을 소개합니다. 이는 Anthropic이 공식적으로 권장하는 방법입니다.

[12:59] 두 번째 전략으로 모델에게 더 구체적인 지시를 하는 방법을 설명합니다. 어떤 파일과 함수에 집중할지 명확히 하고, 새로운 기능 구현 시에는 유사한 예시를 제공하며, 전체 코드베이스보다는 독립적인 단일 부분에 집중하도록 구조화하는 것입니다.

현재는 스마트 모델 선택 기능이 없지만 사용자가 수동으로 모델을 제어하면 효율과 비용 절감이 가능하다고 강조한다. Anthropic의 향후 개선도 기대된다고 마무리한다.

[13:40] 세 번째 전략으로 하이브리드 접근법을 제안합니다. 계획 단계에서는 Opus 4를 사용하여 복잡한 추론과 시스템 설계를 담당하고, 실행 단계에서는 Sonnet 4로 각 작업을 개별적으로 처리하는 방식입니다.

[14:08] Opus 4를 활용한 계획 단계의 구체적인 예시를 제시합니다. 코드베이스 이해, 시스템 아키텍처 설계, 구현 계획 수립, 테스트 전략 개발, 엣지 케이스 식별 등의 추론 중심 작업에 집중해야 한다고 설명합니다.

[14:30] 계획이 완료된 후 실행 단계에서는 각 할 일 항목마다 Sonnet 4로 새로운 채팅을 열고, 관련 맥락과 구현 계획을 복사하여 개별 작업을 수행하는 워크플로를 상세히 설명합니다.

[00:00] Claude Code는 강력하고 의심할 여지가 없지만

[00:02] 한 가지 핵심 영역에서 부족합니다. 바로 모델 선택입니다.

[00:04] 기본적으로 Claude Code는 항상 여러분의 요청을

[00:07] Anthropic의 가장 강력한 모델인

[00:09] Opus 4로 라우팅합니다.

[00:11] 풀스택 앱을 구축하든지

[00:13] 단순한 질문을 하든지 상관없이

[00:15] Claude Code는 모든 것을 Opus 4로 보냅니다.

[00:18] 이것이 문제입니다.

[00:21] 왜냐하면 Opus 4는 비싸기 때문입니다.

[00:24] Sonnet 4보다 5배나 더 비쌉니다.

[00:26] Claude Code는 프롬프트의 복잡성을 고려하지 않습니다.

[00:28] 스마트한 전환도 없고

[00:31] 작업에 적합한 모델을 매칭하는 내장 로직도 없습니다.

[00:33] 대신 사용량 한도에 거의 도달할 때까지

[00:35] Opus 4를 계속 사용합니다.

[00:39] 더 나은 선택이라서가 아니라

[00:41] 다른 선택이 없기 때문입니다.

[00:44] 이런 기본 동작은 불필요한 비용과

[00:46] 토큰 낭비로 이어집니다.

[00:49] 하지만 좋은 소식이 있습니다.

[00:52] Claude Code는 수동으로 모델을 선택할 수 있게 해주고

[00:54] 이는 여러분이 모든 요청을 최적화하고

[00:56] 더 많은 것을 얻을 수 있는 권한을 가진다는 뜻입니다.

[00:59] 그래서 이 비디오에서는

[01:01] Claude가 모델 선택을 어떻게 처리하는지

[01:03] 왜 중요한지, 그리고 수동으로 모델을 선택하는 방법을

[01:06] 설명해드리겠습니다.

[01:08] 그다음 적절한 작업에

[01:10] 적절한 모델을 선택하는 방법을 보여드려

[01:12] 워크플로우를 최적화하고 토큰 낭비를

[01:14] 피할 수 있도록 하겠습니다.

[01:17] 마지막으로 모델 전환과 관련해

[01:19] 사람들이 갖는 일반적인 우려사항들과

[01:21] 효과적으로 해결하는 방법을 다뤄보겠습니다.

[01:24] 시작해봅시다. 먼저 Claude Code가

[01:26] 여러분의 요청에 어떤 모델을 사용할지

[01:28] 어떻게 결정하는지 알아봅시다.

[01:30] 언뜻 보면 Anthropic의 권장

[01:32] 기본 설정에 배경에서 작동하는

[01:34] 어떤 지능적인 로직이 포함되어 있을 것 같습니다.

[01:36] 프롬프트를 분석하고 작업이

[01:39] 얼마나 복잡하거나 단순한지에 따라

[01:41] 적절한 모델을 선택하는 것 말이죠.

[01:43] 이렇게 강력한 도구라면 Claude Code에

[01:46] 스마트한 의사결정이 내장되어 있을 거라고

[01:48] 기대하게 되지만

[01:50] 실제로는 그런 식으로 작동하지 않습니다.

[01:53] Anthropic의 공식 문서에 따르면

[01:55] Claude Code는 기본적으로 항상

[01:57] 사용 가능한 최고의 모델을 사용하는데

[02:00] 현재는 Opus 4입니다.

[02:02] 프롬프트의 내용을 평가하지 않습니다.

[02:04] 모델 기능을 작업 요구사항에

[02:07] 매칭하려고 시도하지도 않습니다.

[02:09] Claude Code에 1+1이 뭐냐는

[02:11] 간단한 요청을 하든지 이 멀티스레드

[02:14] 문제를 해결해달라는 복잡한 요청을 하든지

[02:16] 여러분의 요청은 항상 Anthropic의

[02:18] 가장 강력하지만 가장 비싼 모델인

[02:21] Opus 4를 통해 처리됩니다.

[02:24] 할당된 할당량의 약 20%에

[02:26] 사용량이 접근했을 때만

[02:29] Claude Code가 자동으로 Sonnet 4로 전환합니다.

[02:31] 이는 Claude Code가 여러분의 요청에

[02:34] 어떤 모델을 사용할지 지능적으로

[02:36] 결정하지 않는다는 뜻입니다.

[02:38] "이건 간단한 요청이니까 가벼운 모델을

[02:41] 사용하자"거나 "이건 복잡한 요청이니까

[02:43] 가장 좋은 모델을 사용하자"라고

[02:45] 판단하는 백엔드 로직이 없습니다.

[02:48] Claude가 Sonnet 4로 전환하는 유일한 때는

[02:51] 사용량 한도의 20%를 사용했을 때입니다.

[02:54] 따라서 모델 전환은 전략적이 아니라

[02:56] 반응적입니다. 단지 여러분이

[02:59] 용량이 부족해서 발생하는 것이지

[03:01] Sonnet 4가 해당 작업에 더 적합해서가 아닙니다.

[03:03] 그리고 여기서 주목할 점은

[03:06] 이 대체 임계값이 꽤 많이 변경되고 있다는 것입니다.

[03:08] Opus 4가 처음 출시되었을 때

[03:11] Claude Code는 할당량의 거의 100%에 도달할 때까지

[03:13] 계속 Opus 4를 사용했습니다.

[03:17] 그때서야 Sonnet 4로 전환했죠.

[03:19] 그런데 지난주에

[03:22] Anthropic이 그 임계값을 50%로 조정했습니다.

[03:24] 그리고 이제는 20%까지 떨어졌습니다.

[03:28] 따라서 Anthropic이 사용 패턴을 적극적으로 모니터링하고

[03:30] 이 임계값을 조정하고 있다는 것이 분명합니다.

[03:32] 아마 사용자들에게 Opus 4에 대한 쉬운 접근을 제공하면서도

[03:34] 동시에 사용자들이 몇 번의 프롬프트만으로

[03:37] 전체 할당량을 소진하는 것을 방지하는

[03:39] 균형을 찾으려고 하는 것 같습니다.

[03:41] 이는 Cursor 같은 다른 도구들과는

[03:44] 매우 대조적입니다.

[03:46] Cursor는 기본적으로 지능적인 모델 전환을 제공합니다.

[03:48] Cursor는 요청의 성격에 따라

[03:50] 자동으로 모델을 선택하여

[03:52] 성능과 비용을 모두 최적화합니다.

[03:55] 그리고 이것이 대부분의 사용자들이

[03:57] 현대적인 AI 코딩 도구에서 기대하는 행동입니다.

[03:59] 공정하게 말하자면, Anthropic은

[04:02] 향후 Claude Code에서 더 스마트한 모델 선택 시스템을

[04:04] 구현할 가능성이 높지만

[04:06] 현재로서는 그런 기능이 존재하지 않습니다.

[04:08] 따라서 이것은 여러분이 알아두어야 할 사항입니다.

[04:11] 그리고 이런 행동에는 실제 비용이 따릅니다.

[04:13] Opus 4는 Sonnet 4보다 5배 더 비쌉니다.

[04:15] 따라서 아무리 작고 간단한 요청이라도

[04:18] 모든 요청이 기본적으로 Opus 4를 통해 처리되면

[04:20] 필요 이상으로 훨씬 많은 토큰을 소비하게 됩니다.

[04:23] 결과적으로 사용 한도에

[04:25] 5배 더 빨리 도달하게 됩니다.

[04:27] 자, 이제 Claude Code가 모델 선택을 어떻게 처리하는지

[04:30] 이해했으니

[04:32] 이 기본 동작이 얼마나 비효율적인지 보여주는

[04:35] 예시를 살펴봅시다.

[04:37] 이를 위해 기본 테스트를 실행하겠습니다.

[04:39] Claude Code에게 1+1이 뭔지

[04:42] 정말 간단한 질문을 하겠습니다.

[04:44] 먼저 기본 모델 설정을 사용해서 물어보고

[04:47] 그 다음 Claude Code에게 똑같은 질문을

[04:50] 수동으로 Sonnet 4를 모델로 사용해서 물어보겠습니다.

[04:53] 그 후 비용을 비교해보겠습니다.

[04:55] 이 예시를 위해 empty project라는

[04:58] 빈 코드베이스를 만들었습니다.

[05:00] 여기에는 파일이나 그 어떤 것도 없습니다.

[05:02] 따라서 여기서 Claude Code를 실행하면

[05:05] 빈 코드베이스에서 실행되는 것입니다.

[05:07] Claude Code가 파일을 인덱싱하거나

[05:09] 다른 용도로 토큰을 사용하는 것을 걱정할 필요가 없습니다.

[05:12] 기본적으로 깨끗한 상태를 원합니다.

[05:13] 이제 터미널로 가서

[05:15] 그 폴더로 이동해서 Claude를 실행하겠습니다.

[05:17] 방금 만든 empty project 폴더로 이동해서

[05:19] Claude를 실행하겠습니다.

[05:22] 자, 이제 Claude Code에 있습니다.

[05:23] /model로 이동하면

[05:25] 기본 모델 설정으로 되어 있는 것을 볼 수 있습니다.

[05:27] 이것은 Anthropic이 권장하는 설정이기도 합니다.

[05:33] 이 기본 설정은 Claude Code가

[05:35] 사용 한도의 20%까지 Opus 4를 사용하고

[05:39] 그 다음에 Sonnet 4로 전환한다는 의미입니다.

[05:41] 만약 Claude Code에서 아무 변경을 하지 않았다면

[05:43] 이것이 바로 여러분이 기본적으로

[05:45] 사용하고 있는 모델 구성입니다.

[05:47] 이제 이것을 종료하겠습니다.

[05:51] 이제 다시 원래 상태로 돌아왔습니다.

[05:53] Claude Code에서 아무 변경을 하지 않았다면

[05:55] 이것이 기본적으로 사용하는 모델 구성입니다.

[05:57] 이제 나가겠습니다.

[05:59] 이제 홈 화면으로 돌아왔습니다.

[06:00] 안심하기 위해서 채팅을 지워보겠습니다.

[06:03] 완전히 새로운 채팅 창에서 작업하도록 하겠습니다.

[06:04] 이제 더 이상 맥락이나 내용이 없습니다.

[06:06] 완전히 새로운 채팅 창입니다.

[06:08] Claude Code에게 매우 간단한 요청을 해보겠습니다.

[06:12] 1 + 1이 무엇인지 물어보겠습니다.

[06:14] 당연히 답은 2입니다.

[06:18] 이제 로그아웃하고 메트릭을 확인해보겠습니다.

[06:20] 기억하세요, 여기서 보는 모든 것은

[06:22] 단순히 그 하나의 간단한 1+1 프롬프트만을 반영합니다.

[06:25] 이전의 모든 채팅과 맥락을 지웠습니다.

[06:28] 따라서 여기 표시된 메트릭은

[06:30] 오직 그 1+1 프롬프트만을 반영합니다.

[06:32] 총 비용을 보면

[06:35] 그 하나의 간단한 1+1 프롬프트를 실행하는 데

[06:37] 25센트가 들었습니다.

[06:40] 그리고 이 줄을 보시면

[06:43] Claude Code가 이 요청에 Opus 4를 사용한다는 것을

[06:45] 알 수 있습니다.

[06:48] 기본 모델 설정을 사용하고 있기 때문에

[06:50] 정확히 예상한 대로입니다.

[06:52] 다음으로, 새로운 Claude Code 세션을 시작하여

[06:54] 정확히 같은 쿼리를 실행해보겠습니다.

[06:56] 하지만 이번에는 모델 선택에서

[06:58] 수동으로 Sonnet 4를 선택하겠습니다.

[07:01] 같은 프로젝트 디렉토리 내에서

[07:03] Claude Code에 다시 로그인하고

[07:06] 완전히 새로운 채팅 창을 시작하겠습니다.

[07:08] 이번 실행을 위해 먼저

[07:10] /model로 가겠습니다.

[07:12] 여기서 실행에 사용할 모델로

[07:15] 수동으로 Sonnet 4를 선택하겠습니다.

[07:17] 여기로 가서

[07:19] Sonnet에서 엔터를 누르겠습니다.

[07:21] 이제 모든 실행에 Sonnet 4를 사용하고 있다는 것을

[07:23] 확인할 수 있습니다.

[07:25] 이제 지난번과 정확히 같은 쿼리를 실행하겠습니다.

[07:27] 1+1이 무엇인지 물어보겠습니다.

[07:30] 다시 한 번 답은 2입니다.

[07:33] 이제 로그아웃하고

[07:34] 메트릭을 확인해보겠습니다.

[07:36] 메트릭을 보면

[07:38] 이번 실행의 총 비용이

[07:41] 이 1+1 프롬프트에 대해 이제 5센트라는 것을

[07:44] 확인할 수 있습니다.

[07:45] 그리고 이 줄을 보면

[07:48] Claude Code가 이제 우리 요청에 Sonnet 4를 사용한다는 것을

[07:51] 확인할 수 있습니다.

[07:53] Claude Code에게 명시적으로

[07:55] Sonnet 4를 사용하라고 지시했기 때문에

[07:58] 정확히 예상한 대로입니다.

[08:00] 이제 두 실행 간의 비교를 보여드리고

[08:02] 메트릭이 어떻게 비교되는지 보여드리겠습니다.

[08:05] 1+1이 무엇인지 정확히 같은 질문을 했음에도 불구하고

[08:07] 두 실행 간의 비용 차이는

[08:09] 상당합니다.

[08:13] Opus 4 실행은 1+1을 실행하는 데만

[08:15] 25센트가 들었습니다.

[08:19] 정말 비쌉니다. 25센트요.

[08:21] Opus 4 실행은 Sonnet 4 실행보다

[08:24] 약 5배 더 비쌉니다.

[08:26] Opus 4가 토큰당 비용으로

[08:29] 대략 5배의 가격으로 책정되어 있기 때문에

[08:31] 예상되는 결과입니다.

[08:33] 하지만 여기서 핵심 포인트는

[08:36] 이런 유형의 작업에 Opus 4를 사용하는 것에

[08:38] 추가적인 가치가 없다는 것입니다.

[08:40] 답은 같고 복잡성은 최소입니다.

[08:43] 고급 추론이 필요하지 않습니다.

[08:45] 여기서 Opus 4를 사용하는 것은 말이 안 됩니다.

[08:47] 비용 때문입니다. 그런데 왜 이런 얘기를 하는 걸까요?

[08:50] 왜 중요한지 설명드리겠습니다. Claude Code의 기본 설정을

[08:52] 그대로 사용하면, 어떤 모델을 사용할지

[08:54] Claude Code가 결정하게 됩니다. 그리고 이는

[08:56] 항상 Opus 4를 기본으로 사용한다는

[08:59] 뜻입니다. 이런 간단한 작업에도 말이죠.

[09:02] 백그라운드에서 스마트한 모델

[09:04] 전환이 일어나지 않습니다.

[09:05] Claude Code는 사용량 한도가

[09:08] 거의 소진될 때까지 계속 Opus 4를 사용합니다.

[09:11] 그때서야 Sonnet 4로 전환됩니다.

[09:13] 따라서 수동으로 직접 개입해서

[09:16] 적절한 모델을 선택하지 않으면,

[09:18] 가벼운 모델로도 충분히 처리할 수 있는

[09:20] 작업에 프리미엄 요금을

[09:22] 지불하게 됩니다. 이제 주어진 작업에

[09:25] 적합한 모델을 효과적으로

[09:27] 선택하는 방법에 대해 말씀드리겠습니다.

[09:30] 대형 언어 모델 작업이 처음이시라면

[09:32] 생각보다 복잡하게 들릴 수도 있지만,

[09:34] 믿으셔도 됩니다. 익숙해지면

[09:36] 꽤 간단합니다.

[09:38] 이전 영상에서도 언급했듯이,

[09:40] 간단한 경험 법칙을 알려드리겠습니다.

[09:42] 작업이 추론, 문제 해결,

[09:45] 또는 잠시 멈춰서 생각해야 하는

[09:47] 내용이라면, Opus 4가

[09:50] 적합할 가능성이 높습니다. 반면에

[09:52] 작업이 절차적이라면, 즉

[09:55] 모델이 명확한 지시사항만

[09:57] 따르면 되는 경우라면, Sonnet 4가

[09:59] 대부분 충분히 처리할 수 있습니다.

[10:02] 따라서 복잡한 알고리즘 설계,

[10:05] 디버깅, 까다로운 추적 문제,

[10:07] 아키텍처 계획, 코드

[10:09] 최적화, 대규모 리팩토링 같은

[10:11] 작업에는 Opus 4 같은 강력한 모델을 사용하고,

[10:14] 간단한 구현 작업,

[10:16] Sonnet 4, 3.7 또는 3.5 같은 가볍고 빠른 모델은

[10:20] 잘 정의된 계획에 따른

[10:23] 코드 생성, 문서 및

[10:25] 주석 작성, 간단한 구문 및

[10:27] 포맷팅 오류 수정에 사용하세요.

[10:29] 의도적으로 모델을 선택하면

[10:32] 작업에 적절한 수준의 성능을 얻으면서도

[10:34] 불필요한 토큰 소모 없이

[10:36] 작업을 처리할 수 있습니다.

[10:38] 그리고 똑같이 중요한 점이 있는데,

[10:40] 이전 영상에서도 언급했지만

[10:42] 다시 한 번 말씀드릴 가치가 있습니다.

[10:44] Opus 4 같은 강력한 모델들은

[10:46] 복잡성을 해석하고, 뉘앙스를 찾고,

[10:50] 깊이 있게 추론하도록 최적화되어 있습니다.

[10:52] 따라서 간단한 작업을 주면

[10:55] 프롬프트를 과도하게 분석하여

[10:57] 실제로는 존재하지 않는 깊이나

[11:00] 모호함을 찾으려 할 수 있습니다.

[11:03] 그 결과, 과도하게 설계되거나

[11:05] 불필요하게 추상적이거나, 심지어

[11:07] 모델이 작업을 실제보다

[11:10] 복잡하다고 가정해서

[11:12] 완전히 잘못된 솔루션을 얻을 수도 있습니다.

[11:15] 역설적이게도, 더 강력한 모델을 사용한다고

[11:17] 항상 더 나은 결과를 얻는 것은 아닙니다.

[11:20] 어떤 경우에는 Sonnet 4 같은

[11:22] 가벼운 모델이 더 깔끔하고

[11:24] 직접적인 답변을 줄 것입니다. 왜냐하면

[11:26] 영리함이 필요하지 않을 때 영리하게 굴려고 하지 않기 때문입니다.

[11:30] 이제 Claude Code에서 수동으로

[11:32] 모델을 선택할 때 사용자들이

[11:34] 자주 갖는 일반적인 우려사항들에 대해 얘기해보겠습니다.

[11:36] 첫째, 워크플로우에 추가 단계가 생깁니다.

[11:39] 맞습니다. 수동으로 모델을 선택하면

[11:42] 워크플로우에 한 단계가 더 추가됩니다.

[11:43] 잠시 멈춰서 어떤 모델이 그 작업에

[11:45] 적합한지 결정하고, 필요할 때

[11:47] 모델을 앞뒤로 바꾸는 것을 기억해야 합니다.

[11:49] 그리고 이는 타당한 우려입니다.

[11:51] 하지만 여기서 트레이드오프가 있습니다.

[11:54] 여러분은 약간의 시간을 투자해서

[11:56] 상당한 양의 토큰을 절약하는 것입니다.

[11:59] 따라서 이는 정말로 여러분의 우선순위에 달려있습니다.

[12:01] 만약 사용 한도에 자주 도달하거나

[12:03] 할당량을 최대한 활용하고 싶다면

[12:05] 수동 모델 선택이 절대적으로 가치가 있습니다.

[12:07] 하지만 그런 한도에 거의 도달하지 않는다면

[12:10] 기본 Claude Code 설정을 유지하는 것도

[12:12] 완전히 괜찮습니다. 두 번째, Sonnet 4는

[12:15] Opus 4만큼 제 코드베이스를 잘

[12:17] 이해하지 못합니다. 맞습니다, Opus 4는

[12:20] 복잡한 추론과 대규모 코드베이스를

[12:23] Sonnet 4보다 잘 처리하지만, 그렇다고

[12:25] Sonnet 4가 복잡한 작업에 사용할 수 없다는

[12:27] 의미는 아닙니다. 사실, 몇 가지 스마트한

[12:30] 전략을 사용하면 비용을 크게 절약하면서도

[12:32] Sonnet 4에서 여전히 강력한

[12:34] 결과를 얻을 수 있습니다. 첫 번째, Sonnet 4와 함께

[12:37] 씽킹 모드를 사용하세요. 프롬프트에 말 그대로

[12:40] 'think hard'라고 타이핑해서 Sonnet 4가

[12:42] 씽킹 모드를 사용하도록 유도하세요. 너무 간단하게

[12:45] 들리지만, 이것이 실제로 Anthropic이

[12:47] 권장하는 방법입니다. think 키워드를 사용하면

[12:49] Claude Code가 씽킹 모드로 들어가서

[12:52] 문제를 더 열심히 생각하도록 하고

[12:54] 더 나은 결과를 생성합니다.

[12:56] 두 번째, 모델을 더 정확하게 안내하세요.

[12:59] 모든 대규모 언어 모델과 마찬가지로

[13:02] Sonnet 4는 더 많은 세부사항을 제공할 때

[13:04] 더 나은 성능을 발휘합니다. 요청에서 구체적이 되고

[13:07] 이 모델들에게 어떤 파일, 어떤 함수에

[13:10] 집중하기를 원하는지 알려주세요.

[13:12] 그리고 새로운 기능을 구현할 때는

[13:14] 따르고 싶은 유사한 구현의

[13:16] 예시를 제공하세요.

[13:19] 그리고 각 요청을 전체 코드베이스에서

[13:21] 한 번에 작업하려고 시도하는 대신

[13:24] 잘 정의되고 독립적인 단일 부분을

[13:26] 중심으로 구성하세요.

[13:29] 그리고 이것은 단지 Sonnet에 특정한

[13:31] 팁이 아닙니다. 일반적으로 좋은 습관입니다.

[13:34] 더 구체적일수록 어떤 LLM과

[13:36] 작업할 때도 더 나은

[13:38] 결과를 얻을 것입니다.

[13:40] 세 번째, 계획에는 Opus 4를 사용하고

[13:43] 실행에는 Sonnet 4를 사용하세요. 여기 새로운

[13:46] 기능을 구현할 때 특히 효과적이라고

[13:48] 생각하는 하이브리드 접근법이 있습니다.

[13:49] 실제로 제가 자신의 워크플로에서 사용하는 방법입니다.

[13:52] Opus 4로 새로운 채팅을 열어서 시작하세요.

[13:54] 이 더 강력한 모델을 사용해서

[13:57] 무거운 추론을 처리하세요. 무엇을 만들지,

[13:59] 어떻게 접근할지, 그리고

[14:01] 모든 조각들이 어떻게 맞춰지는지를

[14:03] 알아내려고 하는 부분입니다.

[14:05] 이것이 정확히 Opus 4가 빛나는 부분입니다.

[14:08] Opus 4를 사용해서 코드베이스가 어떻게 작동하는지

[14:12] 이해하기, 파일과 함수들이 어떻게

[14:14] 연결되고 상호작용하는지, 전체 시스템

[14:16] 아키텍처 설계하기, 구현 계획

[14:18] 만들기, 테스트 전략 만들기,

[14:20] 그리고 엣지 케이스 식별하기,

[14:22] 할 일 목록 개요 작성하기 같은

[14:25] 추론 중심의 계획 지향적 질문들에

[14:27] 집중하세요. 계획이 준비되면

[14:30] 기어를 바꾸세요. 각 할 일 항목에 대해

[14:32] Sonnet 4로 새로운 채팅 창을 여세요.

[14:35] 이제 관련 맥락, 구현 계획,

[14:37] 시스템 설계, 그리고 특정 작업을

[14:39] 그 새로운 채팅에 복사해서 붙여넣으세요.

[14:42] 그런 다음 Sonnet 4를 사용해서

[14:45] 그 작업 부분을 실행하는 데 도움을 받으세요.

[14:48] 그 작업이 완료되면 맥락을 지우고

[14:49] Sonnet 4로 다시 새로운 채팅을 열고

[14:52] 다음 항목에 대해 프로세스를 반복하세요.

[14:54] 그리고 이 워크플로에 대한 더 심층적인

[14:56] 비디오를 곧 만들 예정이지만

[14:58] 지금은 시작하기 위한 고수준

[15:01] 개요로 생각해 주세요.

[15:03] 따라서 이 접근법은 두 세계의

[15:05] 장점을 모두 제공합니다.

[15:07] 고급 추론과 계획 능력을 위해 Opus 4를 사용하고

[15:10] 더 빠르고 비용 효과적인 실행을 위해

[15:13] Sonnet 4를 사용하는 것입니다.

[15:16] 정리하자면, Claude Code가 현재

[15:18] 스마트 모델 선택을 지원하지 않지만

[15:21] 여전히 의도적인 선택을 통해

[15:23] 워크플로를 최적화하고 사용

[15:25] 비용을 절약할 수 있습니다.

[15:28] 이것은 Anthropic이 적극적으로 작업하고 있는

[15:30] 기능이고 가까운 미래에

[15:32] 사용할 수 있을 것입니다.

[15:34] 하지만 그때까지는 모델 선택을

[15:36] 직접 제어하는 것이 도구에서

[15:39] 최대 가치를 얻는 최선의 방법입니다.

[15:41] 이 비디오가 도움이 되었다면 좋아요와

[15:43] 구독을 잊지 마세요. 시청해 주셔서 감사하고