이걸 사용해보고 갈아탔습니다: GPT-5 vs Claude vs Qwen

채널 아이콘
Rob Shocks 구독자 11,300명

요약

이 영상에서는 Claude Code(오퍼스 4.1+소넷), GPT-5(Cursor CLI), Qwen Coder 세 가지 AI 코딩 도구로 뉴스레터 요약 웹앱을 함께 만들어 보며 성능을 비교합니다. Next.js, Tailwind CSS, Node.js, Neon Postgres, Clerk 같은 동일한 스택 위에서 속도, 도구 호출, CLI 성숙도, Prisma 스키마 생성 완성도, 비용과 토큰 사용량을 분석합니다. 실험 결과 가장 매끄러운 워크플로우와 포괄적 코드 스캐폴딩을 제공한 Claude Code가 1위로 선정되었으며, GPT-5와 Qwen Coder의 강점과 한계도 함께 다룹니다.

주요 키워드

Claude Code Opus 4.1 Sonnet 4 GPT-5 Qwen Coder CLI Maturity Prisma Schema Clerk Token Usage Cost Analysis

하이라이트

  • 🔑 벤치마크만으로 AI 모델을 평가하기 어렵다는 점을 확인하고 직접 웹앱을 빌드하며 성능을 비교합니다.
  • ⚡️ Qwen Coder는 응답 속도와 초기 구성이 가장 빨랐지만 기능적 완성도는 낮았습니다.
  • 📌 Claude Code는 Opus 4.1과 Sonnet 4를 활용해 가장 광범위한 Prisma 스키마와 UI 스캐폴딩을 완성했습니다.
  • 🚀 GPT-5(Cursor CLI)는 전략적 기획에는 강했으나, 코드 완성도를 위해 여러 차례 프롬프트 조정이 필요했습니다.
  • 🌟 Clerk를 통해 사용자 인증과 결제 통합이 간편해졌고, 무료 티어로 1만 MAU까지 무난히 지원됩니다.
  • ⚡️ CLI 성숙도 순위는 Claude Code > Qwen (Gemini CLI 기반) > Cursor CLI(beta)로 나타났습니다.
  • 🔑 비용 분석에서 Claude Code API 사용 시 약 $18 규모의 토큰 비용이 발생했으나 매끄러운 워크플로우를 제공합니다.
  • 🚀 토큰 사용량은 600만 토큰 전후로, Cursor CLI와 GPT-5는 약 $3, Qwen은 무료 혜택을 최대한 활용했습니다.
  • 📌 모델별 최적 사용처: GPT-5는 전략적 의사결정, Claude는 코드 구현에 강점이 뚜렷했습니다.
  • ⚡️ 앞으로는 Cursor IDE 내에서 Claude Code를 에이전트로 활용해 다양한 모델을 조합할 계획입니다.

용어 설명

Next.js

React 기반 서버 사이드 렌더링(SSR) 프레임워크

Tailwind CSS

유틸리티 클래스 기반 CSS 프레임워크

Neon

서버리스 Postgres 호스팅 서비스

Clerk

사용자 인증·관리 및 결제 통합을 제공하는 서비스

Opus 4.1

Claude Code의 상위급 대규모 언어 모델 엔진

Sonnet 4

Opus 4.1 사용량 초과 시 전환되는 Claude Code 보조 모델

Prisma

타입 안전 ORM(Object-Relational Mapping) 도구로 DB 스키마 관리

CLI

Command-Line Interface(명령줄 인터페이스), 개발 도구 제어 환경

OAuth2

외부 API(예: Gmail) 인증·인가 표준 프로토콜

Token

LLM 대화 길이 단위이자 API 비용 산정 기준

[00:00:00] 소개 및 목표 설정

AI 웹앱 빌드를 위해 수많은 신규 모델(GPT-5, Claude, Qwen)을 비교하며, 벤치마크 대신 실제 스택(Next.js, Tailwind CSS, Node.js, Neon, Clerk) 위에서 성능을 검증합니다.

지난 몇 주 동안 등장한 수많은 AI 도구들과 모델들 중에서 앱 개발에 가장 적합한 것을 선택하는 기준에 대해 이야기하며, 벤치마크보다는 실제 웹앱 개발 경험을 통해 판단하는 것이 중요함을 강조합니다.
Newsletter Digest라는 AI 앱을 만들 계획을 소개하며, Gmail에서 뉴스레터를 가져와 주요 기사를 집계하고 개별 뉴스레터를 볼 수 있는 기능을 제공한다고 설명합니다.
Claude Code(Opus, Sonnet), Cursor CLI와 GPT-5 베타, Qwen Code 등 여러 모델을 사용해 동일한 앱을 구축하여 비교할 예정이라고 설명합니다.
기술 스택으로 Next.js 프레임워크, Tailwind CSS, Node.js, Neon Postgres DB, 그리고 사용자 관리를 위한 Clerk을 사용할 것이라고 소개합니다.
[00:01:21] Clerk 통합 및 기능

Clerk를 통한 사용자 인증·관리와 결제 기능을 살펴봅니다. 무료 티어는 월 1만 MAU까지 제공하고, Next.js·Astro·Vue 등 다양한 프레임워크 통합을 지원합니다.

5년간 Clerk을 사용한 경험을 바탕으로 Clerk의 장점들을 소개합니다. 간단함, 관대한 무료 티어(월 활성 사용자 10,000명까지), 우수한 문서화, 다양한 프레임워크 통합을 언급합니다.
Clerk의 빌링 기능을 소개하며, Stripe와의 직접 통합을 통해 보통 오래 걸리는 결제 시스템 구축을 플러그 앤 플레이로 해결할 수 있다고 설명합니다.
Clerk의 Next.js와 MCP 서버 지원 기능을 소개하며, Claude Desktop이 Clerk 인증을 통해 뉴스레터 앱의 사용자 정보에 접근할 수 있는 방법을 설명합니다.
MCP를 통한 앱 연동과 Clerk의 역할에 대해 설명하며, 채널 시청자를 위한 특별 링크를 소개합니다.
실험을 위해 Cursor IDE를 선택하고 Qwen Code, Cursor CLI, Claude Code라는 세 가지 인스턴스를 설정했다고 설명합니다.
[00:02:45] 개발 환경 준비

Cursor IDE(및 VS Code)에서 세 가지 인스턴스를 생성합니다. Next.js 설치부터 프로젝트 초기화, React·Node 스택 인식 과정까지 공통 환경을 설정합니다.

모델 사용 전 Next.js 설치 과정을 설명하고, 각 모델이 React, Next.js, Node 환경에서 작업한다는 것을 인지하도록 했다고 언급합니다.
[00:03:15] 의존성 설치 속도 비교

Shad CN 컴포넌트 라이브러리와 Lucid Icons 설치 명령을 실행해 봅니다. Qwen이 가장 빠르게 완료했고, Claude가 뒤따르며 GPT-5는 조금 늦지만 더 깊이 설치했습니다.

첫 번째 테스트로 ShadCN과 Lucide Icons 설치를 요청했으며, 이들이 웹 앱 개발에 좋은 시작점이 되는 컴포넌트 라이브러리와 아이콘 세트라고 설명합니다.
세 모델 모두 기본 작업을 무리 없이 수행했으나, 속도 면에서는 Qwen이 가장 빨랐고 Claude가 그 다음, GPT-5가 가장 느렸지만 추가적인 기본 컴포넌트 설치까지 진행했다고 비교 분석합니다.
도구 호출 기능에 대해 설명하며 모든 모델이 문제없이 수행했다고 평가합니다. CLI 성숙도 면에서는 Claude가 훨씬 앞서며, 다양한 내장 기능들을 갖추고 있다고 언급합니다.
[00:04:12] CLI 성숙도 평가

CLI 기능과 편의성은 Claude Code가 가장 성숙했습니다. Qwen(CLI는 Gemini CLI 기반)이 두 번째, Cursor CLI는 아직 베타라 개선 여지가 보였습니다.

Qwen을 두 번째로 평가하며, Gemini CLI를 기반으로 구축되었다는 점과 Google의 오픈소스 정책을 긍정적으로 평가합니다. 모든 CLI가 유사한 방식으로 작동해 학습 전이가 가능하다고 설명합니다.
Cursor CLI의 성숙도가 낮고 베타 버전이라 다른 도구들보다 거친 부분이 있지만, 원하는 모든 AI 모델을 통합된 비용으로 사용할 수 있는 장점이 있다고 설명합니다.
[00:05:23] 초기 스캐폴딩 및 프롬프트

프로덕트 매니저 에이전트 대신 직접 프롬프트로 프로젝트 요구사항을 전달합니다. Quen은 할 일 목록을 생성하고 기본 설치를 빠르게 처리했습니다.

기본 앱 설정이 완료된 후 첫 번째 프롬프트를 실행하는데, 이번에는 스펙 기반 개발의 PRD 단계를 건너뛰고 각 모델의 계획 기능에 집중해 뉴스레터 요약 앱을 만들어보겠다고 설명합니다.
Claude는 자체 할 일 목록을 만드는 특징이 있으며, 모든 도구에서 요청하는 명령들을 허용하여 테스트했다고 설명합니다. Qwen이 가장 빠른 속도로 README 업데이트, 의존성 설치, Clerk 설정 등을 완료했다고 언급합니다.
각 AI 도구의 비용 구조를 비교 설명합니다. Claude는 월 100달러로 가장 비싸고, Cursor는 월 20달러, Qwen은 현재 무료 서비스로 가장 저렴하지만 향후 변경될 수 있다고 설명하며, 데이터베이스와 Prisma 스키마 생성 결과를 살펴보겠다고 마무리합니다.
Qwen, Claude, GPT-5의 첫 번째 실행 결과를 비교하며, 각각 다른 접근 방식으로 뉴스레터 시스템의 데이터베이스 스키마를 생성했음을 확인합니다.
GPT-5는 뉴스레터 이메일 컬렉션과 Google 인증정보를 포함했지만 사용자 설정이 누락되었고, Claude는 사용자와 Clerk ID를 포함한 가장 포괄적인 스키마를 제공했습니다.
GPT-5는 Prisma 설정, Clerk 활성화, OpenAI API, Google API 설정 및 Gmail 수집과 요약 기능까지 가장 많은 기능을 구현했습니다.
Qwen이 가장 빠르게 작업을 완료했지만 주로 초기화와 기본 설정에 그쳤고, Claude는 의존성 준비, Prisma 설정, Gmail 통합, UI 구축 등 포괄적인 작업을 수행했습니다.
[00:09:09] 환경 변수·API 키 설정

각 도구가 요구하는 DB URL, OpenAI 키, Clerk 키를 .env에 등록하고, Neon DB 브랜치 생성, Google Cloud에서 Gmail API OAuth2 클라이언트 설정 과정을 진행합니다.

실제 구현을 위해 Neon 데이터베이스에 새 프로젝트를 생성하고, 각 AI 모델별로 별도 브랜치를 만들어 환경 변수를 설정합니다.
Claude의 지침에 따라 Google Cloud Console에서 새 프로젝트를 생성하고 Gmail API 설정을 위한 준비 작업을 진행합니다.
구글 클라우드 콘솔에서 Gmail API를 활성화하는 과정을 설명합니다. API 및 서비스 메뉴에서 Gmail API를 찾아 활성화하고, OAuth 2 자격 증명을 생성하기 위한 동의 화면을 구성하는 단계를 진행합니다.
OAuth 클라이언트 설정을 완료하고 Clerk 인증 서비스를 사용한 개발 경험을 공유합니다. 애플리케이션 생성부터 API 키 복사, 환경 변수 설정까지의 과정을 설명하며 보안의 중요성을 강조합니다.
[00:10:57] Prisma 스키마 생성 비교

Qwen, GPT-5, Claude 각각이 생성한 Prisma 스키마를 비교합니다. Claude Code가 사용자, 뉴스레터, 요약 모델까지 광범위한 스키마를 가장 완성도 높게 생성했습니다.

Prisma ORM을 사용한 데이터베이스 설정 과정을 설명합니다. Prisma generate로 클라이언트 라이브러리를 생성하고 migrate deploy로 데이터베이스 스키마를 배포하는 과정에서 오류가 발생하여 문제 해결을 시도합니다.
세 가지 AI 모델 비교 결과를 발표합니다. Claude Code와 Claude(주로 Opus, 일부 Sonnet)가 명확한 승자로, 완전한 앱과 랜딩 페이지, 정확한 설정, OpenAI 연동까지 성공적으로 구현했다고 평가합니다. 발생한 오류들은 대부분 사용자의 인적 오류였다고 분석합니다.
이전 비교에서 Claude가 좋지 않았던 반면, 이번에는 Claude Code가 모든 면에서 GPT-5를 압도적으로 이기며 완벽한 성과를 보여주었습니다.
[00:13:24] 앱 실행 및 기능 테스트

GPT-5 기반 앱으로 이메일 수집까지는 성공했지만 요약 기능이 동작하지 않았습니다. Qwen은 로그인·요약 UI만 일부 구현된 단계에 머물렀습니다.

GPT-5와 Cursor CLI로 만든 뉴스레터 앱을 테스트해보니, Gmail 연결과 이메일 수집은 작동하지만 요약 기능이 제대로 동작하지 않아 완전한 기능을 구현하지 못했습니다.
GPT-5는 Claude만큼 완전한 결과를 내지 못했으며, 같은 수준에 도달하기 위해 세 배나 더 많은 수정 프롬프트가 필요했습니다.
지난주 인보이스 추출 앱 비교에서는 GPT-5가 승리했지만, Qwen의 경우 응답은 빠르지만 실제 진전은 거의 없어서 가장 기본적인 로그인 페이지 수준에서 멈춘 상태입니다.
모든 비교를 마친 후 최종 결과 발표에 앞서 시청자들에게 좋아요와 구독을 요청하며, 과학적 연구라고 유머러스하게 표현합니다.
[00:14:44] 최종 비교 및 결론

비용·토큰 사용량(약 600만 토큰)·기능 완성도를 종합해 Claude Code가 1위로 선정됩니다. GPT-5/Cursor는 전략 기획, Qwen은 빠른 스캐폴딩에 강점이었습니다.

최종 결과로 Claude Code with Opus 4.1이 1위를 차지했다고 발표하며, 가장 부드러운 워크플로우와 성숙한 CLI, 그리고 처음부터 끝까지 잘 작동하는 점을 강조합니다.
비용 분석에서 Claude Code가 가장 비싸지만, 약 600만 토큰을 사용해 API로는 18달러, CLI로는 3달러 정도가 소요되었으며, Qwen의 경우 직접 사이트 연결로 인해 정확한 사용량 추적이 어려웠다고 설명합니다.
Qwen 사이트에 직접 연결했기 때문에 API를 통하지 않았으며, Qwen의 가격 체계는 사용량에 따라 여러 등급으로 나뉘어 복잡한 구조를 가지고 있습니다.
Opus 4.1이 가장 비싸서 입력 토큰 백만 개당 15달러, 출력 토큰 백만 개당 75달러이며, Sonnet 4는 입력 백만 개당 3달러, 출력 백만 개당 15달러, GPT-5는 입력 백만 개당 12.5달러, 출력 백만 개당 10달러입니다.
GPT-5와 Cursor CLI를 2위로 평가하며, Cursor CLI는 베타 버전으로 출시된 지 일주일밖에 안 되었고, Cursor IDE와 함께 사용했다면 더 나은 결과를 얻었을 것 같다고 언급합니다.
3위는 Qwen Coder로, 토큰 반환 속도가 가장 빨랐지만 완료한 작업량이 가장 적었고, 포크된 Gemini CLI와 함께 사용할 때 갑자기 멈추는 문제가 있었습니다.
Grok, Gemini, Kimmy와 같은 다른 우수한 모델들과 Open Code, Charm 같은 CLI들도 있지만 이번 비교에는 포함하지 않았으며, 이들은 영상을 위해 선별한 최고 등급 모델들입니다.
Claude Code를 주요 에이전트로 사용할 예정이며, Cursor IDE 내부에서 월 20달러로 GPT-5, Gemini 등 다양한 모델들과 백그라운드 에이전트들을 활용할 계획입니다.
온라인 정보에 따르면 GPT-5는 전략적 목적에, Claude는 코드 구현에 가장 뛰어나며, 앞으로 각 모델의 최적 사용 패턴을 확립해 나갈 예정입니다.
지난 몇 주 동안 너무 많은 새로운 도구들과
새로운 모델들이 나왔어요.
AI로 앱을 개발할 때
어떤 것이 최고인지 어떻게 결정할까요?
최고를 정하는 한 가지 방법은
벤치마크를 살펴보는 것입니다.
하지만 이 채널에서 여러 번 말했듯이
벤치마크를 완전히 믿지는 않습니다.
벤치마크는 실제로
제가 선호하는 모델을
제대로 반영하지 못해요.
왜냐하면 제가 하고 싶은 것은
AI로 웹 앱을 만드는 것이거든요.
그래서 이 비디오에서 하고 싶은 것은
두 가지입니다. 첫째,
우리는 이 웹 앱을 만들 거예요.
뉴스레터 다이제스트라는 AI 앱인데요.
Gmail에서 모든 뉴스레터를 가져와서
기본적으로 그 중에서
집계되고 있는 주요 기사들을 보여주고
개별 뉴스레터들도 볼 수 있어요.
모든 뉴스레터를 가져와서
관심 있는 주제에서
무엇이 흥미로운지 빠르게 확인할 수 있어요.
제 경우에는 당연히 AI겠죠.
하지만 한 번만 만드는 게 아니라
Claude Code로 Opus와 Sonnet을 사용해서
만들고, Cursor CLI와
현재 베타 버전인 GPT-5도 사용할 거예요.
그리고 Qwen Code와
Qwen Coder 모델도 사용할 거예요.
이건 과학적이지는 않아요.
그냥 다양한 카테고리에서
최고의 모델들을 느껴보는 거예요.
프레임워크로는 Next.js를 사용할 거예요.
스타일링은 Tailwind CSS로 하고
모든 것이 Node.js 위에서 실행됩니다.
백그라운드에서는 Neon Postgres DB를 사용해서
애플리케이션 데이터를 관리할 거예요.
그리고 Clerk을 사용해서
앱의 모든 사용자 관리를 쉽게 처리하고
새로운 통합을 사용해서 앱을 위한 새 MCP도 설정할 거예요.
이 비디오를 후원해 준 Clerk에게 감사드려요.
저는 거의 5년 넘게 Clerk을 사용해왔어요.
다양한 인증 시스템들을 테스트해봤지만
계속 Clerk으로 돌아오는 이유는
너무 간단하기 때문이에요.
워낙 자주 사용해서
제가 먼저 연락해서
비디오 후원을 요청했을 정도예요.
무료 티어도 매우 관대해서
월 활성 사용자 10,000명이 되어야
플랫폼 비용을 지불하기 시작해요.
문서도 훌륭하고
Next.js, Astro, Tanstack, Vue 등
정말 많은 프레임워크와 통합되어 있어요.
또 다른 멋진 기능은
최근 비디오에서 다뤘던
Clerk 빌링이에요.
Clerk 사용자를 설정하면
실제로 Stripe와 빌링을
애플리케이션에 직접 통합할 수 있어요.
이런 건 보통 구축하는 데
오랜 시간이 걸리지만
Clerk OAuth 설정과 함께 플러그 앤 플레이로 제공돼요.
더 자세한 내용을 원한다면
여기 비디오를 확인해보세요.
앱 수익화의 가장 빠른 방법입니다.
마지막으로 보여드릴 것은 Next.js와 MCP 서버에 대한
Clerk의 지원입니다.
빌드에서 Clerk 설정을 사용하면
실제로 Claude Desktop이 MCP와
대화할 수 있어요. 작은 창이 뜨면서
'Clerk에 대해 인증해야 합니다'라고 말할 거예요.
그러면 이제 Claude Desktop이 우리 뉴스레터 앱의
모든 사용자 정보와 대화할 수 있어요.
앱을 MCP를 통해 연동할 수 있습니다. 이전에는 꽤 번거로웠던 작업이었는데
이제 Clerk이 이 부분도 처리해주고 있습니다.
Clerk 역시 이런 작업들을 대신 해주고 있어요.
채널 시청자분들을 위한 특별 링크를
설명란에 준비해두었습니다.
클릭해보시면 Clerk에서 제가 보낸 걸 알 수 있고
채널 지원에도 도움이 됩니다.
이번 실험의 기본 IDE로는 Cursor를 선택했습니다.
물론 VS Code도 사용할 수 있어요.
세 가지 다른 인스턴스를 설정했는데
Qwen Code가 있고, 파란색으로 Cursor CLI가 있습니다.
그리고 주황색으로 Claude Code가 있어요.
모델을 사용하기 전에 Next.js를 설치했습니다.
터미널에 가서 이 명령어를 입력하시면
해당 앱에 설치될 겁니다.
그러면 각 모델이 우리가 React, Next.js, Node로
작업한다는 걸 알게 됩니다.
시작점으로 말이죠.
Claude Code와 바이브 코딩에 대한
제 모범 사례를 보고 싶으시면
채널의 최근 동영상 몇 개를 확인해보세요.
여기 있습니다.
첫 번째 프롬프트는
ShadCN과 Lucide Icons를 설치하라고 요청한 거였습니다.
ShadCN을 사용하는 이유는
기본적으로 컴포넌트 라이브러리이기 때문입니다.
웹사이트나 앱에서 사용할 수 있는
다양한 타입의 컴포넌트와 위젯들이 있고
원하는 방식으로 스타일링할 수 있습니다.
이는 모든 웹 앱에 좋은 시작점이고
Lucide Icons는 디자인에
멋진 마무리 터치를 제공해줍니다.
이 프롬프트를 모든 도구에서 실행했습니다.
Claude, Qwen, GPT-5 모두
이 기본 작업에는 문제가 없었습니다.
한 가지 주목할 점은 Qwen이 구현에서 매우 빠르게 느껴졌다는 것입니다.
응답도 매우 빨랐고, Claude가 그 다음이었습니다.
GPT-5는 조금 더 오래 걸렸지만
실제로 한 단계 더 나아가서
기본 ShadCN 컴포넌트들을
시작점으로 설치하기까지 했습니다.
그래서 속도 차이가 발생했을 수 있습니다.
도구 호출 측면에서는
모든 모델이 제가 본 바로는
문제없이 잘 수행했습니다.
도구 호출이란 간단히 말해서
fetch, 읽기, 쓰기 또는 어떤 종류의
검색을 호출하는 능력입니다.
CLI 성숙도와 사용 편의성 측면에서는
Claude를 다른 모델들보다 훨씬 앞서 있다고 평가하겠습니다.
이 경우 제가 편향적일 수 있는데
꽤 많이 사용해봤고 또한
이들 중 가장 성숙하기 때문입니다.
훨씬 먼저 시작했죠.
훅, 서브 에이전트, 그리고 다양한
슬래시 명령어들과 같은
놀라운 기능들이 내장되어 있습니다.
이제 보안 검토 명령어까지 포함해서 말이죠.
사용성 측면에서 Qwen이
두 번째로 좋았습니다.
기억하실 점은 Qwen Code가 실제로
Gemini CLI를 기반으로 구축되었다는 것입니다.
Google과 Gemini에게 찬사를 보냅니다.
그들은 실제로 CLI를 오픈소스로 공개했습니다.
덕분에 Qwen 같은 사람들이
기본적으로 포크해서 자신들만의
방식으로 사용할 수 있게 되었습니다.
이러한 CLI들에 대해 제가 좋아하는 점은
모두 거의 같은 방식으로 작동한다는 것입니다.
그래서 하나를 배우면
지식이나 원리를
다른 것으로 거의 그대로 옮길 수 있습니다.
CLI 성숙도 측면에서는 Cursor가
는 확실히 성숙도가 낮은 편입니다. 가장
최근에 나온 것이고 베타 버전이라서
다른 것들과 비교할 시간을 좀 더 줘야겠어요.
하지만 말해야 할 것은
때때로 정말 좌절스러운 경험이었다는 것입니다
오류를 복사할 때 그냥
먹통이 되버렸거든요. 그래서 아직은
가장자리가 좀 거친 편이에요. 아마도
Cursor CLI를 사용할 때의 주요 이점은
원하는 모든 모델에 액세스할 수 있다는 것입니다.
GPT-5, Claude 또는
Cursor 시리즈의 다른 모든 모델을 통합된 비용으로
사용할 수 있습니다.
Shad CN과 Lucid 아이콘, 그리고 Next.js가 설정되면
모든 프로젝트의 기본 앱이
준비됩니다. 첫 번째 초기
프롬프트를 주고 싶었어요.
제가 스펙 기반 개발에 대한
동영상을 본 적이 있다면
제가 프로젝트를 시작할 때
제품 관리자 에이전트와 상담하여
PRD를 작성하고 이것이 많은
프롬프트 생성에 도움이 된다는 걸 알 거예요.
이번에는 정말 깔끔하게
각 모델과 도구의 계획
기능에 집중해서
성능을 보고 싶었어요. 그래서
그 단계는 건너뛰었습니다. 여기서
제 프롬프트를 볼 수 있어요. 자세히 보고
싶다면 비디오를 일시정지해도 됩니다.
기본적으로 뉴스레터
요약 앱을 만들고 싶고
사용하고 싶은 기술 유형에 대한
작은 프롬프트를 주었어요. 좋아요.
각각에서 실행해 보겠습니다.
Claude가 다르게 하는 한 가지 네이티브한 것은
작업할 자체 할 일 목록을
만든다는 것입니다. 명심할 한 가지는
매번 그들이 명령을 실행하거나
자동 실행을 요청할 때마다
요청받은 대로 허용하고 있다는 것입니다.
Claude가 명령 허용을 요청하면
허용했어요. Cursor와 GPT가 요청하면
허용했어요. Qwen은
기록적인 속도로 작업했습니다.
기본적으로 README를 업데이트하고
필요한 모든 의존성을 설치하고
변수, Clerk 설정 등을 처리했어요.
정말 엄청나게 빨랐어요.
실제로 작동하는지 확인해봐야겠어요.
음, 좋아요. Claude가 다시 권한을
요청하고 있네요. 그냥 실행하겠습니다.
GPT-5와 CLI는 Prisma 설정을 처리하고 있어요.
Claude Code에서 간단히 상기시켜 드리면
더 강력한 모델인 Opus 4.1과
Sonnet 4를 사용하고 있습니다.
Opus 4.1을 5시간 동안
일정량 사용할 수 있고 그 다음
차단되어 Sonnet 4로
전환됩니다. Claude에서는
월 100달러 최대 플랜을 사용하고 있어요.
이것은 단연코 가장 비싸요.
그 다음 Cursor CLI와 GPT-5가 있습니다.
Cursor에서는 월 20달러 플랜을 사용하는데
일정량 사용할 수 있고
차단되면 API
가격으로 전환됩니다. Qwen과
Qwen 3 Coder는 현재
무료 서비스를 기반으로
비용이 거의 들지 않아
단연코 가장 저렴해요. 하지만
향후 변경될 수 있습니다.
데이터베이스 생성이나 그 이후의
SQL용 Prisma 스키마 생성을 빠르게 살펴보면
첫 번째 실행입니다. Qwen에서 받은 결과를 보니
Clerk에 연결된 사용자가 있습니다. 이미 그 연결을
만들어놓은 게 흥미롭습니다.
그리고 뉴스레터 이메일을 저장하는
모델들이 있습니다.
모든 게 좋아 보입니다. 그리고
일일 요약을 저장하는 모델도 있고요.
이것을 Claude와 Cursor와 비교해보죠.
GPT-5에는 뉴스레터 이메일 컬렉션과
일일 요약이 있고
여기에 저장될 Google 인증정보도
있습니다. 이것들은
Qwen에는 언급되지 않았지만
여기에는 사용자 설정이 없어서
나중에 문제가 될 수 있습니다.
Claude 코드의 스키마를 보면, 네,
사용자가 있고 Clerk ID도 설정되어 있습니다.
뉴스레터가 있고
HTML 콘텐츠가 리스트에 있습니다.
이것이 제가 본 최고의 스키마인 것 같습니다.
요약 아이템들이 있고요.
이것이 확실히 가장 포괄적인 Prisma
스키마 생성 측면에서 최고였습니다.
GPT-5에 따르면 정말 많은 걸 해냈습니다.
Prisma를 설정하고 Clerk를 활성화하고
OpenAI API, Google API들, 그리고
콘텐츠 처리 측면에서
훨씬 더 많은 것들을 했습니다.
Gmail 수집을 설정하고
요약 기능도 설정했습니다.
Qwen이 이 작업에서는
가장 빨랐지만, 주로 많은 초기화와
설정만 했습니다. 이 경우에는
GPT만큼 깊지 않았어요.
Claude에 따르면 모든 의존성이
준비되었습니다. Clerk가 설정되었고
Neon 데이터베이스 스키마로 Prisma를 설정했습니다.
Gmail 통합을 설정하고
가져오기 서비스를 설정했습니다.
뉴스레터용 데이터베이스 모델을 만들고
OpenAI 통합을 했습니다. 일일 요약용
UI를 구축하고
백엔드 작업을 위한 API 라우트를 생성했습니다.
Cursor CLI와 GPT-5가
몇 가지 지침을 주었습니다. 데이터베이스 URL,
OpenAI API 키, 그리고 next public clerk
게시 가능한 키를 설정해야 합니다.
Neon에서 새 프로젝트를 만들고
지역을 설정하고 생성을 클릭하겠습니다.
브랜치로 가서 클릭하면
각 테스트마다 다른 브랜치를 만들 수 있습니다.
모두 하나의 데이터베이스에 유지하면서 말이죠.
이 브랜치 이름을 gpt5로 하고
여기서 생성된 특정 환경 변수를
복사해서
각 프로젝트의 .env 파일에
붙여넣겠습니다.
Claude 4, GPT-5, Qwen이 있고
이것들을 각 프로젝트의
.env 파일에 복사했습니다.
Claude가 Google Gmail API
설정 방법에 대한 지침도 줬습니다.
그것부터 진행하겠습니다.
Google Cloud Console에서
새 프로젝트를 만들겠습니다.
결제 계정, 조직, 위치를
설정했습니다. 이미 설정했었고
생성을 클릭하겠습니다.
Google Cloud에서
작업할 프로젝트를 선택합니다.
여기 newsletter가
선택되어 있네요.
지침에서 Gmail API를
활성화하라고 하니 돌아가서 해보겠습니다.
그럼 API 및 서비스로 가겠습니다. 여기 있는
버튼을 클릭해서
API 및 서비스를 활성화하겠습니다. 그리고
Gmail API를 선택하겠습니다. 이게
맞는 것 같네요. 클릭하겠습니다.
Gmail 받은편지함 데이터 보기 및 관리 활성화.
OAuth 2 자격 증명을
생성하고 애플리케이션은 웹 타입이어야 합니다.
여기 자격 증명에서
자격 증명 생성 OAuth
클라이언트라고 되어 있네요. 먼저
동의 화면을 구성해야 합니다. 브랜딩.
시작하기를 클릭하겠습니다.
뉴스레터 요약, 이메일, 대상을 입력합니다.
대상은 일단
외부로 설정하겠습니다. 다음으로
연락처 정보에서 이메일 주소를 설정하고
서비스 약관에 동의합니다. 계속하겠습니다.
이제 다시 돌아가서 OAuth
클라이언트를 생성해야 합니다. 타입은 웹 애플리케이션이고
승인된 리디렉션 URI가 필요합니다.
그걸 복사해서
여기에 붙여넣겠습니다. 그리고 생성을 클릭합니다.
각 모델이 요청하는 다음 항목은
Clerk 자격 증명입니다. Clerk는
제가 만든 모든 프로젝트에서
사용했는데, 설정이 정말
간단합니다. 대시보드로 가면
애플리케이션 생성을 클릭합니다.
첫 번째 것은 newsletter GPT5라고
명명하겠습니다. 애플리케이션을 생성하고
여기에서 바로
API 키를 가져오면 됩니다.
이걸 복사해서
ENV 파일에 다시 복사해서
모든 비밀 키를 넣었습니다.
이걸 안전하게 보관하고
클라우드 저장소에
푸시되지 않도록 해야 합니다. 그리고
Prisma generate와
Prisma migrate deploy를 실행해야 합니다.
Prisma generate는 이런 종류의
클라이언트 라이브러리를 생성해서 Next.js가
데이터베이스와 대화할 수 있도록 합니다.
그리고 npx Prisma
migrate deploy는 Prisma를 사용해서
데이터베이스의 Prisma 스키마를 가져와서
Neon을 통해 Postgres 데이터베이스에
설정합니다.
Cursor CLI와 GPT-5에서 첫 번째 오류가 발생했습니다.
Prisma 스키마에서 명백한 오류가 있습니다.
Prisma deploy 실행 오류입니다.
오류를 붙여넣고 엔터를 치겠습니다.
여기가 좀 불안정하네요. CLI에서 받고 싶은
이상적인 인터페이스 응답이 아닙니다.
아무것도 작동하지 않아서
그냥 종료해야겠습니다.
Claude Code와 Claude는 대부분 Opus이고
약간의 Sonnet이 명확한 승자입니다.
완전한 앱을 만들어냈습니다.
랜딩 페이지까지 있었고
Clerk 설정에서 중첩을 올바르게 처리했으며
요약 작업을 위해 OpenAI
인프라와 정말 잘 연결되었습니다.
모든 뉴스레터를 분해해서
인용과 요약 부분에 사용된
뉴스레터들의 요약을 제공했습니다.
단 몇 번의 프롬프트로
매우 적은 오류로
제가 필요한 모든 것을 얻었습니다.
실제로 발생한 오류들은 대부분
제 인적 오류였습니다.
지난 주 제 지난 비디오에서 Claude가
그렇게 잘하지 못했다고 말했는데
전혀 좋은 성능을 보이지 못했습니다. 실제로는
GPT-5가 승리했지만, 이번 경우에는
모든 면에서 Claude 코드가 정말
완벽하게 해냈습니다. 그래서 같은
시간대에 GPT-5와 Cursor CLI가
어떤 상황에 있는지 살펴보겠습니다.
자, 뉴스레터 대시보드를 클릭해보겠습니다.
대시보드로 이동하고 여기서
Gmail에 연결할 수 있는지 봅시다.
좋아요, 뉴스레터 수집을 클릭했습니다.
두 개의 이메일을 성공적으로 수집했네요.
그리고 이 생성 버튼을 누르면, 조금 암호 같긴 하지만,
제가 테스트한 이틀 동안의
요약이 나타납니다. 아무 일도 일어나지 않고 있어요.
Neon DB를 살펴보니 이메일은
수집했지만 요약 단계로
넘어가지 않았습니다. 따라서 GPT-5는
Claude만큼 완전하게 해내지 못했습니다.
이 수준까지 도달하기 위해 같은 시간에
세 배나 더 많은 수정 프롬프트를
입력해야 했다고 말해야겠네요.
이제 지난주
GPT-5가 출시되었을 때, Claude
Code와 GPT-5 모두에게
인보이스 추출 앱을 만들어달라는 프롬프트를 주었습니다.
그 경우에는 GPT-5가
가장 적은 오류로 앱을
성공적으로 생성했습니다. 그래서 Qwen의 경우,
응답을 반환하는 측면에서는 확실히 가장 빨랐지만
아무데도 가지 못하는 측면에서
가장 빠른 느낌이었습니다.
다른 모델들과 함께 프롬프트를 실행하는
모든 시간 동안, 이것이
제가 도달한 전부입니다. 우리는
뉴스레터 다이제스트 계정 로그인
단계에 있고, 다른 페이지나
백그라운드 인프라는 없습니다. 음,
요약 페이지는 있지만
접근할 수가 없습니다. 제가
할당받은 시간에 이것이
우리가 도달한 전부입니다. 이제 모든
비교 후에, 누가 1위일까요? 이제
만약 답을 알기 위해 비디오 끝으로
건너뛰었다면, 저에게 호의를 베풀어
좋아요와 구독 버튼을 눌러주세요.
정말 채널에 도움이 됩니다.
어쨌든, 결과로 넘어가겠습니다.
이 매우 과학적인 연구에서, 저에게는
확실히 Opus 4.1을 사용한
Claude Code가 1위입니다.
가장 부드러운 워크플로우였습니다. CLI는
가장 성숙하고 안정적이며
처음부터 끝까지 정말 좋은 플로우를
찾을 수 있었습니다. 그냥 작동했고
그것에 대해 할 말이 정말 많습니다.
이제, 이것이 이 모든 옵션 중에서
가장 비싸다는 점을 염두에 두어야 합니다.
토큰 사용량 측면에서, Claude Code가
앱을 완성하기 위해 입력과 출력을
합쳐 약 600만 토큰을 사용했고
Cursor와 GPT-5도 거의 비슷했습니다.
하지만 API를 사용한다면
약 18달러의 API 크레딧이 들었습니다.
하지만 저는 맥스 플랜을 사용했고
Opus와 Sonnet을 나란히 사용한 양을
Claude Monitor라는 유용한
GitHub 저장소를 사용해 확인했습니다.
그리고 CLI 측면에서, 우리는
같은 앱을 약 3달러로 만들 수 있었을 것입니다.
Qwen의 경우, 제 사용량을
이해하기가 조금 어렵습니다. 직접
연결해서 사용했기 때문에
추적할 수 없었습니다.
API가 아닌 Qwen 사이트에
Qwen 사이트에 직접 연결했기 때문에
API를 통한 것이 아니었습니다. 하지만 잠시 후
가격 체계가 어떻게 되는지 보여드리겠습니다.
Qwen의 가격 체계는 사용량에 따라
여러 등급이 있어서 약간 복잡합니다.
그리고 실제로 서로 다른 제공업체에서
다른 가격으로 접근할 수 있습니다.
Opus 4.1은 단연 가장 비싸서
입력 토큰 백만 개당 15달러이고
출력 토큰 백만 개당 75달러입니다.
Sonnet 4는 입력 백만 개당 3달러
출력 백만 개당 15달러입니다.
그리고 40만 컨텍스트 창을 가진 GPT-5는
입력 토큰 백만 개당 12.5달러
출력 백만 개당 10달러입니다.
저는 GPT-5를 Cursor CLI와 함께
2위로 평가하고 있습니다.
Cursor CLI는 완전히 새롭고 베타 버전이며
출시된 지 일주일밖에 안 됐습니다.
만약 제가 실제로 GPT와 함께
Cursor IDE를 사용했다면 더 나은
결과를 얻었을 것 같습니다.
아직 Cursor CLI에는 해결해야 할
몇 가지 문제가 있고
현재는 기능 세트가 줄어들어 있습니다.
개발할 시간을 가질 때까지 말이죠.
그리고 3위는 Qwen Coder입니다.
Qwen Coder 모델은 실제로 매우 빨랐습니다.
토큰 반환 속도 면에서
모든 모델 중 가장 빨랐습니다.
하지만 제가 완료한 작업량이
가장 적다고 느꼈고, Qwen Coder와 함께
포크된 Gemini CLI를 사용할 때
다양한 이유로 갑자기 멈추는 경향이 있었습니다.
물론 Grok, Gemini,
Kimmy와 같은 정말 잘 작동하는
다른 많은 모델들이 있고
Open Code와 Charm 같은 다른 CLI들도 있지만
이번 비교에는 포함하지 않았습니다.
이들은 제가 이 영상을 위해
시도해보고 싶었던 최고 등급 모델들의
일부일 뿐입니다. 저는 Claude Code를
주요 에이전트이자 드라이버로 사용할 예정입니다.
에이전트 기능이 정말 마음에 들기 때문이죠.
하지만 Cursor IDE 내부에서 사용할 것입니다.
거기서는 여전히 월 20달러로
GPT-5, Gemini, 그리고 원하는
다른 모델들과 소통할 수 있기 때문입니다.
다른 종류의 백그라운드 에이전트
실행도 포함해서 말이죠.
그래서 저는 이 모델들을
계속 시도해보면서 어디에 가장
적합한지 알아볼 예정입니다.
온라인에서 읽은 많은 내용에 따르면
GPT-5는 전략적 목적에 가장 적합하고
Claude는 여전히 코드 구현에서
가장 뛰어난 것 같습니다.
그래서 앞으로 몇 주 동안
각 모델을 사용하는 패턴을 확립하고
어떤 것이 무엇에 가장 좋은지
결정하게 될 것입니다. 일주일 후
GPT-5에 대한 여러분의 의견을
듣고 싶습니다. 무엇이 마음에 들고
무엇이 싫으신가요? 그리고
여러분의 소프트웨어 개발 실무에서
Claude 시리즈를 대체했나요? 다음 영상에서 뵙겠습니다.