샘 올트먼, 드디어 GPT-5 공개 (GPT-5 설명)

채널 아이콘
TheAIGRID 구독자 324,000명

요약

영상은 GPT-5의 로드맵 공개와 함께, AI 모델의 복잡한 제품 구성이 사용자의 결정 마비로 이어진 문제점과 이를 해결하기 위한 통합 지능 시스템 구축 방안을 설명합니다. 특히, 다양한 모델 옵션 대신 단일 또는 통합된 모델 체계로 전환하는 ‘Router LLM’ 기술을 중심으로 비용 효율성과 응답 속도 개선에 대해 논의합니다. 또한, 무료와 유료 사용자 간의 차별화된 제공 방식, 향후 모델 출시 일정과 가격 정책 등 미래 전망에 대해서도 심도 있게 다룹니다.

주요 키워드

GPT-5 GPT-4.5 Router LLM 통합 지능 분석 마비 모델 선택 ChatGPT 인터페이스 가격 정책

하이라이트

  • 🔑 GPT-5의 상세 로드맵이 명확하게 공개되어, 앞으로의 발전 방향을 엿볼 수 있음.
  • ⚡️ 기존 ChatGPT 인터페이스의 여러 옵션이 사용자의 선택을 어렵게 만들어 분석 마비 현상이 발생함.
  • 🚀 ‘Router LLM’ 기술을 도입하여 질문의 복잡도에 따라 적절한 모델로 자동 라우팅, 비용 및 응답 속도를 최적화함.
  • 🌟 모델들을 하나의 통합 시스템으로 구성하는 통합 지능 접근법이 제안되어, 보다 일원화된 AI 서비스를 기대할 수 있음.
  • 📌 무료 사용자와 유료(플러스) 사용자를 위한 차별화된 가격 정책 및 서비스 제공 방식이 향후 AI 시장 경쟁력의 핵심이 될 것으로 전망됨.

용어 설명

Router LLM

사용자의 질문을 분석하여 질문의 복잡도와 요구되는 처리 능력에 따라 적절한 AI 모델로 라우팅하는 기술로, 비용 효율성과 응답 시간 최적화를 목표로 함.

통합 지능 (Unified Intelligence)

여러 개의 개별 모델 대신 하나의 통합된 시스템을 구축하여 다양한 작업을 동시에 수행할 수 있도록 하는 접근 방식.

분석 마비 (Analysis Paralysis)

너무 많은 선택지가 제공될 때 사용자가 결정 내리기 어려워지는 현상으로, AI 제품에서 사용자가 최적의 모델을 선택하기 어렵게 만드는 문제를 뜻함.

[00:00:00] 소개 및 GPT-5 로드맵 공개

영상은 GPT-5의 로드맵 공개 소식을 전하며 시작됩니다. 주요 내용은 GPT-5가 어떻게 배포될지에 대한 전반적인 개요를 제공합니다.

샘 알트만이 GPT-5의 공식 로드맵을 발표했으며, 이는 추측이 아닌 실제 정보를 담고 있습니다.
[00:00:21] 인터페이스 복잡성과 결정 마비 문제

ChatGPT의 드롭다운 메뉴 등 여러 모델 선택 옵션이 과도해 사용자가 혼란에 빠지는 문제를 설명합니다. 이로 인해 사용자들이 최적의 선택을 내리기 어려워지는 상황을 지적합니다.

현재 AI 시스템의 복잡성을 인정하고, 주요 챗봇 제공업체들이 더 단순화된 방향으로 발전할 것임을 시사했습니다.
현재 ChatGPT의 복잡한 모델 선택 시스템이 사용자들에게 혼란을 주고 있음을 설명합니다.
너무 많은 선택지는 '분석 마비'를 일으키며, 이는 제품의 실패로 이어질 수 있다고 지적합니다.
OpenAI는 복잡한 모델 선택기를 없애고 통합된 지능 시스템으로 전환하기를 원합니다.
라우터 LLM을 통한 통합 머신 인텔리전스 구현 방식이 소개됩니다. 이는 LLM을 효율적으로 설정하고 관리하기 위한 기본적인 방식입니다.
[00:03:00] 통합 지능 및 Router LLM

‘Router LLM’ 기술을 중심으로, 사용자의 질문을 분석해 적절한 모델로 연결하는 방식을 소개합니다. 이 시스템은 비용 절감과 응답 시간 단축을 목적으로 합니다.

사용자의 질문을 분석하는 라우터 시스템이 설명됩니다. 이 시스템은 질문의 복잡도에 따라 적절한 모델로 라우팅하여 효율적인 응답을 제공합니다.
Route LLM의 실제 테스트 결과와 비용 효율성이 소개됩니다. 이 시스템은 비용을 85% 정도 감소시키는 성과를 보였습니다.
O 시리즈와 GPT 시리즈를 통합하여 더 효율적이고 강력한 AI 시스템을 구축하려는 목표가 제시됩니다.
사용자 구독 등급에 따른 차별화된 서비스 제공 방식이 설명됩니다. 월 200달러 구독자는 전체 기능을 사용할 수 있지만, 무료 사용자는 제한된 기능만 이용 가능합니다.
GPT-5는 하루 10-20회 정도의 쿼리만 허용되며, 이는 여러 모델을 따로 운영하는 것보다 효율적인 배포 방식이 될 것입니다.
GPT-5는 GPT-3를 포함한 다양한 기술을 통합한 시스템으로 출시될 예정이며, 더 이상 GPT-3를 독립 모델로 제공하지 않을 것입니다.
샘 알트만은 GPT-5가 현존하는 기술들을 통합할 것이며, 올해 아무도 예상하지 못한 혁신적인 기능을 선보일 것이라고 암시했습니다.
OpenAI는 GPT-5 이전에 '오리온'이라 불리는 GPT-4.5를 마지막 비 사고 연쇄 모델로 출시할 예정이며, 이는 기존 훈련 방식의 마지막 모델이 될 것입니다.
GPT-4.5는 Claude 3.5 Sonnet보다 약간 더 나은 성능을 보일 것으로 예상되나, 혁신적인 성능 향상보다는 점진적인 개선이 될 것으로 전망됩니다.
OpenAI는 Claude 3.5를 약간 앞서는 것을 목표로 하고 있으며, 이는 내부적으로 'Orion'이라 불리는 GPT 4.5로 달성할 수 있을 것으로 예상됩니다.
지금까지 모델을 배포하지 못한 주요 이유는 추론 비용이 너무 높았기 때문이지만, 시간이 지날수록 LLM의 가격이 매 12개월마다 약 10배씩 하락하고 있습니다.
GPT 4.5는 3월 말까지, GPT 5는 2분기 말이나 3분기 말에 출시될 것으로 예상됩니다.
무료 사용자들은 'GPT 5'를 '표준 지능' 설정으로 무제한 이용할 수 있게 되며, 플러스 구독자들은 더 높은 수준의 지능과 긴 사고 체인에 접근할 수 있게 될 것입니다.
[00:10:50] 가격 정책과 미래 전망

유료 및 무료 사용자를 위한 차별화된 가격 정책이 논의됩니다. 향후 모델 출시 일정과 통합 시스템 도입에 따른 시장 변화에 대한 전망을 제시합니다.

타임라인 정보가 없습니다.

마침내 GPT-5의 로드맵이 공개되었습니다.
GPT-5에 대해 제가 이 영상을 촬영하게 된 이유는
정말 흥분되는데요,
이번에는 처음으로
추측성 정보가 아닌
실제 GPT-5의 전체 로드맵이
우리가 완전히 이해할 수 있도록 공개되었기 때문입니다.
그래서 시간을 낭비하지 말고
GPT-5가 어떻게 배포될 것인지
자세히 살펴보도록 하겠습니다.
이는 미래 AI 시스템이
어떻게 발전할 것인지에 대한
흥미로운 정보를 제공하는데
저도 이에 동의하며
대부분의 AI 시스템이
주요 챗봇 제공업체들의 경우
이런 방향으로 발전할 것 같습니다. 몇 시간 전에
샘 알트만이 트윗을 통해
GPT-4.5와 GPT-5의 공식 로드맵 업데이트를
발표했는데요,
그는 로드맵 공유를
더 잘하고 제품 제공을
단순화하고 싶다고 말했습니다.
AI가 사용자를 위해
잘 작동하기를 원한다면서
현재 모델과 제품 제공이
얼마나 복잡해졌는지 인정했습니다.
기본적으로 설명하자면
ChatGPT를 사용해 본 적이 있고
실제로 사용 중이며
많은 투자를 하고 있다면
예를 들어
최상위 티어의 ChatGPT를 사용 중이라면
현재 완전히 혼란스러운 상태입니다.
제가 지금부터
무슨 의미인지 보여드리겠습니다.
ChatGPT는 처음에는 꽤 단순해 보이지만
이 드롭다운 메뉴를 보면
불행하게도 제가 보는
레이아웃은 여러분과 다르게
1, 2, 3, 4, 5, 6, 7,
GPT-4, mini, 그리고
임시 채팅까지 포함하면 9개가 있습니다.
기본적으로 이 문제는
분석 마비를 일으키고
사용자의 의사결정에 영향을 미칩니다.
예를 들어 누군가가
AI 챗봇을 사용하려고 할 때
실제로 어떤 모델이 최선인지 모릅니다.
GPT-4가 있고
GPT-4.0 스케줄, 01, 03 미니,
하이 03 미니, 01 프롬 모드 등
너무 많은 선택지가 있습니다.
제품 선택에서 항상 언급되는 것은
선택지가 너무 많으면
제품이 실패한다는 것입니다.
이런 상황에서 ChatGPT는
이 모든 것을
단순화하기를 원합니다.
왜냐하면 이것은
일반 사용자가 사용하기에
너무 복잡하기 때문입니다.
저같이 각 작업에 대해
정확히 알고 있는 사람에게는 괜찮지만
일반 사용자에게는 실제로 방해가 되며
좋지 않은 요소입니다.
그래서 그들은
이를 매우 흥미로운 방식으로 변경할 예정이며
이에 대해 나중에 설명하겠습니다.
그들도 우리처럼
모델 선택기를 싫어하며
마법같은 통합 지능으로
돌아가기를 원합니다.
그래서 제가 생각하기에 그들이 취할
접근 방식 중 하나는 이런 통합된 기계를
라우터 LLM을 통한 통합 머신 인텔리전스 구현이
이것은 프레임워크라기보다는
LLM을 설정하는 기본적인 방식입니다.
작업을 훨씬 더 쉽게 만들기 위한 방법이죠.
이렇게 하면 훨씬 수월해집니다.
시스템 프롬프트가 아닌 사용자 프롬프트,
실제 사용자 프롬프트를 사용하게 됩니다.
예를 들어, 사용자가
'오늘 날씨는 어때?'라고 물어보면
라우터가 입력된 모든 프롬프트를
분석하게 됩니다.
이 라우터는 사용자의 질문을 보고
비용과 지연 시간을 분석하고
질문을 검토하여 판단합니다.
라우터는 이 질문이
복잡한 모델이 필요한지,
아니면 간단한 모델로 충분한지
판단하게 됩니다.
2초 안에 답변할 수 있는 간단한 질문인지
어려운 질문이라면 가장 intensive한
LLM으로 전달됩니다.
이는 오랜 시간 동안
생각해야 하는 모델이죠.
반면 매우 간단한 질문,
예를 들어 '닭이 먼저냐,
달걀이 먼저냐' 같은 질문은
매우 간단한 모델로 전달되고
최종적으로 시스템 응답을 받게 됩니다.
이것은 이미 테스트된 방식입니다.
OpenAI가 아닐 수 있지만
다른 회사들이
Route LLM과 같은 시스템을 테스트했고
매우 좋은 결과를 얻었습니다.
비용이 약 85% 정도
감소했다고 합니다. 이에 대해서는
'Route LLM: 비용 효율적인 LLM 라우팅을 위한
오픈소스 프레임워크' 블로그 포스트에서
자세히 읽어볼 수 있습니다. 여기서는
라우팅 설정에서 두 가지 모델,
즉 더 강력하고 비싼 모델과
더 약하지만 저렴한 모델
이 두 가지를 사용하는 경우에 초점을 맞추어
높은 품질을 유지하면서
비용을 최소화하는 것을
목표로 했습니다.
여기서 볼 수 있듯이,
O 시리즈 모델과 GPT 시리즈를
통합하는 것이 주요 목표이며,
모든 도구를 사용하고 언제 오래 생각할지
판단할 수 있는 시스템을 만들어
다양한 작업에 유용하게 만드는 것입니다.
앞서 언급한 프레임워크처럼
Route LLM이 앞으로 우리가 마주하게 될
상황일 가능성이 높습니다.
올인원 시스템을 갖게 될 것이고
향후 모델들은
올인원 시스템으로
제공될 가능성이 높습니다.
물론 시스템의 일부가
O3 미니나 O3 하이 등으로 나눠질 수 있지만
우리는 기본적으로
하나의 거대한 모델이나
조율된 LLM 세트로 향하고 있으며
이는 통합된 수준의
인텔리전스를 제공할 것입니다.
사용자의 구독 등급에 따라
다양한 수준의 인텔리전스에
접근할 수 있게 될 것입니다.
월 200달러를 지불하면
모델의 전체 기능과
고급 추론 기능에
접근할 수 있지만, 무료 사용자는
하루에 한두 가지 정도만
질문할 수 있게 될 것입니다.
하루에 10-20개 정도의 쿼리만 가능하고
아마도 이런 방식으로
모델이 배포될 것입니다. 왜냐하면
6개의 다른 모델을 운영하는 것보다
훨씬 쉽기 때문이죠.
그리고 다른 기업들이
새로운 모델을 출시할 때
이 모델이 확실히 더 좋지만
OpenAI의 브랜딩 측면에서는
더 나은 선택이 될 것 같습니다.
또한 그들은 ChatGPT와
API에서 언급했는데
GPT-5는 GPT-3를 포함한
많은 기술들을 통합한
시스템으로 출시될 것이라고 합니다.
그리고 더 이상
GPT-3를 독립형 모델로 제공하지 않을 것이라고 했습니다.
이를 보면 GPT-5가
GPT-3를 자체 아키텍처의 일부로
흡수할 것이 분명하고
이는 모델의 일부가 될 것입니다.
꽤 오랫동안 말이죠.
즉, GPT-5는 아마도
GPT-3, GPT-1 등 다양한 부분들로 구성된
시스템이 될 것이고
이는 정말 흥미로운
시스템이 될 것 같습니다.
또 한 가지 흥미로운 점은
샘 알트만이 언급한 내용인데
매우 흥미로운 부분입니다.
그는 GPT-5가 하나의 시스템으로서
많은 기술들을 통합할 것이라고 했습니다.
하지만 현재 우리가 가진
모든 것을 포함하는지는 모르겠습니다.
한때 샘 알트만이
올해 아무도 생각하지 못한
무언가를 출시할 것이라고
말한 적이 있는데
이는 매우 흥미롭습니다.
제 생각에 GPT-5는
컴퓨터 에이전트가 될 것 같고
아마도 그들이
이름을 그렇게 짓지 않을까 싶습니다.
왜냐하면 그것이 가장 말이 되기 때문이죠.
이것이 저를 매우 흥미롭게 만드는데
도대체 어떤 것이
GPT-5의
최종 버전이 될지 궁금합니다.
모델이 매우 똑똑하다는 것을 알지만
그들은 또한 말했습니다.
다음 GPT-5를 출시하기 전에
GPT-4.5를
내부적으로 '오리온'이라 부르는 모델을
마지막 비 사고 연쇄 모델로
출시할 것이라고 했습니다.
이는 곧 마지막으로
기존의 훈련 방식을 사용하는
모델이 될 것이라는 의미입니다.
데이터를 수집하고 모델에 입력하여
훈련시키고, 후처리 작업과
미세 조정을 거치는
일반적인 방식 말이죠.
GPT-4나 GPT-4.0과 같은 표준 모델
출력을 위한 모든 과정들이
마지막 모델에 들어갈 것입니다.
제가 전에 말씀드린 것처럼
우리는 새로운 모델 훈련 패러다임에 있고
GPT-4.5는 제 추측으로는
아마도, 이건 제 개인적인 생각인데
Claude 3.5 Sonnet 수준이지만
그보다 조금 더 나을 것 같습니다.
아주 크게 뛰어나지는 않고
약간 더 나을 것 같은데
Claude 3.5 Sonnet이 워낙 뛰어나기 때문입니다.
하지만 제가 예상하기로는
질적으로 더 나아질 것 같습니다.
다른 모델들이 벤치마크에서
Claude 3.5를 능가하긴 하지만,
Claude를 실제로 사용해보면
훨씬 더 똑똑하고 상황을
정확히 이해하는 것 같습니다.
그래서 OpenAI의 목표는
Claude 3.5를 약간 앞서는 것이
될 것 같고, 이는
내부적으로 'Orion'이라 불리는
GPT 4.5로 가능할 것 같습니다.
이 모델이 뛰어나다는 걸 알았지만,
지금까지 배포하지 않은 이유는
대부분의 사람들이 궁금해하던 것처럼
실제로 그들이 언급했던 바와 같이
한 기사에서 설명했듯이
모델의 추론 비용이 너무 높아서
아직 서비스할 수 없었기 때문입니다.
하지만 우리가 알다시피
시간이 지날수록 추론 비용은 꾸준히 감소하고
어제 영상에서 언급했듯이
샘 알트만이 말했던 것처럼
매 12개월마다
LLM의 가격이 약 10배 정도 하락합니다.
그래서 지난 몇 개월 동안
이 모델을 학습시키고
안전성 테스트를 마친 뒤
추론 비용이 크게 하락해
이제는 합리적인 수준에
도달했을 것으로 보입니다.
이제 모델 출시 시기에 대해
예상 시점을 이야기해보자면
이 모델이 언제 나올지
'몇 주 또는 몇 달'이라고 했습니다.
GPT 4.5나 GPT 5의 출시 시기에 대해
GPT 4.5는 아마도
향후 몇 주 안에 출시될 것 같습니다.
제 예상으로는 3월 말까지는
GPT 4.5가 나올 것이고, GPT 5는
2분기 말이나 아마도
3분기 말이 될 것 같습니다만,
이는 제 개인적인 추측입니다.
시간대로 보자면
다음 모델들이 출시되는 시기는
대략 이 정도가 될 것 같습니다.
제가 생각하기에는
이 정도 시기가 될 것 같습니다.
무료 사용자들의 경우
실제로 언급된 바로는
ChatGPT 무료 티어에서도
GPT 5를 '표준 지능' 설정으로
무제한 이용할 수 있게 된다고 합니다.
여기서 주목할 점은 '표준 지능'이며
고급 지능은 아니라는 것입니다.
즉, GPT-3의 미니 고급 버전 같은
높은 수준의 기능은 없을 것이며
현재 우리가 접근할 수 있는
최고 수준의 지능이나
긴 사고 체인은
포함되지 않을 것입니다. 이는
DeepSeek이 매우 높은 수준의
지능을 아주 저렴한 가격에
제공하면서 취한 전략으로 보입니다.
이로 인해 사람들이 DeepSeek을
사용하는 것이 더 비용 효율적이
되었죠. 이는 정말
흥미로운 변화입니다.
또한 그들이 언급한 바로는
플러스 구독자들은
GPT 5를 더 높은 수준의
지능으로 실행할 수 있게 될 것이며
모델이 더 깊이 생각하고
긴 사고 체인에 접근할 수 있을 것으로 예상됩니다
그런 사고의 연결을 통해서
더 깊은 통찰력을 제공하게 될 것이고,
프로 구독자들은 GPT-5를
더 높은 수준의 지능으로
이용할 수 있게 될 것입니다.
이 모델들은 음성, 캔버스 검색, 심층 연구 등을
통합할 것입니다.
OpenAI가 하고자 하는 것은
기본 모델은 무료로 제공하지만,
음성, 캔버스 검색, 심층 연구 같은
고급 기능을 원한다면
아마도 최상위 등급인
월 200달러 정도를
지불해야 할 것 같습니다.
비싸게 느껴질 수 있지만,
OpenAI가 생각하는 것은
새로운 기능이 나올 때마다
GPT-5 시스템에
계속해서 추가될 것이라는 점입니다.
결과적으로 시스템이 점점 더 똑똑해지면서
여러분이 지불하는 비용 대비
가치는 계속 증가하게 됩니다.
이해가 되셨을 것 같네요.
정말 흥미로운 점은
가격 정책이 어떻게 될 것인가 입니다.
OpenAI는 사용량 기반 가격제도
논의 중인데, 월 200달러는
정말 엄청난 금액이죠.
제가 아는 사람들 중에는
이만큼의 가치를 얻을 수 있는 사람이
없을 것 같지만, 분명 사용하는
사람들이 있을 것입니다.
또 하나 흥미로운 점은
'GPT-5보다 똑똑할 수 있을까'입니다.
샘 알트만이 언급했는데,
자신도 GPT-5보다
똑똑하지 않을 것이라고 생각한다고 합니다.
'GPT-4보다 자신이 더 똑똑하다고 생각하는 사람이 몇 명이나 될까요?'
'자, 그럼 GPT-5보다
더 똑똑할 거라고 생각하는 사람은 몇 명이나 될까요?'
'더 많은 손이 올라갈 줄 알았는데요.'
'저는 GPT-5보다 똑똑하지 않을 것 같아요.
하지만 그것이 슬프지는 않습니다.
왜냐하면 이를 통해 우리가
놀라운 일들을 할 수 있게 될 것이기 때문이죠.
우리는 더 많은 과학적 발전을 원합니다.
더 많은 연구자들이
이전에는 할 수 없었던 일들을
할 수 있게 되길 바랍니다.
이것이 바로 인류의
오랜 역사가 보여주는 것입니다.
이번에는 조금 다르게 느껴지는데,
그것이 가능케 할 수 있는 것들 때문입니다.
과학자들이 이 놀라운 고지능 도구를 가지고
올바른 질문을 찾는 데 더 집중하고
더 빠르게 문제를 해결하며
연구를 가속화할 수 있다면
그것은 우리 모두에게 승리입니다.
우리는 이것을 제공하게 되어 기쁩니다.
그렇다면 여러분은
GPT-5에 대해 어떻게 생각하시나요?
저는 통합 지능이
정말 기대됩니다.
이 모델들을 하나로 통합하는 것이
실제로 매우 합리적으로 보입니다.
작업 효율성과
모델의 단순성 측면에서
아주 이치에 맞죠. 마케팅에서
유명한 사례가 있는데,
여러분이 모를 수도 있지만
비즈니스 교훈으로 들어보세요.
잼 가게 사례인데,
두 개의 가게가 있었습니다.
하나는 24종류의 잼을, 다른 하나는
6종류의 잼을 판매했습니다.
24종류가 있는 가게에서는
선택지가 더 많으니까
더 많이 팔릴 거라고 생각했지만
오직 3%만이 구매했습니다.
반면 6종류만 있던 가게에서는
30%가 구매했죠.
이는 선택지가 너무 많으면
오히려 결정을 못 한다는 것을
보여줍니다.
AI도 마찬가지입니다. ChatGPT에서
GPT-4, 4.1, 3-mini, 3-mini High 등
너무 많은 선택지가 있는 게 문제죠.
Claude는 3개 정도의 모델이 있고
Gemini는 1-2개 정도의
모델만 있습니다.
사실 Gemini도
모델이 좀 많은 편인데,
중요한 점은 Claude처럼
모두가 Claude 3.6을 쓰는 것처럼
하나의 모델을 쓰고,
DeepSeek처럼
기본 씽킹 모델 하나만
사용하는 게 낫다는 거죠.
현재는 선택지가 너무 많아서
앞으로는 이 모든 것이
하나의 큰 모델로 통합될 것 같습니다.
자, 이것으로 마무리하겠습니다.
영상을 봐주셔서 감사하고
다음 영상에서 만나요.