[00:00]
GPT-5 Pro에 대한 소개를 시작하겠습니다.
[00:03]
모든 사람이 ChatGPT-5 Pro를 가지고 있지는 않다는 걸 알고 있습니다.
[00:05]
제가 ChatGPT-5 Pro를 다루는 이유는
[00:08]
이것이 전혀 다른 종류의 컴퓨팅을 나타내기 때문입니다.
[00:11]
AI가 다음으로 확장될 방향에 대한 힌트를 제공합니다.
[00:14]
그리고 이를 비즈니스에 적용하는 방법을 찾는 것은
[00:17]
모든 AI 활용 사례에
[00:19]
GPT-5 Pro를 단순히 추가하는 것만큼
[00:22]
간단하지 않습니다.
[00:24]
많은 판단이 필요합니다.
[00:26]
다음은 제가 실제로 효과가 있다고 본
[00:29]
사용 사례들을 깊이 파보며 작성한 현장 노트들입니다.
[00:32]
그리고 그런 사용 사례들이 왜 효과가 있는지에 대한 논리도 담았죠.
[00:35]
여러분이 GPT-5 Pro가
[00:38]
비즈니스에서 어디에 적합한지 파악할 수 있도록 말이죠.
[00:40]
이 노트들을 통해 탐구하고 싶은 핵심 논제는 다음과 같습니다.
[00:43]
GPT-5 Pro는
[00:45]
증명 가능할 정도로 더 똑똑하면서도
[00:48]
경험적으로는 더 나쁜 첫 번째 AI 모델입니다.
[00:52]
그리고 이 역설이 AI 개발의 미래에 대해
[00:56]
정말 근본적인 것을 드러낸다는 점입니다.
[00:58]
다시 말하겠습니다.
[01:00]
사람들이
[01:01]
기침을 하며 커피를 뱉어낼지도 모르지만 말이죠.
[01:03]
이 모델은 더 똑똑합니다. 그건 맞아요.
[01:04]
모두가 예상했던 부분이죠. 하지만 동시에
[01:07]
경험적으로는 더 나쁩니다.
[01:09]
그 이유와 작동 원리에 대해
[01:11]
자세히 설명하겠습니다.
[01:13]
세부 사항으로 들어가겠습니다.
[01:14]
여러분이 GPT-5 Pro가
[01:16]
워크플로우에서 어디에 적합한지 파악하고
[01:18]
업그레이드할 가치가 있는지 판단할 수 있는 도구를 갖추고 가시길 원하기 때문입니다.
[01:21]
일부 사람들은
[01:23]
개인 사용자로서
[01:25]
월 200달러라는 정말 비싼 금액을
[01:26]
지불해야 하는지 질문하고 있습니다.
[01:29]
그 결정을 내릴 수 있는
[01:31]
도구를 갖고 가시길 바랍니다.
[01:32]
우선 GPT-5 Pro의 아키텍처에 대해 이야기해보겠습니다.
[01:34]
오늘 논의할 모든 것의 기반이 되기 때문입니다.
[01:37]
OpenAI는
[01:39]
시간의 관점에서 지능을 재구상했습니다.
[01:42]
추론 연산에 대해 꽤 많이 이야기했지만
[01:44]
다시 살펴볼 가치가 있습니다.
[01:47]
기본적으로 GPT-5 Pro에서
[01:49]
바로 그곳이 똑똑함이 나오는 곳이기 때문입니다.
[01:51]
단순한 모델 크기가 아닙니다.
[01:54]
연산 시간입니다. 구체적으로, GPT-5 Pro는
[01:58]
단순히 쿼리를 처리하는 것이 아닙니다.
[02:02]
동시에 여러 개의 병렬 추론
[02:04]
체인을 실행합니다.
[02:06]
독립적으로 여러 해결 경로를 탐색할 수 있습니다.
[02:10]
서로를 평가하고
[02:12]
그 다음 모든 추론 체인에서
[02:14]
최선의 접근법을 종합합니다.
[02:17]
이를 통해 가능한 것은
[02:19]
통합된 답변을 제시하기 전에
[02:21]
내부적으로 토론하는
[02:23]
전문가 패널처럼 사고하는 것입니다.
[02:25]
ChatGPT가 이러한
[02:27]
추론 시간 연산의 일반적인 접근법을
[02:30]
독점하고 있다고
[02:31]
가정하고 싶지는 않습니다. 그렇지 않거든요.
[02:34]
다른 모델 제작자들도
[02:35]
이 분야에서 작업하고 있습니다.
[02:38]
하지만 GPT-5 Pro가 정말, 정말 잘하는 것은
[02:42]
실제로 모든 병렬 추론을 가져와서
[02:44]
무엇이 올바른 결정이나 접근법인지
[02:47]
정말 일관되게 판단한다는 것입니다.
[02:51]
올바른 판단에 대한 이러한 강조는
[02:53]
GPT-5 Pro의 특징 중 하나이며
[02:57]
효과가 있는 사용 사례들로
[02:58]
넘어갈 때 일관된 주제로
[03:00]
나타날 것입니다. 이것이 GPT-5 Pro가 인터넷 접속으로
[03:04]
인터넷 액세스로 IQ 테스트에서 그렇게 좋은 점수를 받은 이유죠. 저는 IQ 테스트를 그리 신뢰하지 않습니다.
[03:07]
방향성 측면에서는 흥미롭다고 생각합니다.
[03:10]
확실한 것은
[03:12]
LLM과 IQ 테스트 이야기를 따라가고 있다면
[03:14]
GPT-5 Pro는 정말 뛰어납니다.
[03:16]
148점을 기록했다고 생각합니다.
[03:18]
특정 측정된 테스트 환경에서
[03:21]
경이적으로 똑똑한 모델입니다.
[03:23]
그 이유는 테스트 환경이
[03:25]
정확성도 중요하게 여기기 때문이라고 생각합니다.
[03:27]
그래서 GPT-5 Pro는 그런 환경에서 제 실력을 발휘하는 것 같습니다.
[03:30]
하지만 이 아이디어로 다시 돌아가서
[03:33]
전문가 패널이 토론하는 이 개념 말이죠.
[03:35]
이것은 인간이 실제로 어려운 문제를 해결하는 방식과 유사합니다.
[03:37]
그리고 이 부분이 온라인에서
[03:39]
많이 논의되지 않는 것 같습니다.
[03:42]
어려운 결정에 직면했을 때
[03:44]
우리는 정말로 선형적으로 생각하지 않습니다.
[03:46]
A면 B라는 식으로 말이죠.
[03:48]
그게 우리가 실제로 생각하는 방식이 아닙니다.
[03:50]
그건 우리가 글을 쓰는 방식일 수는 있어도
[03:52]
생각하는 방식은 아닙니다.
[03:54]
실제로는 여러 관점들을
[03:55]
마치 여러 측면들을 동시에 고려합니다.
[03:58]
깊이 생각할 때, 아이디어에 대해 숙고할 때
[03:59]
마치 서로 다른 아이디어들을
[04:02]
한 번에 살펴보는 것 같고
[04:03]
심지어 머릿속 뒤편에서도
[04:05]
그것들을 계속 돌려가며
[04:07]
아이디어의 다른 각도들을 살펴봅니다.
[04:08]
'위험요소는 무엇일까?
[04:10]
기회는 무엇일까?
[04:11]
이것이 다른 개념에 어떤 영향을 미칠까?
[04:13]
만약... 어떤 일이 일어날까?'라고 말할 수도 있습니다.
[04:14]
어떤 의미에서 GPT-5 Pro는 우리가 머릿속에서 하는
[04:18]
이런 병렬적 숙고를
[04:19]
기계화하고 있는 것 같습니다.
[04:21]
그것을 조금 시뮬레이션하려고 시도하고 있죠.
[04:24]
당신은 단순히 더 똑똑한 모델에 대한 접근권을 위해
[04:27]
200달러를 지불하는 게 아닙니다.
[04:30]
여러 추론 스레드를 동시에 실행하는
[04:33]
컴퓨팅 파워에 대해 비용을 지불하는 것입니다.
[04:35]
그리고 이것이 왜 더 똑똑한 모델에만
[04:36]
제한되어 있는지에 대한 단서를 제공합니다.
[04:39]
실행하는 데 비용이 만만치 않습니다.
[04:42]
모든 쿼리가 실제 컴퓨팅 리소스를 필요로 하는
[04:45]
병렬 프로세스들을 생성합니다.
[04:47]
하지만 정확성에서 이점을 얻게 됩니다.
[04:49]
그래서 다양한 종류의 테스트들을 살펴보면
[04:51]
고급 수학에서 100% 점수를 받았다거나
[04:53]
대학원 수준 추론에서 88.4%
[04:56]
벤치마크에서 주요 오류가 22% 적었다는 결과를 볼 수 있습니다.
[04:59]
좋습니다. 저는 테스트 결과를
[05:02]
한 번 걸러서 받아들이는 법을 배웠습니다.
[05:03]
제가 더 관심 있는 것은
[05:05]
정확성을 이끌어내는 아키텍처입니다.
[05:07]
왜냐하면 그것이 실제로
[05:09]
우리가 가야 할 곳으로 이끌어주는 것이기 때문입니다.
[05:11]
하지만 사용 사례로 들어가기 전에
[05:13]
실망스러운 점들이나
[05:15]
이것이 더 똑똑한 모델이면서도
[05:17]
동시에 문제가 있다는 사실에 대해
[05:18]
얘기해야 할 부분이 있습니다.
[05:21]
추론 시간 컴퓨팅의 개념과
[05:22]
가치 및 정확성에 대해 말했는데,
[05:25]
GPT-5 Pro가 정말 강조한 것 중 하나입니다.
[05:27]
여기서 우리는 트레이드오프가 있습니다.
[05:28]
이것이 이 경험이
[05:30]
다소 실망스러운 이유 중 하나입니다.
[05:32]
GPT-5 Pro를 정말 똑똑하게 만드는 병렬 처리가
[05:36]
깨뜨리기도 합니다.
[05:38]
'깨진다'는 것을 어떻게 정의하느냐에 따라서
[05:40]
매우 구체적이고 예측 가능한 방식으로 말이죠.
[05:42]
첫 번째는 조금 아이러니컬하고
[05:44]
비즈니스 맥락에서는
[05:45]
주목할 가치가 있습니다. 현재 GPT-5
[05:49]
Pro는 보안 관점에서 GPT보다 훨씬 더 취약합니다.
[05:53]
이건 제가 하는 말이 아니라
[05:56]
중요한 보안 전문지들에서
[05:57]
널리 보고되고 있는 사실입니다.
[06:00]
그들은 적대적 기법과
[06:02]
탈옥 기법을 사용해서
[06:05]
이 모델들을 테스트하고 있습니다.
[06:07]
그리고 발견한 것은 GPT-5 Pro와
[06:10]
GPT-5 계열 전체가 테스트에서 좋은 결과를 보이지 않는다는 것입니다.
[06:14]
그런데 Pro와 GPT-5
[06:15]
thinking의 차이점이 궁금하시다면,
[06:18]
간단히 말해서 병렬 추론의
[06:20]
강도를 얼마나 높이느냐의 차이입니다.
[06:22]
GPT-5 Pro는 스파이널 탭처럼
[06:24]
11까지 올려놓은 상태입니다.
[06:26]
그게 바로 작동 방식입니다.
[06:28]
모델이 여러 관점을 탐색할 때,
[06:30]
적대적 프롬프트가 특정 스레드를
[06:33]
오염시키고 최종 합성에
[06:35]
영향을 미칠 수 있습니다.
[06:38]
본질적으로 프롬프트가 공격할
[06:40]
표면적이 더 많아지는 것입니다.
[06:43]
이것이 병렬 추론의 구조적 비용입니다.
[06:45]
OpenAI의 누군가가 이를 해결하기 위해
[06:47]
열심히 작업하고 있을까요? 물론입니다.
[06:50]
하지만 현재로서는
[06:52]
GPT-5 Pro가 직면한 과제의 일부입니다.
[06:54]
병렬 스레드를 확장하면
[06:56]
공격 벡터도 확장됩니다. 당연한 일입니다.
[06:58]
두 번째 트레이드오프는 개성 상실입니다.
[07:01]
여러 추론 체인을 종합할 때
[07:03]
합성된 결과를 얻게 됩니다.
[07:06]
모델이 관점들을 통합할 때 일관된 목소리를 유지하는 데 어려움을 겪을 수 있습니다.
[07:10]
이것이 바로 때때로 GPT-5 Pro에서
[07:12]
정말 깔끔하고 정확하지만
[07:15]
사용자들이 로봇 같다고
[07:17]
느낄 수 있는 응답을 얻는 이유입니다.
[07:20]
이는 사람들이 감정적인 모델이었던
[07:22]
4.0에서 정확성을
[07:24]
중시하는 GPT-5로 넘어가면서
[07:26]
느끼는 불만의 근본 원인 중 하나입니다.
[07:29]
여러 관점을 보고 정확히 맞는 것을 선택하고
[07:32]
평균화하고 종합할 때,
[07:34]
많은 개성이 사라집니다.
[07:36]
세 번째 트레이드오프는
[07:37]
맥락 저하입니다.
[07:39]
병렬 스레드 간의 일관된 맥락을
[07:41]
유지하는 것은 단일 내러티브 스레드를
[07:44]
유지하는 것보다 훨씬 어렵습니다.
[07:47]
이는 병렬 경로가 분기되기 시작하고
[07:49]
메모리 단편화 문제 등을
[07:52]
만들 수 있기 때문에 어려움을 야기합니다.
[07:55]
이는 우리가 사용 사례와
[07:57]
GPT를 어디에 사용할지 논할 때
[07:59]
다시 나올 내용입니다.
[08:01]
네 번째는... 이 부분으로
[08:03]
넘어가기 전에 말하자면, ChatGPT가
[08:06]
이 위험을 관리하기 위해 뒤에서
[08:08]
많은 작업을 했다고 생각하므로
[08:10]
맥락에서는 여전히 사용 가능합니다.
[08:12]
그 부분도 다룰 예정입니다.
[08:14]
네 번째 트레이드오프는 데이터 구조 요구사항입니다.
[08:16]
GPT-5 Pro는 데이터에 굶주려 있지만
[08:19]
다중 관점 분석을 위해
[08:21]
조직화된 데이터가 필요합니다.
[08:23]
예를 들어 금융 문서는
[08:25]
숫자만 포함해서는 안 됩니다.
[08:28]
전략적 관점, 리스크 관점,
[08:30]
회계 관점에서 설명할 수 있는
[08:32]
여러 구조화된 레이어를
[08:34]
포함해야 합니다.
[08:35]
이런 전략적 레이어들을
[08:38]
CFO의 머릿속이나
[08:40]
여러 사람들의 머릿속에 보관하던 조직들은 정말 어려움을 겪을 것입니다
[08:46]
GPT-5 Pro가 제대로 작동하는 데 필요한
[08:48]
데이터를 제공하는 것에 대해 말입니다. 그럼 이제
[08:51]
사용 사례들을 살펴보겠습니다. 우리는
[08:54]
GPT-5 Pro가 잘하는 몇 가지에 대해
[08:56]
이야기했습니다. 또한 그 강력함이,
[08:58]
병렬 추론이 어떻게 취약점을
[09:00]
만들어내는지도 이야기했습니다.
[09:02]
이제 어떤 사용 사례가 효과적인지,
[09:06]
그리고 어떤 것이 그렇지 않은지
[09:08]
자세히 알아보겠습니다. 그리고 여러분이
[09:11]
직접 이를 활용할 수 있도록
[09:13]
핵심을 알려드리겠습니다. GPT-5를
[09:17]
병렬 추론이 정말 큰 도움이 되고
[09:20]
정확성이 정말 중요한 경우에
[09:22]
사용하세요. 예를 들어
[09:24]
과학 연구 분야입니다. 암젠(Amgen)이
[09:28]
- 이것은 실제 사례로 알려져 있습니다 -
[09:29]
고분자 구조를 분석할 때, GPT-5 Pro는
[09:33]
화학적 특성을 평가할 수 있습니다.
[09:35]
구조적 무결성을 평가하고,
[09:37]
제조 가능성과
[09:38]
규제 준수를 모두 동시에 할 수 있습니다.
[09:41]
실제로 우리에게는
[09:42]
웹상에서 GPT-5 Pro와
[09:45]
다른 O1R 추론 모델들이 어떻게
[09:49]
과학 연구 발전에 도움을 주었는지에
[09:52]
대한 많은 문서가 있습니다.
[09:54]
구글에서도 이런 추세를 볼 수 있습니다.
[09:55]
그들은 O1 모델을 사용하지는 않지만
[09:57]
자체 추론 모델을 가지고 있고,
[09:59]
근본적으로 과학 연구를 추진하고 있습니다.
[10:02]
왜냐하면 이것이 하나의 데이터에 대해
[10:05]
여러 관점에서 동시에 추론할 수 있게 해주고
[10:08]
정확한 해답으로
[10:10]
수렴할 수 있게 해주며, 정확성이
[10:12]
정말 중요하기 때문입니다. GPT-5 Pro의 경우,
[10:15]
이런 고분자 구조를 분석할 때
[10:16]
각 추론 스레드에서 여러 관점을
[10:19]
가져올 수 있습니다.
[10:20]
도메인 전문성도 활용할 수 있고,
[10:22]
분자의 구조 등도 가져올 수 있습니다.
[10:26]
최종적으로 이런 종합은 단일 추론 과정으로는
[10:28]
따라올 수 없는 통찰을 만들어낼 수 있고,
[10:31]
결정적으로 이것은 해당 분야를 발전시키거나
[10:33]
최소한 박사급 연구자에게
[10:35]
매우 강력한 사고 파트너 역할을
[10:38]
할 수 있습니다. 이것이 바로
[10:40]
모델 제작자들이 과학 연구를
[10:43]
그렇게 강조하는 이유 중 하나입니다.
[10:45]
그들이 잘하고 있고, 모델이 잘합니다.
[10:48]
하지만 우리 대부분은 과학자가 아니죠.
[10:50]
그래서 GPT-5 Pro 사용 사례 중에서
[10:52]
좀 더 접근하기 쉬운
[10:54]
다른 예시들을 들어보겠습니다.
[10:57]
금융 모델링입니다. 어느 정도 규모의
[10:58]
모든 비즈니스는 금융 모델링을 해야 합니다.
[11:01]
GPT-5 Pro는 손익계산서, 대차대조표,
[11:04]
현금흐름표를 동시에 분석하고
[11:06]
일관성을 위해 교차 참조할 수 있는
[11:09]
모델입니다. 여러 데이터 소스의 조정을
[11:12]
살펴볼 수 있고, 회계 기준을
[11:14]
살펴볼 수 있으며,
[11:15]
기간별 분석도 할 수 있습니다.
[11:18]
데이터를 처리해서 구조화된 방식으로
[11:20]
입력하면, 실제로
[11:22]
정말 좋은 성과를 낼 것입니다.
[11:24]
제가 ChatGPT-5 리뷰를 할 때
[11:26]
웃음이 나왔던 것 중 하나는
[11:28]
모델을 테스트하기 위해 의도적으로
[11:30]
이런 작업을 하지 않았다는 것입니다.
[11:33]
이제 GPT-5 Pro에게 만회할 기회를 주고 싶습니다.
[11:36]
추론 능력을 테스트하기 위해
[11:38]
의도적으로 더러운 데이터를 준 것을 압니다.
[11:40]
괜찮게 했습니다. 실제로는 GPT-5 Pro에게
[11:42]
여러 관점을 제공하는 노력을 기울이실 것을 권장합니다
[11:45]
비즈니스의 여러 레이어에서
[11:46]
데이터를 가능한 한 깨끗하게 만들어야 합니다
[11:48]
그래야 더 유용한 정보를 얻을 수 있기 때문입니다
[11:50]
저는 재무 모델링이 GPT-5 Pro의 좋은 활용 사례라고 생각합니다
[11:52]
법적 분석도 마찬가지죠
[11:54]
대규모 문서 컬렉션에 대한 실사를 수행하고
[11:57]
계약 조건을 검토하고
[12:00]
법적 위험을 식별할 수 있습니다
[12:03]
종속성도 살펴볼 수 있고요
[12:05]
이러한 추론 과정은 여러 관점에서
[12:08]
사물을 볼 수 있고
[12:09]
종합적 분석을 통해 인간 검토자가 놓칠 수 있는
[12:12]
부분까지 포착할 수 있습니다
[12:14]
이것은 인간이 법적 문서를
[12:16]
검토할 필요가 없다는 말이 아닙니다
[12:18]
병렬 추론을 위해 설계된 도구가 어떻게
[12:23]
정확한 답이 존재할 때
[12:25]
정확성을 향해 수렴할 수 있는가에 대한 이야기입니다
[12:27]
법적 분석에서도 마찬가지로
[12:29]
정확한 답이 존재합니다
[12:32]
특정 실사 질문에 대해
[12:33]
정확하고 최적의 법적 입장이 있습니다
[12:36]
주요 위험 요소들을 명시할 수 있고
[12:38]
하나라도 놓친다면 틀린 것입니다
[12:40]
마찬가지로 재무 모델링에서도
[12:42]
전체적으로 올바른 재무 산출 보고서를 만들 수 있고
[12:45]
숫자가 틀렸을 때뿐만 아니라
[12:48]
비즈니스의 모든 구성 요소와
[12:50]
재무 모델을 고려하지 않았을 때도
[12:53]
틀린 결과가 나올 것입니다
[12:56]
GPT-5 Pro는 이런 종류의
[12:58]
분석에 뛰어납니다
[13:00]
그래서 기회가 있는 거죠
[13:03]
그건 그렇고, 재무 모델링과
[13:04]
법적 분석도 팀들의 초기 통찰력을 바탕으로 합니다
[13:07]
과학, 금융, 법률 분야는 좋습니다
[13:09]
하지만 기술에 더 가까운 분야는 어떨까요?
[13:11]
맥케이 리글리는 콘텐츠 크리에이터이면서
[13:14]
동시에 코더이기도 합니다
[13:17]
그가 지적한 것 중 하나는
[13:19]
코딩 분야에서 GPT-5 Pro에 대해 기대한다는 것입니다
[13:21]
특히 아키텍처 결정에 있어서 말이죠
[13:25]
이것은 LLM들이 역사적으로
[13:27]
어려움을 겪어온 영역 중 하나입니다
[13:29]
기술 시스템을 어떻게 조합할지 정의하는 것은
[13:31]
어려웠습니다
[13:33]
상당한 컨텍스트 윈도우를 가진 GPT-5 Pro는
[13:36]
코드베이스의 큰 덩어리를 전체적으로 살펴보고
[13:40]
그 코드베이스에 대한 아키텍처 권장사항을 만들 수 있게 해줍니다
[13:43]
그리고 정확성을 향해 추론합니다
[13:46]
코딩 모범 사례를 고려하여
[13:49]
여러 추론 과정을 실행할 것입니다
[13:51]
병렬 추론의 모든 특징들
[13:52]
그리고 그것이 빛을 발하는 곳에서
[13:55]
그들이 나타나고 올바르게 생각합니다
[13:57]
마케팅에 대해 이야기하고 싶다면
[13:59]
제품에 대해 이야기하고 싶다면
[14:00]
그리고 이런 것들에 GPT-5 Pro
[14:02]
활용 사례가 있는 곳을 찾는다면
[14:03]
정확하거나 최적의 결정이 있는 영역을 찾고
[14:07]
모델에 여러 병렬 관점을 제공할 수 있는
[14:09]
영역을 찾아보세요
[14:11]
시장 진입을 시도하고 있고
[14:13]
제품팀과 마케팅팀이
[14:15]
거기 있고 제품으로 시장을 공략하는 방법을
[14:18]
알아내려고 한다면
[14:19]
정말 좋은 기회입니다
[14:21]
사용자 인터뷰를 가져오고
[14:24]
시장 조사를 가져오고
[14:26]
회사 프로필을 가져오고
[14:28]
제품 기회들을 가져오세요
[14:30]
GPT-5 Pro가 병렬로 추론하는 데 도움이 되는
[14:34]
많은 근거들이 있고 정확한 답을 얻을 것입니다
[14:36]
그것이 바로 목표입니다, 맞죠?
[14:39]
최적의 경로를 찾아주는 솔루션을 얻게 될 거예요.
[14:40]
모든 변수들을 고려한 최적의 경로 말이죠. 이제 병렬 추론이
[14:43]
도움이 되지 않는 몇 가지 사례를 살펴보겠습니다.
[14:47]
GPT-5 Pro는 아키텍처적 사고를 요구합니다.
[14:54]
순차적 사고에는 도움이 되지 않을 정도로 말이죠.
[15:00]
그래서 병렬 추론이 문제가 될 수 있어요.
[15:03]
전체적으로 일관된 관점을 제공할 수는 있지만
[15:07]
그건 정말 좋은 점이에요. 하지만 예를 들어
[15:10]
다른 LLM 에이전트들이 꽤 잘하는 코딩의 경우,
[15:14]
코딩은 아키텍처보다 훨씬 낮은 수준의 의사결정이에요.
[15:19]
코딩은 매우 순차적인 논리를 필요로 합니다.
[15:23]
이미 GPT-5 Pro가 코드를 생성할 때
[15:26]
이상하게도 때때로 맥락을 놓친다는 보고들이 나오고 있어요.
[15:31]
이는 여러 개의 순차적 코딩 스레드를
[15:35]
동시에 실행하기 때문일 가능성이 높습니다.
[15:38]
이 점을 주의하세요. 코딩에는
[15:40]
사용하지 않는 것이 좋을 수도 있어요. 창작 글쓰기의 경우, 특정한 단일한 목소리를 가진 서사가 필요하죠.
[15:48]
GPT-5 Pro는 이런 용도로 사용하지 않을 것입니다.
[15:50]
그렇게 사용하는 사람들도 많지 않아서, 이건 명확한 것 같아요.
[15:54]
하지만 이 모델로부터 정말 일관되고 사려 깊은
[15:58]
플롯 피드백, 플롯 아키텍처를 얻을 수는 있을 거예요.
[16:03]
특정 플롯 문제에 대한 해결책을 제시해줄 테지만,
[16:07]
대담한 창작적 선택을 하지는 못할 거예요.
[16:11]
특정한 목소리로 글을 쓰지도 못하고요.
[16:15]
그건 이 모델이 하는 일이 아니거든요.
[16:19]
대화 기능, 이건 정말 중요한 LLM 사용 사례예요.
[16:25]
실제 운영에서 보는 LLM 사용 사례의 상당수가
[16:29]
대화형 사용 사례입니다. 하지만 이건 대화용 모델이 아니에요.
[16:33]
첫째, 시간이 오래 걸려요. 둘째, 인간 대화에는
[16:38]
일관성과 개성이 필요합니다. 로봇 같다고 느끼면,
[16:42]
GPT-5 Pro는 로봇 같게 느껴질 텐데,
[16:45]
순차적이지 않거나 이곳저곳 튀어다니면
[16:49]
인간들은 좋아하지 않을 거예요. 그래서
[16:54]
많은 사람들이 GPT-4를 선호하는 이유이고,
[16:58]
결국 ChatGPT가 다시 도입한 이유이기도 해요.
[17:02]
이런 몇 가지 사례들이 병렬 추론이 잘 작동하는 곳과
[17:05]
그렇지 않은 곳에 대한 감각을 주길 바라요.
[17:09]
핵심은 필요한 데이터를 제공할 수 있느냐는 것입니다.
[17:14]
이제 GPT-5 Pro 사용의 인프라 비용에 대해 말씀드리겠습니다.
[17:21]
GPT Pro의 성공은 조직들이 보통 과소평가하는
[17:26]
근본적인 데이터 구조 개편을 요구합니다.
[17:30]
입력하는 선형적 문서 대신, GPT-5 Pro에게는
[17:36]
더 다차원적인 데이터 구조를 제공하는 것이 이상적입니다.
[17:40]
재무 분석을 한다면, 핵심 데이터 명세서를 입력하세요.
[17:44]
이것들은 사실, 지표, 계산입니다. 그리고
[17:48]
관점들을 입력하세요. 위험 렌즈가 여기 있어요.
[17:52]
뭐가 잘못될 수 있는지. 성장 렌즈가 여기 있어요.
[17:55]
이 공간의 기회는 무엇인지. 시장 포지셔닝과 함께
[17:58]
경쟁 렌즈가 여기 있어요. 그런 다음 교차 참조를 입력하세요.
[17:24]
상호 참조, 시간적 상호 참조,
[17:27]
시간에 따른 지표 변화,
[17:28]
관계형, 즉 부서들이 어떻게 상호작용하는지 말입니다.
[17:31]
기본적으로, 이를
[17:32]
다중 스레드 추론 에이전트에게 최대한 많은 맥락을
[17:37]
매우 구조화된 방식으로 제공하는 것으로 생각해야 합니다. 왜냐하면
[17:39]
각각의 병렬 스레드가
[17:41]
실행되기 위해 일관된 데이터 경로를 필요로 하기 때문입니다. 그래서 당신은
[17:43]
어떻게
[17:46]
어느 정도의 일관성을 유지해야 하는
[17:49]
추론 스레드들의 교향곡을 조율할지
[17:52]
생각해야 합니다. 흥미로운 점 중 하나는
[17:54]
응답 API가 스레드들 간에
[17:57]
사고의 연쇄 지속성을 어느 정도 유지할 수 있다는 것입니다. 그래서
[18:00]
만약 당신이 여러 번 시도를 한다면,
[18:02]
만약 당신이
[18:05]
맥락과 함께 문제에 대해 여러 각도로 접근한다면,
[18:06]
이런 다차원적인
[18:08]
데이터 아키텍처는 당신이
[18:10]
시간이 지나면서 쌓이는 관점들을
[18:12]
제공하기 시작할 수 있게 해줍니다.
[18:14]
여기서 제가 지적하고 싶은 것은
[18:16]
대부분의 조직들이
[18:18]
실제로 이를 수행할
[18:20]
인내심을 가지고 있지 않다는 것입니다. 그리고 만약 당신이
[18:22]
GPT-5 Pro를 최대한 활용하려고 한다면, 이것은
[18:24]
AI의 일관된 주제 중 하나를 강조합니다. 바로 우리가
[18:27]
AI가 제공하는 것을 활용하기 위해
[18:29]
변해야 한다는 것입니다.
[18:32]
우리의 데이터는
[18:34]
GPT-5 Pro와
[18:36]
다른 AI들이 제공하는 것을 활용하기 위해 변해야 합니다. 그리고 GPT-5
[18:39]
Pro는 병렬 추론 아키텍처로
[18:41]
이것을 정말로 강요합니다. 그렇다면
[18:43]
전략적 시사점은 무엇일까요?
[18:44]
GPT-5 Pro는 업계에
[18:46]
몇 가지 흥미로운 전략적
[18:50]
질문들을 제시한다고 주장하고 싶습니다. OpenAI의 경우,
[18:53]
그들이 추론 시간 컴퓨팅에 대해 혁신할 수 있고
[18:57]
특정 사용 사례에 대해 프리미엄 가격을
[19:00]
매길 수 있음을 증명했지만,
[19:02]
아직 이러한 사용 사례들을
[19:05]
더 일반적으로 확장할 수 있다는 것을 보여주지는 못했습니다.
[19:06]
저는 이 비디오에서
[19:08]
GPT-5 Pro를 사용하지 않는 곳에 대해
[19:10]
많이 이야기해야 했는데,
[19:13]
이것이 지시하는 바라고 생각합니다. Claude는 실제로
[19:16]
추론 시간 컴퓨팅
[19:18]
모델이 아닙니다. Claude 4.1, Opus 4.1은
[19:23]
도구를 사용합니다. 해석하지만,
[19:26]
제가 설명한 GPT-5와 같은
[19:28]
전통적인 추론 시간 컴퓨팅 모델은 아닙니다.
[19:30]
정말 흥미롭습니다. Anthropic은
[19:32]
도구 사용과 도구 호출에 매우 뛰어난 모델을 훈련시키는 것에
[19:35]
만족해 왔고,
[19:37]
훌륭한 결과와
[19:39]
특히 코딩 분야에서 그 선택에 대해 훌륭한 평가를
[19:42]
받고 있습니다. Anthropic이
[19:44]
그 길을 계속 가고 싶어할까요?
[19:46]
코딩이
[19:49]
기술 개발 궤도에 대해 장기적으로
[19:50]
그렇게 많은 설명력을 가지고 있다고 믿기 때문에
[19:53]
코딩 최적화를 계속하고 싶어할까요? 아니면
[19:55]
사고와 추론 모델에 투자하기 시작하고 싶어할까요? 그리고 만약
[19:57]
그렇다면, 그것이 코딩에 대한
[19:58]
핵심 가치 제안과
[20:00]
개성에 대한 핵심 가치 제안을
[20:02]
어떻게 강화할까요? 사람들이
[20:03]
Claude의 개성을 사랑하기 때문입니다.
[20:05]
그들이 그것을 잃을 위험을
[20:07]
감수하고 싶어할까요? 흥미로운
[20:08]
질문입니다. Google은
[20:11]
어떻게 모델에 도달할지 알아내야 합니다
[20:15]
채팅 인터페이스가 널리 사용되고
[20:19]
그들의 추론 능력을 어디에 적용할지
[20:22]
결정해야 합니다. 그들은
[20:25]
이미 추론 능력을 가지고 있고
[20:28]
학술 및 기술 분야에서 뛰어난
[20:30]
성과를 거두고 있습니다.
[20:32]
과학 연구, 단백질 접힘,
[20:34]
수학 올림피아드 등에서
[20:36]
수상 경력을 가지고 있죠.
[20:39]
기술적 노하우가 부족한 것도
[20:41]
아니고, 기술 아키텍처가
[20:43]
없는 것도 아닙니다.
[20:45]
트랜지움 칩을 기반으로 한
[20:46]
자체 아키텍처를 가지고 있지만
[20:50]
이러한 아키텍처 혁신을
[20:52]
어떻게 제품화할지 고민해야 합니다.
[20:55]
사람들이 구글을 찾는 독특한
[20:58]
제품 인터페이스를 만들기 위해서죠.
[21:00]
이것은 구글이 한동안
[21:02]
고심해온 문제입니다.
[21:05]
현재 구글을 찾는 이유는
[21:06]
이미 구글 클라우드를 사용하고 있거나
[21:09]
정말 저렴한 토큰 당 지능을
[21:11]
원할 때입니다. 이것만으로
[21:13]
장기적으로 전략적 우위나
[21:17]
시장 점유율을 유지할 수 있을까요?
[21:19]
이것은 의문이고, GPT-5 Pro가
[21:21]
이 문제를 더욱 부각시킨다고 생각합니다.
[21:23]
OpenAI가 기본적으로 말하는 것은
[21:25]
우리에게 확장 패러다임이 있다는 것입니다.
[21:27]
모델을 계속 더 똑똑하게 만들고
[21:28]
똑똑한 추론 모델에서 우리를
[21:30]
이겨보라고 도전하는 것이죠.
[21:32]
Anthropic은 코딩과 비추론 모델에서
[21:34]
자신만의 영역을 가지고 있고
[21:36]
구글은 지금 중간 정도에
[21:37]
있습니다. 우리는 아키텍처
[21:39]
전문화의 시대에 들어서고 있습니다.
[21:42]
다음 혁신은, 그리고 사람들이
[21:43]
더 큰 모델이라는 생각에서
[21:44]
벗어나야 한다고 생각합니다.
[21:46]
다음 혁신은 더 큰 모델이 아닐 수도 있습니다.
[21:48]
특정 인지 작업을 위해
[21:50]
추론 아키텍처를 어떻게 사용하느냐가
[21:52]
핵심일 수 있습니다. LLM 시대에 접어들면서
[21:55]
더 많은 전문화를 보게 될 수도 있습니다.
[21:57]
그것은 놀랍지 않을 것입니다. 그래서 제가
[21:59]
여러분께 남기고 싶은 말은 무엇일까요? 지능은
[22:03]
유용성과 같지 않다는 것입니다. GPT-5는
[22:05]
어떻게 측정하든 매우 지능적인 모델이지만
[22:07]
그 지능이 성공이나 실패를 결정하는 것은 아닙니다.
[22:10]
핵심은 지능과
[22:11]
유용성이 LLM 시대로 더 깊이
[22:13]
들어갈수록 분기하고 있다는 것을 이해하는 것입니다.
[22:16]
병렬 추론이 여러분이 수행하고 싶은
[22:18]
작업에서 AI를 더 똑똑하게 만드는지
[22:21]
알아내는 것은 여러분의 몫입니다.
[22:23]
저는 AI 계층화의 미래로
[22:25]
향하고 있다고 생각합니다.
[22:26]
매우 중요한 분석을 위한 깊은 추론 시스템이
[22:28]
있을 것입니다. 일상적인 상호작용을 위한
[22:30]
대화 시스템이 있을 것이고
[22:32]
특정 영역을 위한
[22:33]
전문 도구들이 있을 것입니다.
[22:36]
더 나은 하나의 모델이라는 꿈은 죽었다고 생각합니다.
[22:39]
그런 일은 일어나지 않을 것입니다.
[22:40]
아이러니하게도 모든 것에서 더 나은
[22:43]
하나의 모델을 약속했던 바로 그 GPT 세대에 의해
[22:46]
죽임을 당한 것입니다. GPT-5 Pro가
[22:48]
우리에게 보여주는 것은
[22:51]
실제로 더 나은 모델을 가지는 것이 가능하면서도
[22:53]
동시에 어떤 면에서는 이전 모델보다
[22:55]
더 나쁠 수도 있다는 것입니다.
[22:57]
모든 것을 지배하는 하나의 모델은 없을 것입니다.
[23:00]
그래서 여러분에게 중요한 질문은
[23:03]
GPT-5 Pro가 월 200달러의 가치가 있는지가 아니라
[23:06]
전문 도구나 깊은 추론 시스템
[23:10]
또는 대화형 시스템에 더 적합한
[23:12]
사용 사례를 정의할 수 있는지입니다.
[23:14]
만약 여러분이 대화 모델 사용자라면
[23:16]
월 200달러를 지불하지 마세요.
[23:18]
만약 여러분이 깊은 추론을 필요로 하는
[23:20]
사람이라면, 분석을 고려해야 하고
[23:21]
준비할 데이터가 있는지 생각해야 하며
[23:23]
그러면 GPT-5 Pro를
[23:24]
준비할 수 있을지도 모릅니다.
[23:26]
전문 도구만 사용하는 사람이라면
[23:29]
ChatGPT를 아예 사용하지 않을 수도
[23:31]
있습니다. 이것은 아키텍처
[23:34]
차별화가 점점 더 중요해질
[23:36]
새로운 AI 게임의 첫 번째 움직임입니다.
[23:37]
그래서 저는 이 비디오에서
[23:39]
아키텍처와 그 작동 방식
[23:41]
그리고 GPT-5 Pro가 왜 다른지
[23:43]
설명하는 데 많은 시간을 할애했습니다.
[23:45]
도움이 되었기를 바랍니다.
[23:47]
GPT-5 Pro를 어디에 사용할지
[23:49]
또는 사용할지 말지에 대한 감각을 얻으셨기를 바랍니다.