[00:00]
OpenAI가 GPT 4.5를 출시했습니다
[00:02]
어제 출시됐는데
[00:04]
이번에는 영상을 어떻게 만들어야 할지
[00:07]
좀 고민이 되네요. 왜냐하면
[00:09]
가격을 보면 GPT-3.5보다 34배나
[00:12]
더 비싸거든요
[00:15]
이 모델의 좋은 활용 사례를
[00:17]
찾기가 정말 어렵습니다
[00:20]
그래서 이 모델을 어디에 써야 할까요?
[00:22]
코딩에는 사용하지 않을 겁니다
[00:25]
그리고 STEM 관련 추론에도
[00:27]
사용하지 않을 것 같아요. GPT-3.5도 있고
[00:31]
Grok이나 Claude도 있으니까요
[00:34]
그리고 생성 AI 워크플로우에도
[00:36]
절대 사용하지 않을 겁니다
[00:39]
다시 말하지만 가격 때문이죠
[00:40]
너무 비쌀 것 같아서요
[00:43]
고민하다가 어떤 사람들이
[00:45]
창작 작업에 좋다고 하는 걸 봤고
[00:49]
제가 앞으로 만들 영상 시리즈를 위한
[00:51]
사업 계획을 만들어야 해서
[00:54]
이걸로 한번 테스트해보려고 합니다
[00:56]
그게 제가 유일하게
[00:58]
테스트해보고 싶은 부분이에요
[01:01]
사업 계획 프롬프트를 시도해보고
[01:03]
정말 좋은 결과가 나오는지
[01:06]
확인해보려고 합니다. 그것 말고는
[01:08]
판단하기가 좀 어렵네요
[01:10]
하루 만에 이 모델을 어디에
[01:12]
써야 할지 모르겠어요
[01:14]
좋은 아이디어 있으시면
[01:16]
댓글로 알려주세요. 가격이 문제인데
[01:19]
OpenAI가 말하길
[01:22]
이건 추론 모델이 아니라서
[01:24]
토큰 소비가 많지 않다고 했지만
[01:27]
그래도 이 가격으로는
[01:29]
큰 프로젝트에
[01:31]
사용하기 어려울 것 같아요
[01:33]
일부 사람들은 이 모델이
[01:36]
Claude나 다른 모델들이
[01:40]
학습 데이터를 만드는 데
[01:42]
GPT-4.5를 사용했다고 주장하는데
[01:45]
확실하진 않습니다
[01:49]
자, 이제
[01:51]
대시보드와 플레이그라운드를
[01:54]
살펴보면서
[01:57]
제 사업 계획 프롬프트를 테스트해보고
[02:00]
창의적인 작업도
[02:02]
몇 가지 시도해보겠습니다
[02:05]
코딩이나 추론
[02:06]
생성 AI 워크플로우는
[02:08]
시도하지 않을 거구요
[02:10]
제 예시를 보기 전에
[02:12]
블로그 포스트를 먼저 보면서
[02:14]
시스템 카드에서
[02:15]
몇 가지 중요한 내용을 살펴보겠습니다
[02:19]
자 이제
[02:20]
블로그 포스트에서
[02:22]
흥미로운 부분을 보시죠
[02:24]
시스템 카드를 보면
[02:26]
GPT-4.5가 채팅을 위한 최고의
[02:29]
최대 규모 모델이라고 합니다
[02:32]
흥미로운 점은 STEM이나
[02:34]
코딩을 위한 최고의 모델이 아니라
[02:36]
채팅용이라는 거죠. 초기 테스트 결과
[02:38]
GPT와의 상호작용이 더 자연스럽고
[02:40]
지식 기반이 넓어졌으며
[02:42]
의도 파악과 감정 지능이 향상되었고
[02:45]
글쓰기, 프로그래밍, 실용적인
[02:47]
문제 해결에 유용하다고 합니다
[02:51]
환각 현상도 줄었고
[02:53]
흥미로운 점은
[02:54]
통계를 보면 단순 QA에서
[02:57]
환각 발생률이 낮아졌다는 겁니다
[03:00]
환각이 덜 발생한다는 점이
[03:02]
어느 정도 좋은 진전이라고 생각합니다.
[03:04]
또한 GPT 4.5는 인간의 의도를 더 잘 이해하고
[03:06]
암시적인 단서와
[03:07]
기대사항을 더 섬세하게 해석한다고 합니다.
[03:10]
4.5는 응답하기 전에 깊이 생각하지 않는데,
[03:13]
이는 Claude-01과 같은
[03:14]
추론 모델과는 다른
[03:16]
특별한 강점을 가지고 있습니다.
[03:18]
Claude-01, Claude-03 mini와 비교했을 때
[03:21]
더 범용적이고 본질적으로 더 똑똑한 모델이라고
[03:23]
추론 능력 면에서 믿고 있습니다.
[03:26]
이들은 이제 추론 모델과
[03:28]
기본 모델을 구분하기 시작했는데,
[03:30]
앞으로 출시될 GPT-5에서도 보듯이
[03:33]
이 두 가지 유형의 모델을 확실히 구분하려 노력하고 있습니다.
[03:37]
만약 AI 안전성 분야를 지켜보셨다면,
[03:40]
Anthropic Apollo 연구팀이
[03:42]
4.5가 계획 추론 평가에서
[03:45]
Claude-01보다는 낮지만
[03:47]
4.0보다는 높은 점수를 받았다고 발표했습니다.
[03:50]
따라서 4.5의 계획 관련 위험이
[03:52]
Claude-01보다 낮다고 판단됩니다.
[03:55]
같은 맥락에서 화학 및 생물학적
[03:58]
위협 생성 점수는 중간 수준으로
[04:00]
최소한 '높음'은 아니라서 다행입니다.
[04:04]
설득력 측면에서도
[04:05]
중간 정도의 점수를 받았습니다.
[04:09]
4.5는 맥락적 설득력 평가에서
[04:11]
최첨단 성능을 보여주었습니다.
[04:14]
성공률을 비교해보면
[04:16]
4.5는 녹색 그래프에서
[04:18]
57%를 기록했고
[04:20]
사기꾼 모델은 8%를 기록했습니다.
[04:25]
이 보고서 부분을 Grok에 입력했더니
[04:28]
요약하자면 이것이 양날의 검이라고 합니다.
[04:31]
4.5의 설득력은 기술적 성과이지만
[04:33]
잘못된 사람의 손에 들어갔을 때
[04:35]
발생할 수 있는 잠재적 위험을
[04:37]
무시할 수 없다는 것입니다.
[04:39]
개발자들도 이를 인식하고 있어
[04:42]
공개 접근 방식을
[04:44]
실제 위험을 고려해 재검토하고 있습니다.
[04:48]
기술적으로는 긍정적 성과지만
[04:50]
누군가를 설득해 어리석은 일을 하게 만든다는
[04:53]
관점에서 보면 부정적입니다.
[04:55]
이 채널에서 우리가
[04:57]
관심을 갖는 것 중 하나는
[04:59]
에이전트 작업인데, 점수를 보면
[05:02]
오른쪽에 있는 4.5가
[05:05]
4.0보다 거의 나아지지 않았고
[05:08]
거의 동일한 수준입니다.
[05:11]
Claude Deep Research가 여기서
[05:14]
큰 도약을 보여주는 게 흥미롭네요.
[05:18]
다음 영상에서는
[05:19]
Deep Research를 사용해서
[05:21]
코딩 작업을 시도해볼 예정입니다.
[05:23]
흥미로울 것 같은데,
[05:25]
4.5는 에이전트 작업에는 사용하지 않을 것 같습니다.
[05:28]
도입부에서 언급했듯이
[05:30]
가격 때문이기도 하고
[05:32]
매우 비쌀 것으로 예상되기 때문입니다.
[05:35]
제가 정말 좋아하는 벤치마크는
[05:38]
S Lancer인데, 이는 Upwork의
[05:40]
실제 작업들을 테스트하는 것입니다.
[05:43]
실제 사례를 다루는 벤치마크죠.
[05:46]
이게 제가 가장 좋아하는 벤치마크 중 하나입니다.
[05:49]
Upwork 작업에서
[05:51]
최대한 많은 수익을 내는 것을 목표로 하는데
[05:54]
여기서도 Deep Research가
[05:57]
꽤 좋은 성과를 보여주고 있습니다.
[05:59]
논문에서 Claude 3.5가
[06:02]
이 벤치마크에서 매우 잘 수행했던 것으로 기억하는데
[06:05]
오른쪽의 4.5를 보면
[06:09]
Claude-01과 비슷하고 4.0과도 거의 비슷한 수준으로
[06:13]
큰 향상은 보이지 않습니다.
[06:17]
이 작업은 4.5로도
[06:20]
시도해보지 않을 것 같은데, 그들의
[06:23]
결론에 따르면 GPT 4.5는 주목할 만한
[06:25]
기능과 안전성 향상을 가져왔지만
[06:28]
동시에 특정 위험도 증가했다고 합니다.
[06:31]
그들은 내부 및 외부
[06:34]
평가를 수행했고, 전반적으로 4.5는
[06:37]
적절한 안전장치가 있다면
[06:39]
중간 정도의 위험도로 평가되었습니다.
[06:41]
우리는 실제 세계에서의
[06:43]
반복적인 배포가 이해관계자들과
[06:45]
AI 안전성을 촉진하는 최선의 방법이라 믿습니다.
[06:47]
기본적으로 그들은
[06:48]
이러한 모델들을 계속해서 공개하여
[06:51]
테스트하고 이 모델들이
[06:53]
안전한지 아닌지 더 잘 이해하려고 합니다.
[06:55]
아직도 중간 정도의 위험이 있다는 게
[06:57]
흥미롭네요. 그리고
[06:59]
4.5에 대해 더 이상 할 말은 없을 것 같고
[07:00]
이제 제가 준비한 예시로 넘어가보겠습니다.
[07:04]
4.5를 사용해서 사업 계획을
[07:07]
만들어보고 싶은데, Chat GPT Pro
[07:10]
구독권이 없어서
[07:12]
플레이그라운드로 가서
[07:13]
API를 활용해보도록 하겠습니다.
[07:15]
여기 GPT 4.5 프리뷰를 보면
[07:18]
네, 프리뷰를 클릭하고
[07:21]
온도를 0.5 정도로
[07:23]
낮추고, 최대 토큰 수를
[07:25]
좀 늘려보겠습니다.
[07:28]
기본적으로 API를 통해 실행할 건데
[07:30]
Pro 구독을 하지 않을 거라서
[07:33]
그렇습니다.
[07:34]
지금 시점에서는 제게
[07:36]
가치가 크지 않다고 생각해서요.
[07:39]
네, 제가 말씀드렸듯이 특별한 아이디어는 없지만
[07:44]
새로운 유튜브 시리즈를
[07:46]
준비하고 있습니다.
[07:48]
AI를 활용해서 처음부터
[07:50]
사업을 만들어가는 과정을 다룰 예정입니다.
[07:53]
이 프롬프트를
[07:55]
한동안 작업해왔는데
[07:56]
자세한 내용은 생략하고,
[07:59]
제가 할 수 있는 것들에 대한
[08:02]
많은 정보를 입력했고, 여기 제 계획이
[08:05]
있습니다. 제가 하고 싶은 것과
[08:08]
현명하다고 생각되는 것들이죠.
[08:11]
노르웨이 기업들에 대한 아웃리치를 통해
[08:15]
더 많은 노출을 얻고 싶습니다.
[08:17]
노르웨이 전역에서 직원들을 대상으로
[08:21]
강연, 웨비나, 워크숍을 진행하는 것이
[08:23]
제 아이디어입니다. 여기에
[08:26]
LLM이 도움을 줄 수 있는 작업들을
[08:29]
정리했습니다. LLM과 AI 도구들을
[08:33]
활용하고 싶고, 짧은 시간 안에
[08:35]
이 AI 모델들을 활용해서
[08:37]
진행하고 싶습니다. 계획에는
[08:40]
LLM과 AI 도구들을 어떻게 활용할지,
[08:42]
하루 안에 또는 더 빠르게 대부분의 작업을
[08:45]
AI로 처리하는 방법이 포함되어야 하며,
[08:48]
비즈니스를 빠르게 시작하기 위한
[08:50]
상세한 단계별 실행 계획이 필요합니다.
[08:53]
시스템 메시지나
[08:55]
구조화된 출력은 사용하지 않고
[08:57]
4.5 모델로만
[08:58]
실행해볼 건데요, 이건 매우
[09:01]
큰 모델이라서 그들이 말하는
[09:03]
많은 지능을 가지고 있어야 하지만
[09:08]
가격대비 똑똑한지는
[09:10]
잘 모르겠네요. 한번 실행해서
[09:13]
어떤 결과가 나오는지 보겠습니다.
[09:16]
자, 결과를 볼까요.
[09:18]
3일 계획이 나왔네요. 괜찮습니다.
[09:21]
첫 번째 단계부터 보면
[09:23]
첫 번째 단계로 우리가 해야 할 것은
[09:26]
강력한 마케팅
[09:28]
자료를 준비하는 것입니다.
[09:30]
우리는 먼저 컨텍스트를 수집해야 합니다.
[09:32]
기본적으로 제가 하는 일과 AI 기반
[09:35]
카피라이팅에 대한 모든 것을 통해
[09:37]
LinkedIn 아웃리치 이메일에 필요한 모든 카피를 작성할 겁니다.
[09:40]
그렇죠, 좋습니다. 온라인 프로필도
[09:44]
업데이트하고 랜딩 페이지도 만들고
[09:46]
LinkedIn 타겟 아웃리치 리스트도 만들어야 합니다.
[09:50]
제가 마음에 드는 점은
[09:52]
노르웨이 기업들을 제안했다는 것인데
[09:54]
사실 꽤 괜찮은 것 같네요. 파워풀한
[09:57]
아웃리치 이메일을 작성하고
[09:59]
미디어 노출, 강연 기회,
[10:02]
대면 워크숍에 대해 문의하고
[10:04]
대규모 아웃리치 이메일을 보내서 많은
[10:07]
기업들을 찾아야 합니다. 기존
[10:10]
LinkedIn 네트워크를 활용하는 것도 좋죠.
[10:13]
조금 일반적이긴 하지만, 후속 이메일
[10:16]
시퀀스와 빠른 성과를 위해 직접 이메일을 보내고
[10:20]
금융 신문사와 일부 기자들에게
[10:23]
스토리를 제안하고 독점 인터뷰나
[10:26]
특집 기사를 제안합니다. AI 전문가로서
[10:29]
구독자
[10:31]
15만 명을 보유한
[10:32]
전문가라는 점을 강조하면 좋겠네요.
[10:36]
음, 그리고 우리는 일별
[10:38]
계획도
[10:39]
있네요. 다른 LLM들에서도 많이 본 것 같은데
[10:42]
다른 것을 시도해볼까요?
[10:44]
아웃리치 이메일을 한번 작성해보고
[10:47]
제가 어떻게 생각하는지 확인해보죠.
[10:50]
컨텍스트를 수집해서
[10:53]
아웃리치 이메일을 작성해볼까요.
[10:56]
제 아이디어를 제안하는 이메일을 써봅시다.
[10:58]
자연스럽고 효과적인 아웃리치 이메일,
[11:00]
흥미롭게 들리도록 만들어보죠.
[11:01]
강연 제안과 함께 직원들의
[11:04]
AI 역량 강화를 위한 협력을 제안하고
[11:06]
제 배경과 경험을 언급하되
[11:09]
짧고 흥미롭게 읽을 수 있도록
[11:11]
만들어보죠. 제가 보고 싶지 않은 건
[11:13]
너무 일반적인 내용입니다.
[11:16]
그런 내용이 나오면 쓸모없다고 판단할 겁니다.
[11:21]
너무 일반적이면
[11:23]
의미가 없으니 temperature를
[11:25]
좀 올려보고 토큰 수는
[11:27]
4K로 줄여보죠. 제목이
[11:31]
'AI 업스킬링: 잠재적 협력 제안'이네요.
[11:34]
노르웨이 기반 AI 교육자로서
[11:36]
기업들이 AI 도구를 실용적으로 적용하여
[11:38]
생산성을 향상시키고 일상 업무를
[11:40]
간소화하도록 돕고 있습니다. 워크숍과
[11:42]
웨비나, 기업 교육을 제공하고 있죠.
[11:46]
좋네요. 협력할
[11:47]
기회를 모색하고 싶습니다.
[11:49]
맞춤형 강연이나 워크숍, 웨비나를 통한
[11:51]
역량 강화 이니셔티브에 대해 제 작업을
[11:54]
여기서 더 자세히 보실 수 있습니다.
[11:57]
앞으로 며칠 내에 짧은 통화로
[11:58]
이에 대해 더 논의해보시겠습니까?
[12:01]
좋습니다. 마음에 드네요.
[12:02]
꽤 괜찮은 것 같아요.
[12:05]
좋은 아웃리치 메일이에요.
[12:08]
너무 길지 않고 핵심을 잘 짚었으며
[12:11]
레퍼런스도 포함되어 있어서
[12:14]
좋은 것 같네요.
[12:17]
괜찮아 보이네요.
[12:20]
4.5로 아웃리치 이메일 작성하는 것에 대해 긍정적입니다만
[12:24]
아직 다른 모델과
[12:26]
비교해보진 않았기 때문에
[12:28]
제 주관적인 평가일 뿐이에요. 하지만 느낌상
[12:31]
꽤 괜찮은 것 같네요.
[12:34]
앞으로 진행할 시리즈에서
[12:36]
4.5를 이런 용도로 사용해볼 것 같아요.
[12:39]
현재로서는 더 이상
[12:41]
테스트해보고 싶은 것이 없네요.
[12:43]
코딩이나 추론, 복잡한 워크플로우는
[12:46]
하지 않을 거니까요.
[12:48]
이것에 대해 좀 더
[12:49]
생각해봐야 할 것 같고
[12:52]
나중에 다시 돌아와서
[12:54]
다른 영상을 찍어볼 수 있겠죠.
[12:55]
아마도 앞으로의 비즈니스 시리즈에
[12:57]
4.5를 포함시켜볼 수 있을 것 같네요.
[13:01]
그 외에는 특별히 할 말이 없는데
[13:05]
비용이 매우 비싸다는 것과
[13:07]
성능은 좋지만
[13:10]
이 가격이 정당화될 수 있는지는
[13:13]
아직 판단하기 이르네요.
[13:15]
좀 더 지켜봐야 할 것 같아요.
[13:18]
댓글로 여러분의 생각을 알려주세요.
[13:19]
이 모델을 사용하실 건가요?
[13:21]
아직 Plus 사용자들은 이용할 수 없는 것
[13:23]
같아요. 저도 없거든요.
[13:25]
Pro 버전으로 먼저 나오고
[13:27]
나중에 Plus에 추가될 것 같아요.
[13:29]
앞으로 어떻게 발전할지
[13:31]
지켜보고 나중에 다시
[13:33]
다뤄보도록 하죠. 시청해주셔서 감사합니다.
[13:36]
가장 심도있는 영상은 아니었지만
[13:39]
유익한 부분들이 있었길 바랍니다.
[13:41]
곧 다시 만나요.
[13:43]
안녕히 계세요.