GPT-4o의 대담한 업그레이드: 코딩, 이미지, 미친 모드?

Prompt Engineering 구독자 190,000명

요약

이 영상은 GPT-4o의 최신 업데이트에 대해 상세히 소개하며, 모델의 코딩 능력, 이미지 생성, 그리고 ‘unhinged mode’와 같은 자유로운 응답 모드의 도입을 중심으로 설명합니다. 영상에서는 특히 JavaScript를 활용한 애니메이션, TV 채널 전환, SVG 및 랜딩 페이지 제작 등 다양한 코딩 테스트를 진행하며 Gemini 2.5, Claude 등 타 모델과의 성능 비교도 진행합니다. 또한, 철학적 문제와 창의적 사고를 자극하는 trolley 문제, 슈뢰딩거의 고양이 실험 등을 통해 모델의 직관과 윤리적 판단 능력도 살펴봅니다. 전반적으로 업데이트된 GPT-4o가 기술적 문제 해결뿐 아니라 창의적인 응답에서도 발전된 모습을 보여준다는 점이 주요 메시지입니다.

주요 키워드

GPT-4o 업데이트 코딩 unhinged mode 이미지 생성 JavaScript SVG 랜딩 페이지 토큰 철학적 문제

하이라이트

🔥 GPT-4o 업데이트는 'unhinged mode'를 도입하며, 필터가 완화되어 보다 직설적이고 자유로운 표현이 가능해졌습니다.
🛠️ 향상된 코딩 성능이 두드러지며, 복잡한 애니메이션과 인터랙티브 기능들을 구현하는 테스트가 진행되었습니다.
🚀 TV 채널 전환, 낙하하는 문자 애니메이션 등 다양한 코딩 프롬프트를 통해 다른 모델과 비교 시 GPT-4o의 효율성이 확인되었습니다.
🎨 이미지 생성 및 SVG 코드 테스트에서 모델이 창의적인 시각적 결과물을 도출하는 모습을 볼 수 있습니다.
🤖 Gemini 2.5, Claude 등 다른 LLM과의 비교를 통해 GPT-4o의 개선된 토큰 처리와 긴 컨텍스트 유지 능력이 강조됩니다.
💡 철학적 문제(트롤리 딜레마, 슈뢰딩거의 고양이)를 활용하여 모델의 직관과 윤리적 판단, 그리고 창의적 사고를 시험합니다.
⚙️ 코드 오류 수정 및 디버깅 과정에서 GPT-4o가 반복적인 피드백을 통해 개선된 결과를 보여줍니다.

용어 설명

Unhinged mode

자유로운 언어 사용과 제한이 적은 응답을 생성하도록 한 모드로, 보다 창의적이고 때로는 직설적인 표현을 이끌어냅니다.

Canvas

HTML5에서 그래픽을 그리기 위한 영역으로, 애니메이션이나 시각적 인터랙션 구현 시 활용됩니다.

Token

대규모 언어 모델(LLM)에서 텍스트를 처리하는 가장 작은 단위로, 모델의 컨텍스트 처리 능력과 직접 연결됩니다.

p5.js

JavaScript 기반의 크리에이티브 코딩 라이브러리로, 인터랙티브 아트와 애니메이션 제작에 널리 사용됩니다.

[00:00:00] 업데이트 개요 및 기능 소개

영상은 GPT-4o의 최신 업데이트와 함께 unhinged mode 도입, 코딩 및 이미지 생성에서의 향상된 성능을 설명합니다. 모델이 채팅 리더보드에서 급격한 순위 상승을 이루며, 새로운 자유로운 표현 방식을 특징으로 합니다.

[00:00] GPT-4가 대대적인 업데이트를 했으며, 특히 코딩 지시사항 수행과 자유도가 크게 향상되었다는 소식이 전해졌습니다.

[00:16] '언힌지 모드'라는 새로운 기능이 추가되었고, Grock에서 영감을 받은 이 모드는 기존의 제약에서 벗어난 더 자유로운 표현이 가능합니다.

[00:28] 챗봇 아레나 리더보드에서 4-5위에서 2위로 큰 성능 향상을 보여주었으며, Gemini 2.5 Pro에 이어 두 번째로 좋은 모델이 되었습니다.

[00:47] 필터링이 완화되어 더 자유로운 표현이 가능해졌으며, 이는 텍스트 생성뿐만 아니라 이미지 생성에도 적용되었습니다.

[01:07] 코딩 능력이 크게 향상되었다는 OpenAI의 발표에 따라, 실제 테스트를 통해 성능을 확인하기로 했습니다.

[01:53] 첫 번째 테스트로 물리 효과가 적용된 낙하하는 글자 애니메이션을 자바스크립트로 구현하는 과제를 진행했습니다.

[02:51] 테스트 결과, GPT-4는 초록색 박스를 사용하여 물리 엔진 기반의 matter.body로 글자를 표현하는 방식을 채택했습니다.

[00:03:00] 코딩 테스트 및 디버깅 과정

JavaScript를 활용한 낙하하는 문자 애니메이션, TV 채널 전환 프롬프트 등 다양한 코딩 테스트가 진행됩니다. 발생한 코드 오류와 디버깅 과정을 통해 GPT-4o가 점진적으로 수정 및 개선되는 모습을 보여줍니다.

[03:19] GPT-4가 생성한 코드의 초록색 사각형 문제를 해결하고, 글자들이 떨어지는 물리 효과와 충돌 감지가 정상적으로 작동하는 것을 확인했습니다.

[04:01] TV 채널 변경 기능을 구현하는 새로운 과제를 시작했습니다. 0-9까지의 숫자 키로 채널을 변경하고, 각 채널마다 고유한 애니메이션과 콘텐츠를 보여주는 것이 목표입니다.

[05:07] Gemini는 571줄의 코드로 실제 작동하는 TV 채널 변경 기능을 구현했으며, 각 채널은 실제 TV 채널에서 영감을 받은 고유한 콘텐츠를 보여줍니다.

[05:59] GPT-4는 200줄 정도의 더 짧은 코드를 생성했지만, 키 입력에 반응하지 않고 여러 에러가 발생하는 등 제대로 작동하지 않았습니다.

[07:01] 코드 오류를 수정하기 위해 재시도하면서, 에러 대신 실수로 코드를 복사했지만 일부 기능이 개선되었습니다.

[07:27] 채널 구현이 시작되어 첫 번째 채널 '튠 블리츠'가 정상 작동하고, 일부 채널들은 색상 문제로 보이지 않는 상황입니다.

[08:06] 제미니 2.5 프로보다 적은 코드 라인으로 구현했으나, 여러 번의 시도가 필요했습니다.

[08:17] API 사용 관련 정보를 공유하며, GPT4나 latest 이름으로 현재 모델을 사용할 수 있다고 설명합니다.

[08:56] 모델의 공간 추론 능력을 테스트하기 위해 자전거 타는 펠리컨 SVG 생성을 요청했습니다.

[00:09:00] 이미지 생성 및 인터페이스 구현

SVG 생성, 랜딩 페이지 제작 등 시각적 인터페이스에 대한 테스트가 이루어집니다. 짧은 코드와 다양한 디자인 접근법을 통해 모델의 창의성과 직관적인 디자인 감각을 평가합니다.

[09:25] 클로드는 토큰 제한으로 인해 완전한 코드 생성에 실패했으며, 곧 출시될 50만 토큰 컨텍스트 윈도우 버전에 대해 언급했습니다.

[10:03] GPT40이 생성한 펠리컨 SVG는 몇 가지 누락된 부분이 있지만 전반적으로 괜찮은 결과를 보여주었습니다.

[10:26] 단일 HTML 파일로 랜딩 페이지를 생성하려 했으나 일부 문제가 발생했습니다. 이를 통해 AI 모델이 현대적인 랜딩 페이지를 어떻게 이해하고 있는지 파악할 수 있었습니다.

[10:40] AI 모델들이 생성하는 랜딩 페이지들은 대체로 비슷한 구조를 가지며, 주로 전형적인 SaaS 랜딩 페이지의 형태를 따르고 있습니다.

[11:05] Claude가 생성한 코드는 약 1000줄로 길지만 일부 함수가 누락되어 제대로 작동하지 않았습니다.

[11:44] GPT-4가 생성한 랜딩 페이지는 매우 미니멀한 구성을 보여주었으며, 더 많은 컨텍스트가 필요해 보입니다.

[12:19] DeepSeek V3는 같은 프롬프트로 더 풍부한 콘텐츠와 시각적으로 뛰어난 완성도의 랜딩 페이지를 생성했습니다.

[13:10] Claude의 제한적인 결과는 토큰 제한(일반 모드 8,000, 확장 모드 64,000) 때문이며, 현재 버전 변경에 대한 불확실성이 있습니다.

[13:44] 회전하는 육각형과 튕기는 공을 구현하는 바이럴 프롬프트 테스트를 진행. 코드 생성 및 실행 결과가 예상보다 안정적이었습니다.

[14:24] 장시간 테스트에서도 물리 법칙이 안정적으로 유지되며, 이전 LLM들과 달리 공이 육각형 밖으로 이탈하지 않았습니다.

[15:03] GPT-4의 새로운 기능 중 향상된 직관력과 창의성을 테스트하기 위해 수정된 트롤리 문제를 시도했습니다.

[00:15:20] 창의력과 철학적 질문 테스트

트롤리 딜레마와 슈뢰딩거의 고양이 같은 철학적 문제를 통해, 모델의 윤리적 판단과 직관적인 사고 능력이 시험됩니다. 동시에 이 과정에서 이모지 사용과 말투 변화 등을 관찰하며, GPT-4o의 전반적 업그레이드를 종합적으로 평가합니다.

[15:31] AI의 응답 톤이 변화했으며, 더 깊은 윤리적 추론과 세부사항 파악 능력을 보여주었습니다.

[16:31] 트롤리 문제의 숨겨진 세부사항(이미 죽은 사람들)을 정확히 파악하고, 윤리적 판단을 논리적으로 제시했습니다.

[17:08] 슈뢰딩거의 고양이 실험 변형에 대한 AI의 반응을 설명합니다. AI는 이미 죽은 고양이를 사용한 실험의 특성을 정확히 이해하고, 확률이 0이 된다는 논리적 결론을 도출했습니다.

[17:46] AI의 대화 스타일 변화를 분석합니다. 특히 이모지 사용 증가와 Claude와 유사한 대화 톤으로의 변화를 지적합니다.

[18:08] OpenAI의 이미지 생성 기능 변화를 설명합니다. 더 유연해진 기능과 함께 여전히 존재하는 안전 규칙에 대해 논의합니다.