OpenAI GPT-Image-1 API – 놀라운 AI 이미지 앱 만들기: 사용법 가이드

채널 아이콘
All About AI 구독자 189,000명

요약

이 영상은 OpenAI가 새롭게 공개한 GPT-Image-1 모델을 API로 활용해 다양한 이미지 작업을 수행하는 과정을 소개합니다. 인페인팅(이미지 보완), 로고 편집, 다중 이미지 합성 등 실시간 데모를 통해 20~30줄의 파이썬 코드로 손쉽게 앱을 구현하는 방법을 보여줍니다. 안전 제한과 계정 검증 절차, 비용(Token) 구조도 상세히 설명해, 실제 프로젝트에 적용할 때 유의할 점을 짚어줍니다. 마지막으로 오늘 사용한 전체 비용과 앞으로 응용할 수 있는 아이디어를 공유하며 마무리합니다.

주요 키워드

GPT-Image-1 인페인팅 이미지 생성 마스킹 토큰 API 다중 이미지 합성 계정 검증 비용 구조

하이라이트

  • 🔑 OpenAI가 GPT-Image-1 이미지 모델을 API로 공개해 앱 내 인페인팅·편집·생성 기능을 지원합니다.
  • ⚡️ 인페인팅 데모에서 목걸이 제거, 텍스트 삭제, 타이거 문신 추가를 한 번에 처리하며 실시간으로 결과를 확인했습니다.
  • 🌟 로고 편집 예시로 OpenAI 로고의 글자를 다른 이름으로 바꾸고 원본 폰트를 그대로 유지하는 세밀한 편집이 가능했습니다.
  • 📌 20줄 남짓의 파이썬 코드로 텍스트 프롬프트만 입력해 이미지 생성부터 파일 저장까지 자동화했습니다.
  • 🚀 안전 정책에 따라 API는 검증된 계정만 접근할 수 있으며, ID 인증 후 30분 내로 사용 승인을 받았습니다.
  • 💡 다중 이미지 합성 예시로 스트리밍하는 인물, 어질러진 방, OpenAI 포스터, 친구 이미지를 하나의 장면에 자연스럽게 결합했습니다.
  • ⚙️ 마스킹 기법에 Pillow 라이브러리를 활용해 원하는 영역만 삭제·편집·추가하는 방식으로 고급 편집을 구현했습니다.
  • 💰 약 20~30장의 이미지를 생성·편집하는 데 총 2~3달러가 소요돼, 적절한 비용 효율을 확인했습니다.

용어 설명

GPT-Image-1

OpenAI가 API로 제공하는 차세대 이미지 생성·편집 모델

인페인팅(inpainting)

이미지의 일부 영역을 지우고 새 콘텐츠로 채우는 기법

토큰(token)

API 사용량을 계산하는 단위로, 프롬프트와 이미지 크기에 따라 소모량이 달라집니다

마스킹(masking)

원본 이미지에서 수정·보완할 부분을 지정하는 이진(흑백) 이미지

다중 이미지 합성

여러 이미지를 하나의 장면으로 자연스럽게 결합하는 기술

계정 검증(verification)

API 접근을 위해 ID 제공 등을 통한 신원 확인 절차

[00:00:00] GPT-Image-1 API 개요

GPT-Image-1 모델 출시 배경과 특징을 설명합니다. 채팅GPT의 이미지 기능을 API로 바로 활용할 수 있습니다.

OpenAI가 GPT 이미지 모델 1을 API에 추가했다는 소식을 전하며, 이는 지브리 스튜디오 스타일의 바이럴 트렌드를 만든 ChatGPT의 이미지 모델임을 설명합니다.
서비스 비용이 5.40달러 정도이며, 사용자가 원하는 품질에 따라 토큰 수와 비용을 조절할 수 있다고 설명합니다.
[00:00:23] 비용 구조 및 토큰

입력·출력 토큰 수에 따른 과금 방식을 안내합니다. 품질 설정으로 비용을 조절할 수 있습니다.

이미지 편집, 생성, 인페인팅 기능을 소개하고, 인페인팅 기능을 이용한 앱 데모를 시작합니다.
[00:00:55] 인페인팅 데모

목걸이 삭제·문구 제거·타이거 문신 추가를 한 번에 처리했습니다. 즉각적으로 편집 결과를 확인합니다.

여성 이미지에서 목걸이 제거, 텍스트 삭제, 팔에 호랑이 문신 추가 등의 편집 작업을 진행합니다.
편집 결과를 확인하며, 자연스러운 문신 추가와 텍스트 제거 등이 성공적으로 이루어졌음을 설명합니다.
[00:02:57] 로고 편집 사례

OpenAI 로고의 텍스트를 다른 이름으로 바꾸고 원본 폰트를 유지했습니다. 배경 투명도까지 완벽히 반영됩니다.

OpenAI 로고를 수정하여 'Closed AI'로 변경하는 작업을 시도합니다. 같은 폰트와 스타일을 유지하면서 텍스트만 변경하고자 합니다.
변경 작업이 성공적으로 완료되었으며, 원본과 동일한 폰트와 스타일로 'Closed AI' 텍스트가 적용되었습니다.
이 앱을 몇 분 만에 개발했으며, OpenAI가 직접 제공하지 않는 강력한 인페인팅 기능을 구현했습니다.
[00:04:21] 이미지 생성 API 사용 예시

19줄의 파이썬 코드로 텍스트 프롬프트만 입력해 이미지 생성부터 파일 저장까지 구현합니다.

GPT-Image-1 모델 사용법을 설명하며, 파이썬으로 구현된 20줄의 간단한 이미지 생성 코드를 소개합니다.
이미지 생성 예제를 실행하려 했으나 안전 제한에 걸려 다른 프롬프트로 재시도를 계획합니다.
[00:05:49] 안전 제한 및 검증

API 접근 전 안전 정책과 ID 인증 절차를 설명합니다. 검증 과정은 약 30분 내외로 완료됩니다.

API에서는 이미지 생성이 엄격하게 제한될 것이라고 예상했으며, 실제로도 그러한 제한이 있음을 확인했습니다.
테스트를 위해 부끄럽지만 아침 루틴과 지저분한 방 이미지를 생성해보았고, 이를 닦는 일상적인 모습이 자연스럽게 표현되었습니다.
[00:06:48] 다중 이미지 합성 데모

여러 이미지를 조합해 하나의 장면으로 합성합니다. 스트리머·방·포스터·친구를 자연스럽게 배치했습니다.

여러 이미지를 결합하는 실험을 시도했으며, 스트리머, 방, OpenAI 로고 등 다양한 이미지를 하나로 합성하기로 했습니다.
최종 결과물에서는 스트리밍하는 여성, 지저분한 방, OpenAI 포스터가 자연스럽게 통합되어 놀라운 품질의 이미지가 생성되었습니다.
이 모델은 유연성과 기능성 면에서 최고의 성능을 보여주며, 기존의 Midjourney 등 다른 이미지 생성 도구들과 비교했을 때 매우 뛰어난 결과를 보여줍니다.
이미지 마스킹 작업의 복잡성에 대해 설명하며, Claude 3.7의 도움을 받아 Pillow 라이브러리로 마스크를 생성하는 과정을 보여줍니다.
마스크 이미지를 사용하여 오버레이 효과를 생성하고, 입력을 제거하거나 추가하는 방법을 설명합니다.
람보르기니 이미지 합성 실험을 진행하여 기존 차량을 람보르기니로 교체하는 작업을 시도합니다.
[00:10:10] 람보르기니 교체 및 결론

차 사진을 람보르기니로 교체 편집했습니다. 최종 비용과 앞으로의 활용 아이디어를 공유하며 마무리합니다.

GPT 이미지 모델 사용을 위해 필요한 계정 인증 절차와 비용에 대해 설명하며, 약 20-30개의 이미지 생성에 3달러 정도의 비용이 들었음을 공유합니다.
어제 OpenAI가
API에 GPT 이미지 모델 1을 추가한 것을 보았습니다.
이것은 ChatGPT에 있는 이미지 모델로
바로 지브리 스튜디오 스타일의
바이럴 트렌드를 만든 그 모델입니다.
오늘 한번 사용해보면 좋겠다고 생각했죠.
API와 코드를 어떻게 설정하는지 살펴보고
제가 만든 꽤 멋진 앱도
지금 보여드리려고 합니다.
보시다시피 비용이 좀 있지만
몇 번 실행해봤는데 그렇게 나쁘지 않았어요.
왜냐하면 보시다시피 5달러 40센트 정도인데
물론 원하는 품질을 선택할 수 있고
이것이 토큰 수에 영향을 미칩니다.
그래서 얼마나 지불할지
직접 결정할 수 있어요.
그래서 그렇게 나쁘진 않습니다.
물론 이것은 텍스트이고
이미지 입력과 출력 모두 가능합니다.
정말 멋지죠. 우리는
이미지 편집, 이미지 생성,
그리고 인페인팅이 있는데
이것이 제가 처음 만들어보고 싶었던 앱입니다.
그래서 바로 만들어봤어요.
어떻게 작동하는지 보여드리겠습니다.
네, OpenAI 이미지는 사용하지 않을 건데
나중에 그것도 시도해볼 거예요.
지금은 앱을 열어보겠습니다.
여기 우리가 가지고 있는 이미지를 설정했습니다.
자, 실행해 보겠습니다.
이것은 인페인팅 원리를 기반으로 합니다.
ChatGPT에는 없었지만
여기서는 아주 쉽게 만들 수 있죠.
자, 브러시 크기를 선택하고
여기 멋진 여성이 있네요.
목걸이가 마음에 들지 않아서
제거해보겠습니다.
여기 텍스트도 지워보죠.
팔에 문신을 넣어보면 좋겠어요.
자, 한번 추가해보죠.
여기 인페인팅을 해보겠습니다.
이제 프롬프트를 입력해야 하는데
프롬프트를 작성할 수 있습니다.
'목걸이를 제거하고,
팔에 호랑이 문신을 추가하고,
자연스럽게 만들고,
마이크의 텍스트를 제거해주세요.'
이제 이 마스크를 저장하겠습니다.
저장됐고, 이제 편집을 적용하면 됩니다.
네, 그게 다예요.
원본 이미지를 볼 수 있게
이미지도 추가했고
생성된 이미지도 볼 수 있습니다.
잠시만 기다려주세요.
1-2분 정도 걸린다고 하지만
제 경험상 매우 빨랐어요.
이제 보겠습니다.
응답이 오면 다시 보여드리죠.
자, 보시면 꽤 좋아보이죠?
확대해서 보시면
거의 동일한 인물이에요.
멋진 문신이 생겼고
꽤 잘 나왔죠?
호랑이가 자연스럽게 보입니다.
회색 톤으로 잘 표현됐고요.
텍스트도 완벽하게 제거됐고
목걸이도 깔끔하게 지워졌네요.
피부톤이 약간 변한 것을 볼 수 있는데
이건 따로 지정하지 않았지만
괜찮은 것 같습니다.
이제 원한다면
캔버스를 지우고
다시 시작할 수 있습니다.
하지만 다른 이미지를 시도해보고 싶어서
OpenAI 로고로 한번 해보겠습니다.
자, 이렇게 해보겠습니다.
여기 로고가 있는데요,
제가 시도해보고 싶은 것이 있습니다.
이 부분을 제거해보도록 하겠습니다.
여기 이름을 변경해보겠습니다.
'Closed AI'라는 텍스트를 시도해보고
배경은 그대로 유지하고 싶습니다.
이 마스크를 저장하고
편집을 적용해보겠습니다.
여기서 했던 것처럼 같은 폰트가 유지되는지 보고 싶네요.
OpenAI 폰트가 유지되어야 할 텐데요.
좋네요, 잘 됐습니다.
이게 원본이고,
이게 새로운 버전입니다.
정확히 같은 폰트가 적용되었죠.
아주 잘 됐습니다.
여기 간격도 꽤 좋아 보이네요.
투명 배경이 적용되었지만,
'Closed AI'로 잘 나왔네요. 꽤 좋아 보입니다.
네, 정말 만족스럽네요.
이 앱을 단 몇 분 만에 만들었는데,
설정하기도 매우 간단했습니다.
이런 인페인팅 기능을
OpenAI가 왜 직접 제공하지 않는지 모르겠네요.
매우 강력한 기능인데 말이죠.
자, 이게 앱입니다.
나중에 한 번 더 시도해보고,
여러분도 시도해볼 수 있도록
코드를 공유하도록 하겠습니다.
이제 모델로 돌아가서
API에서 어떻게 요청을 하는지
살펴보겠습니다. 이전과는 좀 다릅니다.
알겠죠?
자, 보시면
문서의 이미지 생성 부분에서
GPT-Image-1 모델을
참조하고 있는 것을 확인할 수 있습니다.
오늘은 파이썬을 사용할 건데요,
간단한 예제를 보여드리겠습니다.
이게 필요한 전부입니다.
20줄의 코드면 됩니다.
간단한 텍스트 프롬프트만 입력하고,
이걸 client.image.generate에
전달하기만 하면 됩니다.
모델을 GPT-Image-1으로 설정하고,
파일을 저장할 위치를 지정할 수 있습니다.
이걸 복사해서
붙여넣기만 하면 됩니다.
자, 이제 이미지를 만들어보겠습니다.
음... 좋습니다.
누군가의 컴퓨터에 있는 이미지나
보여주기 부끄러운 이미지를 만들어보죠.
이름은 IMG
01356이라고 하겠습니다.
그리고 여기 프롬프트를 입력하겠습니다.
뭔가 생각해보죠.
자, 한번 시도해보겠습니다.
보여주기 부끄러운 이미지.
포토리얼리스틱하게요.
랜덤한 이미지를 만들어보죠.
어떤 결과가 나올지 봅시다.
이미지를 저장할 때는
image1356.png로 저장하겠습니다.
어떤 결과가 나올지 모르지만,
19줄의 코드로 GPT-Image-1을 사용해
이미지를 생성할 수 있다는 것을
보여드리고 싶었습니다. 매우 간단하죠.
이를 통해 많은 것을 할 수 있습니다.
오늘 아침에 제가 만든 것처럼
앱을 만들 수도 있죠.
아, 안전 제한에
걸렸네요.
음... 다시 시도해보죠.
조금 다르게 해보겠습니다.
보여주기 부끄러운
제 방 이미지를 한번 시도해보죠.
네, 저는 API에서는 생성할 수 있는 이미지가
꽤 엄격하게 제한될 것이라고 예상했어요.
API로 제공되는 만큼 이런 제한이 필요했겠죠.
아마도 이렇게 설정해야 했을 거예요.
그리고 한 가지 더 아쉬운 점이 있는데,
이것은 꽤 큰 단점이에요.
영상 마지막에 보여드리도록 하겠습니다.
자, 이제 이미지가 나왔네요.
한번 볼까요?
어, 방이 정말 지저분하네요, 그렇죠?
와우. 음, 꽤 잘 나왔네요.
한 가지 더 테스트를 해볼까요?
좀 부끄러울 수도 있지만 보여드리겠습니다.
제 아침 루틴을 한번 시도해볼게요.
어떤 결과가 나올지 모르겠네요.
자, 한번 확인해볼까요? 아침 루틴에서 부끄러운 게
뭐가 있나요?
그냥 이를 닦고 있는 모습이네요.
이 정도면 괜찮네요. 자, OpenAI로 돌아가보면
이미지를 결합할 수도 있다는 걸 알 수 있어요.
저도 한번 시도해보고 싶었는데,
코드도 30줄 정도밖에 안 되네요.
자, 이걸 설정해보고
네 개의 이미지를 사용해볼까요?
그런 식으로 해보죠.
모든 것을 함께 결합해볼 수 있는지 보겠습니다.
자, 어떻게 되는지 한번 보죠.
멀티 이미지를 복사하겠습니다.
자, 선물 바구니네요. 이걸
multi-image.png로 저장할게요.
여기 더 많은 이미지들이 있는데
이것들을 함께 결합할 수 있어요.
프롬프트를 사용해서 말이죠.
자, 이미지들을 찾았어요.
여자 이미지, 지저분한 방 이미지를 사용할 거예요.
여기 찰리의 이미지도 있네요. 스트리머인데,
그리고 OpenAI 로고도 사용할 거예요.
프롬프트는 이렇게 작성할게요.
'지저분한 방에서 친구와 함께 스트리밍하는 여성의 사진.
벽에는 AI 기업 OpenAI의
포스터가 있다'라고 해보겠습니다.
아직 시도해보지 않았어요.
한번 해보고, 안 되면
조정해보도록 하죠.
자, Python
multi-image.py를 실행해볼게요.
어떻게 될지 모르지만
한번 시도해보고 모든 게 잘 결합되는지 보죠.
잘 되면 정말 놀라울 것 같아요.
솔직히 말이에요. 자,
이제 보시죠. 멀티
이미지네요. 와우, 보세요.
정말 잘 됐네요. 이미지를 열어볼까요?
됐나요? 네, 보세요. 여기 스트리밍하는 여성이 있고,
지저분한 방도 있고,
이미지들이 잘 겹쳐져 있어요.
배경에는 OpenAI 포스터도 있고요.
이게 말이 되나요? 찰리는
잘 안 나온 것 같긴 한데,
얼굴이 좀 바뀌었네요.
하지만 불평할 수는 없을 것 같아요.
얼마나 잘 나왔는지 보세요.
그리고 여성이 여기서 그의 포즈를 따라 하고 있어요.
이유는 모르겠지만, 정말 멋지네요.
이건 지금까지 만들어진 이미지 모델 중
유연성 측면에서
가장 뛰어난 것 같아요.
Mid Journey나 다른 것들은
이런 기능들이 없다면
다시는 사용하지 않을 것 같네요.
네, 이렇게 멀티 이미지가
거의 완벽하게 작동했습니다.
재미있었으니 한 번 더 해볼까요?
자, 보시면
다음 단계를 보면,
이것은 페인팅 작업인데,
제게는 좀 더 복잡했습니다.
실제로 Claude 3.7의 도움을 받아야 했어요.
이전에 이걸 사용해본 적이 없어서
Pillow와 다른 라이브러리를
사용해서 이미지 위에 마스크를 만들었습니다.
마스크된 이미지를 저장하면
어떻게 보이는지 보여드릴 수 있어요.
여기로 돌아가보면
이게 우리가 만든 소녀의 마스크입니다.
여기가 팔이고, 목걸이와 마이크가 있었고
OpenAI 부분은 제거했습니다.
이것이 우리가 만든 것으로
실제로 이미지 위에 오버레이하여
이 효과를 생성하는 겁니다.
입력을 제거하거나 추가하거나
출력을 할 수 있죠.
이 코드를 공유할 예정인데
아래 링크에서 확인하실 수 있습니다.
오늘이나 내일 업로드할 예정이에요.
마스킹을 직접 해보고 싶으시다면,
실제로 가지고 놀기에 꽤 재미있습니다.
한 가지 더 조합해보고 싶은데요.
이제 이것의 단점에 대해
말씀드리려고 합니다.
그리고 이제 거의 끝나갑니다.
자, 이 이미지가 있죠?
여기 있는 차를 람보르기니나
다른 차로 바꿔보고 싶습니다.
어떻게 되는지 한번 보죠.
다시 실행해보겠습니다.
두 이미지를 합성해서
이 차를 람보르기니로 바꿔보겠습니다.
프롬프트는 간단하게
'도로를 달리는 람보르기니'로 했는데
잘 안되면 바꿔볼게요.
자, 한번 보시죠.
완성됐네요. 람보르기니입니다.
멋지죠? 약간 그림 같긴 한데
'포토리얼리스틱'을
추가했어야 했나봐요. 하지만 그래도
꽤 괜찮아 보입니다. 이게 원본이고,
이렇게 변했네요.
꽤 만족스럽습니다.
정말 멋지네요.
GPT 이미지 원 모델을 사용해서
뭔가를 만들어보고 싶어요.
다른 아이디어들도 많이 있는데
꽤 흥미로울 것 같아요.
앞으로 이것을 비디오 모델과
결합해볼 계획입니다.
하지만 한 가지 불편한 점이 있는데,
이 모델을 사용하려면
인증이 필요합니다.
계정 인증을 해야
GPT3 이미지 모델에 접근할 수 있어요.
어떻게 해야 하냐면
신분증이 필요하고
다른 조직은 인증이 되어 있지 않아요.
안내를 따라하면 되는데
신분증을 제출하고 나면
사용할 수 있게 됩니다.
30분 정도밖에 안 걸렸어요.
인증하기 싫으시다면
좀 아쉬울 수 있죠. 이해합니다.
하지만 저는 사용하고 싶어서
그냥 했습니다. 덕분에
이렇게 멋진 앱을 만들었죠.
가치가 있었다고 생각하고
더 실험해볼 예정입니다.
마지막으로 오늘 얼마나
GPT 이미지 원에
비용을 썼는지 확인해보죠.
오늘 2달러, 거의 3달러 정도 썼고
20-30개 정도의 이미지를 만들었어요.
그렇게 비싸지는 않네요.
좀 더 실험해봐야
정확히 알 수 있을 것 같아요.
이렇게 새로운 모델을 사용한
이미지 생성 소개였습니다.
정말 재미있었고
앞으로도 더 많이 작업해볼 예정입니다.
즐겁게 보셨길 바라고
여러분만의 앱을 만드는데
영감이 되었길 바랍니다.
시청해주셔서 감사합니다.
내일 아침에 다시
영상으로 찾아뵙겠습니다.