7개의 MCP 서버와 Cloud Code로 유튜브 채널을 운영할 수 있을까?

채널 아이콘
All About AI 구독자 189,000명

요약

이 영상은 터미널과 Cloud Code만으로 스크립트 작성, 음성 합성, 이미지·비디오 클립 제작, 배경 음악·썸네일 생성, 최종 합성과 업로드까지 유튜브 콘텐츠를 완전 자동화하는 과정을 보여준다. 화자는 7개의 커스텀 MCP 서버를 구축해 다양한 AI 모델(LLM, 11Labs TTS, GPT 이미지, Cling 영상 생성, Sonato AI 등)을 통합하며 효율적인 워크플로우를 설계했다. 과정을 통해 프롬프트 설계와 모달리티 간 연계를 실습하며 얻은 노하우를 단계별로 공유해 실제 프로젝트에 적용할 수 있는 팁을 제공한다. 이를 통해 AI 기반 비디오 제작의 가능성을 실감하고 도전 의식을 고취한다.

주요 키워드

MCP 서버 Cloud Code 프롬프트 엔지니어링 11Labs TTS 이미지 생성 비디오 생성 Sonato AI ffmpeg YouTube API LLM

하이라이트

  • 🔑 터미널만으로 스크립트 작성부터 업로드까지 유튜브 영상을 자동 생성하는 완전한 워크플로우를 제시한다.
  • 🚀 7개의 커스텀 MCP 서버(11Labs, GPT 이미지, Cling 영상 생성, Sonato AI 등)를 구성해 멀티모달 AI 툴을 통합했다.
  • 📜 LLM(Cloud Code 내장 모델)을 활용해 주제 기반 스크립트를 자동 생성하고 파일로 저장했다.
  • 🎙️ 11Labs TTS 서버로 작성된 스크립트를 MP3 음성 파일로 변환해 보이스오버를 완성했다.
  • 🎨 GPT 이미지 서버를 통해 각 장면에 맞춘 고퀄리티 이미지를 제작해 영상 입력 자료로 활용했다.
  • 🎬 Cling Pro 기반 비디오 생성 서버로 이미지 간 전환 클립을 만들고, 적절한 길이로 리파인했다.
  • 🎵 Sonato AI 음악 생성 서버로 미니멀한 로파이 배경음악을 제작해 몰입감을 높였다.
  • 🖼️ GPT 이미지 생성으로 시각적 임팩트가 강한 썸네일을 자동 디자인하고 텍스트 위치를 CSS처럼 세밀하게 조정했다.
  • 🔧 ffmpeg 명령어로 영상 클립, 보이스오버, 배경음악을 순차적으로 합성해 최종 비디오 완성본을 만들었다.
  • 📤 YouTube MCP 서버(GCP API)를 통해 업로드, 제목·태그 설정, 썸네일 등록까지 터미널에서 한 번에 처리했다.

용어 설명

MCP 서버

명령줄에서 AI API를 손쉽게 호출하도록 도와주는 커스텀 클라이언트 프록시 서버

Cloud Code

터미널 기반으로 AI 모델과 상호작용할 수 있게 해주는 클라이언트 툴

LLM(대규모 언어 모델)

프롬프트 기반으로 자연어 텍스트를 생성·분석하는 AI 모델

11Labs TTS

스크립트를 MP3 음성으로 변환하는 텍스트-투-스피치(음성합성) 서비스

GPT1 이미지

프롬프트로 고퀄리티 이미지를 생성하는 OpenAI 이미지 모델

Cling video generator

이미지 간 전환을 바탕으로 자동으로 비디오 클립을 생성하는 AI 모델

Sonato AI

로파이·배경 음악을 AI로 제작해주는 음악 생성 서비스

ffmpeg

동영상 클립 병합, 오디오 레이어링 등을 처리하는 오픈소스 명령줄 툴

YouTube API (GCP API)

구글 클라우드 플랫폼을 통해 유튜브 채널 관리·업로드를 자동화하는 API

[00:00:00] 프로젝트 개요 및 목표

터미널만으로 유튜브 채널을 운영하기 위한 전체 흐름을 소개한다. Cloud Code와 MCP 서버를 활용해 영상 생성부터 업로드까지 자동화하겠다는 목표를 설명한다.

MCP 서버들을 소개하며 프로젝트 시작. 터미널과 클라우드 코드만으로 유튜브 채널을 운영하는 대규모 MCP 프로젝트를 진행한다고 설명합니다.
[00:00:28] MCP 서버 구성 및 역할

11Labs TTS, Brave, Fetch, Gemini, GitHub 글로벌 서버, GPT 이미지, Cling 영상 생성, Sonato AI 음악, YouTube API 등 총 7개의 커스텀 MCP 서버 목록과 각 서버의 역할을 설명한다.

프로젝트 실현을 위한 논리적 계획의 중요성을 강조. 작업 순서, 프롬프트, 컨텍스트 관리 등을 고려했고 프로젝트를 통해 많은 것을 배웠다고 공유합니다.
실제 MCP 서버들을 시연. 11랩, 브레이브, 지미니, 깃허브, GPT-1 이미지, 클링 비디오 제너레이터, 뮤직 서버, 유튜브 서버 등을 소개하며 각각의 기능을 설명합니다.
커스텀 MCP 서버 개발의 가치를 언급. 이런 작업이 좋은 연습이 되며 매번 새로운 것을 배운다고 강조하고, 깃허브 공유 계획도 밝힙니다.
[00:02:35] 스크립트 작성과 프롬프트 엔지니어링

주제(‘이상한 아침 의식이 나를 멈출 수 없게 만들었다’)에 맞춰 LLM 프롬프트를 설계하고, Cloud Code 내장 모델로 스크립트를 생성해 텍스트 파일로 저장한다.

프로젝트 시작 단계 설명. 먼저 스크립트가 필요하다고 하며, A1 LS를 사용한 보이스오버 제작을 위한 준비 단계임을 설명합니다.
비디오 제작을 위한 첫 번째 단계로 아이디어 구상과 기본 계획을 세우고 있습니다. 최대 2분 길이의 YouTube 비디오를 만들 예정이며, 장면 제작을 위한 스크립트가 필요하다고 설명합니다.
MCP 서버 대신 Claude 3.7을 사용하여 YouTube 비디오 제작을 시작합니다. '이상한 아침 루틴이 나를 막을 수 없게 만들었다'는 주제로 1인칭 개인 이야기를 담은 보이스오버 스크립트를 작성하라고 지시합니다.
Gemini로 생성된 '얼음물 명상' 스크립트 결과를 확인합니다. 3분 동안 얼음물에 얼굴을 담그는 이상한 내용이지만 괜찮다고 판단하고, scripts 폴더에 water ritual.txt로 저장합니다.
11Labs MCP 도구를 사용하여 텍스트 스크립트를 음성 MP3로 변환하는 작업을 진행합니다. Soie Drake 음성을 선택하고, 스크립트와 음성 ID를 입력하여 보이스오버 파일을 생성하고 음성 폴더에 저장합니다.
[00:04:53] 보이스오버 생성(11Labs TTS)

bash 명령어와 MCP 툴을 활용해 생성된 스크립트를 11Labs TTS 서버로 전송, 원하는 목소리를 선택해 MP3 음성 파일로 변환해 확인한다.

120초 길이의 보이스오버가 성공적으로 생성되었고, 생성된 음성을 확인해봅니다. '모든 것이 바뀐 그날을 기억해요. 6개월 전 저는 항상 지쳐 있었고 매일 아침 다섯 번씩 알람을 미뤘어요'라는 내용으로 시작하는 것을 확인합니다.
문밖으로 급하게 뛰쳐나가며 간신히 커피 한 잔 챙길 시간밖에 없던 일상에서, 이제 보이스오버 작업이 완료되었다고 만족스러워하며 다음 단계로 넘어간다.
[00:05:54] 장면(Scene) 정의 및 계획

스크립트 분량에 맞춰 8개 장면을 10초(후에 5초) 단위로 구분, 각 장면에 필요한 시각적 요소를 설명하는 프롬프트를 작성한다.

비디오용 이미지 생성을 위한 장면 작성 단계를 설명하며, 스크립트에서 8개 장면을 만들어 총 80초 분량의 콘텐츠를 제작할 계획을 세운다.
각 장면이 어떤 비주얼을 담아야 하는지 설명하고, 이미지들을 비디오로 변환하는 과정에 대해 언급하며 장면 번호 체계를 설정한다.
MCP 서버 OpenAI를 활용해 장면들을 생성하는 과정을 시작하며, 첫 번째 장면이 피곤해 보이는 사람이 스누즈 버튼을 누르는 내용임을 확인한다.
[00:07:00] 이미지 생성(GPT1 이미지)

각 장면 프롬프트를 OpenAI 이미지 서버에 전송해 심도 있는 시네마틱 이미지들을 생성하고, 장면 파일명에 맞춰 결과물을 저장한다.

스크립트에서 8개 장면(0-7번)을 모두 완성하고, 이제 비디오 생성의 입력이 될 이미지들을 생성하는 중요한 단계로 넘어간다.
OpenAI GPT 이미지 생성을 위한 스타일을 설정하며, 영화 같은 얕은 심도와 광각 렌즈 효과를 적용하고 텍스트는 최소화하는 방향으로 프롬프트를 작성한다.
이미지 생성 과정을 시작하여 첫 번째 이미지인 알람을 스누즈하는 여성 이미지를 확인하고, 이를 장면 0으로 설정하여 계속해서 다음 장면들을 생성해나간다.
AI가 생성한 다양한 이미지들을 검토하며, 영화적이고 시네마틱한 스타일의 결과물에 만족감을 표현합니다. 8개 씬을 위해 약 15-16개의 이미지가 필요하다고 설명합니다.
[00:08:58] 비디오 클립 생성 및 리파인

Cling Pro 기반 영상 생성 서버에 시작·종료 이미지를 입력해 10초(이후 5초) 길이의 클립을 제작. 첫 결과물을 확인하고 과도한 전환을 줄이기 위해 길이를 조정한다.

모든 이미지 생성이 완료되었음을 확인하고, 다음 단계인 영상 생성 과정으로 넘어갑니다. 시네마틱 와이드 렌즈 스타일로 각 씬의 시작과 끝 이미지를 활용한 10초 길이 클립 8개를 생성하는 기술적 프롬프트를 작성합니다.
첫 번째 영상 결과를 검토한 후 문제점을 발견하여 전략을 수정합니다. 씬 간 전환이 부자연스러워서 10초 클립 대신 5초 클립으로 변경하기로 결정합니다.
첫 번째 5초 클립(씬 1)이 성공적으로 생성되었음을 확인하고 재생해봅니다. 결과물이 만족스럽다고 평가하며, 등장인물이 행복해 보이지는 않지만 좋은 시작이라고 언급합니다.
전체 영상 제작 과정을 시작하며, 모든 장면의 클립을 만들고 합성하는 작업 계획을 설명합니다. 음악 생성과 썸네일 제작이 필요하다고 언급합니다.
모든 클립 준비가 완료되었고, 합성 전에 배경음악과 썸네일이 필요하다고 설명합니다. MCP 서버를 통한 Sonato AI 음악 생성기를 사용할 계획입니다.
[00:12:00] 배경음악 및 썸네일 제작

Sonato AI MCP 서버로 로파이 배경음악을 생성하고 텍스트·이미지 배치를 세밀하게 제어해 GIP1 이미지로 강렬한 썸네일을 만든다.

영상용 미니멀한 로파이 배경음악을 생성하고, 음악 서버를 통해 첫 번째 시도를 진행합니다. 마음에 들지 않으면 다시 시도할 수 있다고 언급합니다.
썸네일 디자인에 대해 계획하며, 왼쪽에 텍스트, 오른쪽에 얼굴을 배치하는 구성을 제안합니다. 배경음악을 먼저 완성하고 썸네일 작업을 이어갈 예정입니다.
생성된 음악을 테스트해보고 볼륨을 낮춰서 사용하기로 결정합니다. 이제 스크립트를 참고하여 썸네일 생성 작업으로 넘어갑니다.
영상 제목 '이 이상한 아침 루틴이 나를 무적으로 만들었다'를 바탕으로 썸네일을 설계합니다. '지금 하라' 같은 강력한 메시지를 왼쪽에, 스크립트에 맞는 여성 얼굴을 오른쪽에 배치할 계획입니다.
생성된 썸네일의 얼굴 부분에 만족하며, 텍스트를 '지금 하라'로 수정하고 '3분이 당신의 인생을 바꿀 것이다' 같은 메시지로 조정하여 최종 썸네일을 완성합니다.
CSS 명령어를 활용해 썸네일 텍스트 위치를 조정하고 개선 방안을 모색합니다.
X축과 Y축 좌표를 설정하여 텍스트 배치를 최적화하고 결과를 확인합니다.
생성된 썸네일의 품질을 평가하며, 완벽하지는 않지만 사용 가능한 수준임을 확인합니다.
ffmpeg를 사용해 비디오 합성 과정을 계획하며, 단계별로 비디오 병합, 보이스오버 추가, 배경음악 삽입을 진행하기로 합니다.
[00:15:20] 최종 합성 및 업로드

ffmpeg 명령어를 활용해 모든 클립을 병합한 뒤 보이스오버와 배경음악을 레이어링. YouTube MCP 서버로 제목·설명·태그·썸네일을 설정하여 업로드까지 자동화한다.

씬 1부터 81까지의 모든 클립을 순서대로 병합하여 final_vid.mp4 파일을 생성하는 작업을 시작합니다.
51초 길이의 최종 비디오가 완성되었으며, 스토리 수정으로 인한 길이 변화를 확인합니다.
51초 비디오 길이에 맞춰 보이스오버 스크립트를 재작성하기 위해 문자 수 계산 작업을 진행합니다.
스크립트 조정 후 49초 길이로 완성되어 1초 차이만 나는 만족스러운 결과를 얻었습니다.
MP3 파일과 최종 비디오를 병합하고, 배경음악을 10% 볼륨으로 추가하는 최종 작업을 진행합니다.
완성된 비디오의 오디오를 테스트하며, 6개월 전 지친 일상에서 얼음물 명상을 발견한 이야기가 재생됩니다.
화자가 매일 아침 3분간 하는 얼음물 명상이라는 특별한 의식이 자신의 인생을 바꿨다고 소개하며, 시청자들에게 도전해볼 용기가 있는지 묻습니다.
비디오 업로드 과정을 시작하며, 제목 설정과 썸네일 추가라는 두 단계가 남았다고 설명합니다. YouTube MCP 서버를 사용해 업로드할 계획을 밝힙니다.
업로드 과정에서 Wim Hof와 바이오해킹 태그를 추가하고 성공적으로 업로드를 완료합니다. 비디오는 비공개로 설정되어 있습니다.
썸네일 업로드 중 2MB 크기 제한 문제가 발생했지만, bash 스크립트로 압축하여 해결합니다. 최종적으로 썸네일 업로드도 성공합니다.
YouTube 채널에서 업로드된 비디오를 확인하며, 3분짜리 비디오와 썸네일이 잘 나왔다고 평가합니다. '3분이 당신의 인생을 바꿀 것입니다'라는 제목과 모닝 루틴 태그를 확인합니다.
생성된 비디오의 내용을 재생하며 확인합니다. 6개월 전 지쳐있던 상태에서 얼음물 명상을 발견한 스토리, 처음의 의구심과 절망감, 그리고 시도 후의 극적인 변화를 담고 있습니다.
얼음물 명상의 과학적 원리와 효과를 설명하는 부분을 확인합니다. 포유류 다이빙 반사가 심박수를 늦추고 엔돌핀을 분비시킨다는 내용과 함께 시청자들에게 도전을 권합니다.
프로젝트 전체에 대한 소감을 나누며, Claude Code를 사용해 터미널에서 모든 것을 생성했다고 설명합니다. 몇 년 전 대비 AI 도구들의 놀라운 발전을 언급합니다.
이미지, 비디오, 음성, 텍스트 등 다양한 모달리티와 MCP 서버를 활용한 학습 경험을 강조하며, 생성형 AI 도구 입문자들에게 이 프로젝트를 추천합니다.
좋아요. 이제 MCP를 실행하면 여기 보이는 게
제가 이 프로젝트를 위해 만든 모든 서버들입니다.
6개월 전 저는 계속 지쳐있었고
매일 아침 3분씩 반복해서 스누즈 버튼을 눌렀어요.
하나의 이상한 의식이 제 삶을 바꾸었습니다.
네, 업로드가 되었네요. 이제 확인해보겠습니다.
이 작업 후에 말이죠.
설정이 완료되었습니다. 자, 오늘은
제가 지금까지 진행한
가장 큰 MCP 프로젝트를 진행하려고 합니다.
그것은 바로
터미널만으로 유튜브 채널을 구축하고 운영하는 것입니다.
또는 우리의 경우에는
클라우드 코드 클라이언트를 선택할 예정입니다.
그래서 이를 위해 필요한 모든 MCP 서버를 만들어야 합니다.
몇 가지는 건너뛸 예정인데
클라우드 3.7이 클라우드 코드에 통합되어 있기 때문입니다.
그래서 그것을 활용하고 싶습니다.
이것을 실현하기 위해 제가 해야 했던 일은
논리를 계획해야 했다는 것입니다.
실제로 어떻게 이것을 할 수 있는지
계획을 세워야 했습니다.
여기서는 작업 순서가 중요합니다.
물론 프롬프트와 컨텍스트 관리를 살펴봐야 했고
실제로 이 프로젝트를 진행하면서
많은 것을 배웠습니다.
오늘은 세부적인 내용까지는 다루지 않겠지만
어떻게 실제로 동작하는지
전체적인 과정을 보여드리겠습니다.
터미널이나 이 경우에는 클라우드 코드만을 사용해서
어떻게 동영상을 실행하고 생성할 수 있는지 말이죠.
네, 이 프로젝트를 진행하면서 정말 즐거웠고
많은 것을 배웠습니다.
그래서 어떻게 결과가 나왔는지
보여드리게 되어 기쁩니다.
그리고 어떻게 생각했는지
모든 도구를 통합하는 방법과
어떻게 사용할 수 있는지도 보여드리겠습니다.
자, 그럼 클라우드 코드로 가서
실제로 어떻게 이것을 할 수 있는지
보여드리기 시작하겠습니다.
좋아요, 이제 MCP를 실행하면 여기에
제가 이 프로젝트를 위해 만든 모든 서버들이 보입니다.
11랩 서버가 있고, 브레이브 서버와
필요할 경우 페치도 있습니다.
지미니 서버와 깃허브가 있는데
이것은 제 글로벌 서버입니다.
정확히 사용할 수는 없지만 사용할 필요가 없습니다.
하지만 여기에 OpenAI의
GPT-1 이미지 서버가 있습니다.
클링 비디오 제너레이터가 있는데
클링 프로 버전을 실행하고 있습니다.
동영상을 위한 배경 음악용 뮤직 서버와
제 구글 GCP API에 연결된
유튜브 서버가 있어서 채널을 관리합니다.
동영상을 업로드하고 제목과
썸네일 등 모든 것을 추가할 수 있습니다.
오늘 이 모든 것을 보여드리겠지만
이것이 기본적인 패키지입니다.
실제로 이것을 실현하기 위해
필요하다고 생각했던 것들입니다.
많은 커스텀 MCP 서버를 만드는 데
시간을 투자했는데 이것은
이 분야에 입문하고 싶다면
정말 좋은 연습이 됩니다.
커스텀 MCP 서버를 만들 때마다
많은 것을 배우는 것 같아요.
그래서 매우 흥미롭습니다.
이것을 깃허브에 공유하는 것을 고려하고 있습니다.
그렇게 된다면 다시 알려드리겠습니다.
자, 그럼 이제 어떻게 시작할까요?
물론 먼저 생각해야 할 것은
우리가 필요한 첫 번째는 스크립트입니다.
왜냐하면 A1 LS를 사용해서
실제로 보이스오버를 읽어내고 싶고
다양한 장면들을 만드는 데 사용할 거예요.
제가 생각하기로는 첫 번째로 필요한 건
비디오가 무엇에 관한 것인지에 대한 아이디어입니다.
그리 길지는 않을 예정이고요.
최대 2분 정도로 생각하고 있어요.
그런 느낌으로 말이죠. 그러니까
제가 어떤 종류의 비디오를 만들고 싶은지
아이디어를 생각해보고, 이제
본격적으로 시작해서 이것이 어떻게 작동하는지
보여드릴게요. 첫 번째 프롬프트는
꽤 길어질 거예요. YouTube 비디오를
만들어보죠. 제가 지시사항을
제공할게요. 먼저 간단한 조사와
보이스오버 스크립트 작업부터 시작할 거예요.
스크립트에서 장면들을
만들고 싶거든요. 주제는
이상한 아침 루틴이 나를
막을 수 없게 만들었다는 내용이에요.
비디오는 1인칭으로 개인적인
이야기를 전달해야 하고, 루틴에 대해
창의적으로 접근해주세요. 보이스오버
스크립트를 작성하되, 인간이 쓴 것처럼
들리게 만들어주세요. 말로 하는
내용을 포함시켜주시고, 제가 승인하거나
거부할게요. 이제 우리는 MCP 서버를
사용하지 않을 거예요. 클로드 코드에 내장된
클로드 3.7을 사용할 예정이에요.
제 API에 연결해 놨거든요, 맞죠?
보시다시피 Gemini를 사용하라고
제안하고 있네요. 이걸로도 할 수 있어요.
재미로 한번 시도해보고 어떤 결과가
나오는지 봅시다. 사실 별로
생각해보지 않았는데, 어떤 결과가
나오는지 봅시다. 잘 안 되면
3.5를 사용하죠. 좋아요.
결과를 보실 수 있어요.
얼음물 명상이라고 하네요.
3분 동안 얼음물에 얼굴을 담그는
내용 같은 거예요. 그냥
이걸로 가죠. 별로 중요하지 않아요.
왜 이게 효과가 있는지에 대한 설명도
있지만, 최소한 매우 이상하긴 하네요.
그래서 제가 그냥 좋다고
하겠습니다. 스크립트에
저장할 거예요. 스크립트라는
폴더가 있어요. 그래서 클로드에게
그렇게 하라고 지시할 거예요.
이를 위해서는 bash 명령만 있으면 되고
MCP 서버는 실제로 필요하지 않아요.
네, 이걸 water ritual.txt로 저장할게요.
좋아요, 이상한 일이네요. 보시다시피
이제 스크립트에 저장했어요.
이제 보이스오버가 생겼네요.
훌륭해요. 다음 단계는
11Labs를 사용해서 이걸 음성으로 된
MP3로 변환하는 것입니다.
11Labs로 보낼 거예요.
음성을 선택할게요. 음성 목록을
출력하겠습니다. 여기서 11Labs의
MCP 도구를 사용하고 있어요.
Soie Drake 음성을 선택할게요.
Drake인 것 같아요. 그걸 지시하겠습니다.
Drake가 우리가 선택할 음성이에요.
볼 수 있거든요. 이제
여기서 ID를 가져와서 사용할 수 있어요.
네, 스크립트를 넣고 ID를 넣고
이걸 보낼 거예요. 이제 이걸
여기 음성 폴더에 저장하길
바라고 있어요. 좋아요.
완료됐네요. 120초예요. 괜찮네요.
이걸 조금 들어봅시다.
모든 것이 바뀐 그날을 기억해요. 6개월 전
저는 항상 지쳐 있었고, 매일 아침
다섯 번씩 알람을 미뤘어요.
문밖으로 뛰쳐나가며 간신히 커피 한 잔 챙길 시간밖에 없었죠. 그런데,
이제 이걸로 만족합니다. 좋네요. 자,
이제 우리의 보이스오버가 완성되었습니다.
이제 다음 단계는
몇 가지 장면을 만들어서
실제로 비디오용 이미지를 생성하는 것입니다.
그리고 이를 위해 프롬프트를 사용할 거예요.
이제 스크립트를 위한
몇 가지 장면을 작성해야 합니다.
스크립트에서요. 12개 장면을 만들 예정인데
각 장면이 10초씩이니까 총 120초가 되겠네요.
좋습니다. 이제 스크립트를 위한
몇 가지 장면을 작성해야 합니다.
스크립트에서 말이죠. 8개 장면을
10초씩 만들 거예요. 왜냐하면
80초가 필요하거든요. 맞죠? 보이스오버 스크립트와 일치하게요.
장면들은 어떤 종류의 비주얼이
비디오에 들어가야 하는지 설명해야 합니다.
이 경우에는 이미지죠. 왜냐하면
이 이미지들을 비디오로 변환할 예정이니까요.
그래서 장면 0부터
1 등등으로 저장할 거예요. 장면들에 말이죠.
자, 이제 실행해보겠습니다.
우리 MCP 서버 OpenAI가 이제 작동하길 바라며
지금은 아니지만, 장면들을 만들고 나서
사용할 수 있을 거예요. 보시다시피 장면 1은
피곤해 보이며 걷는 사람이
스누즈 버튼을 누르는 것이죠.
시계 같은 것 말이에요. 네, 괜찮네요.
이게 장면 1이 될 거예요.
이 세션에서는 다시 물어볼 필요 없겠네요.
이제 스크립트에서 필요한 8개 장면을 모두 연속으로 만들 거예요.
그런 다음 그 장면들을 가져와서
실제로 이미지를
생성하기 시작할 거예요.
좋습니다, 마지막 장면이네요.
완료했습니다. 8개 장면이 있어요.
완벽합니다. 0부터 7까지, 그게 8개죠.
이제 다음 부분이 꽤 중요한데요.
이제 비디오 생성의 입력이 될
이미지들을 생성해야 합니다.
그리고 이를 위해 당연히 OpenAI GPT-1 이미지를 사용할 거예요.
여기서 프롬프트를 작성하겠습니다.
좋습니다. 여기 제 스타일이 있어요.
영화 같은 얕은 심도, 광각 렌즈이고
이 이미지가 꽤 멋질 거라고 생각해요.
이제 실행할 거고, 이미지에 최소한의 텍스트를
사용하도록 지시할 예정입니다.
텍스트 없음이나 최소한으로 하겠다고
말하겠어요. 괜찮네요.
약간의 텍스트는 사용할 수 있어요.
이제 실행해보고
어떻게 되는지 보겠습니다.
각 장면의 이미지가 마음에 들지 않으면
중단할 수 있어요.
좋습니다. 첫 번째 이미지가 나왔네요.
네, 이걸 장면 0으로 이동하겠습니다.
이게 우리 비디오의 첫 번째 장면이죠.
알람을 스누즈하는 여성이요. 좋은 시작인 것 같아요.
계속해서 다음 장면으로 넘어가겠습니다.
계속 이런 식으로요.
이제 장면 0과
장면 1이 시작될 거예요.
계속 실행하도록 두고
나중에 돌아와서 몇 가지 이미지를 볼게요.
좋습니다. 이제 4개의 이미지가 있네요.
계속 진행하겠습니다.
다음 장면으로 넘어가서 계속해보죠.
좋습니다. 이제 장면 0과
장면 1이 시작됩니다. 이것만 실행하도록 두고
돌아와서 몇 가지 이미지를 확인해보겠습니다.
좋습니다. 이제 4개의 이미지가 있네요.
저는
모든 걸 다 보여드리진 않겠지만, 여기 또 다른 이미지가 있어요.
꽤 괜찮아 보이네요.
이런 스타일이 마음에 들어요. 매우 영화적이에요.
여기서 뭔가 이상한 일이 일어나고 있는지 모르겠지만,
정말 이상한 영상이 될 것 같아요.
하지만 계속 진행해봅시다.
생성해야 할 것들이 있는데,
8개 씬이 있다면 약 15-16개의 이미지가 있을 거예요.
그래서 지금 이걸 실행시켜두고
더 많이 생성되면 다시 돌아올게요.
정말 마음에 드는 걸 찾았는지 봅시다.
좋아요, 완료됐네요.
이제 모든 이미지가 준비됐어요.
보시다시피 필요한 모든 씬이 완성됐죠.
이제 다음 단계로 넘어가서 실제로 영상 생성을 시작해야 해요.
그럼 바로 시작해봅시다.
다음 프롬프트를 만들어야 하는데,
어떻게 해야 할지 생각해봅시다.
좋아요. 이제 프롬프트는
조금 기술적일 거예요. 왜냐하면 모든 씬 이미지가 있으니까요.
다음은 영상 생성이에요.
영상 프롬프트를 만들어야 해요.
시네마틱 와이드 렌즈 같은 거죠.
시작과 끝 로직을 사용해야 해요.
씬 1의 시작 이미지는
씬 시작 PNG 같은 거고,
끝 이미지는 씬 1 끝 씬 1 시작 PNG예요.
씬 1 시작은 물론 같은 거고 이런 식으로 계속됩니다.
영상에 필요한 8개 클립 생성을 시작해주세요.
각각 10초 길이로요.
한번 시도해보고 어떻게 되는지 봅시다.
전체 사이클을 처음 해보는 거라서
흥미로울 거예요. 실행시켜두고 결과가 나오면 다시 돌아올게요.
결과가 나오면 다시 돌아올게요.
여기 MCP 서버에 명령어를 보고 싶어요.
이게 첫 번째 전체 사이클이라서
흥미로울 거예요. 실행시켜두고
결과가 나오면 다시 돌아올게요.
여기 MCP 서버에 명령어를 보고 싶어요.
좋아요. 이게 프롬프트가 될 거예요.
시네마틱 와이드가 있고...
좋아요. 이걸 시도해볼게요.
여기에 너무 많은 시간을 쓰지는 않을게요.
시작 이미지가 맞네요. 좋아요.
여기에 너무 많은 시간을 쓰지는 않을게요.
시작 이미지가 맞네요.
끝 이미지도 맞고요.
출력 파일 이름은 씬 비디오가 될 거예요.
완벽해요.
첫 번째 클립이 나오면 다시 돌아와서
같이 봅시다.
첫 번째 영상을 본 후에
몇 가지 변경사항을 적용했어요.
씬 0에서 끝 씬으로 전환할 때
영상이 너무 이상했거든요.
그래서 조금 바꿨어요.
이제 5초 클립으로 할 거예요.
씬 1은 5초만 하고
이 이미지를 사용할게요.
씬 2는 이 이미지를 사용하되
5초로 할 거예요.
좀 더 점프하는 느낌이지만
전반적으로 더 나을 것 같아요.
이것에서 저것으로 전환할 때
너무 이상하게 보였거든요.
그걸 시도해보고
첫 번째 5초 클립이 나오면 다시 돌아올게요.
좋아요. 씬 1이 있네요. 완벽해요.
씬 2를 시작할 거예요.
먼저 봅시다. 비디오 씬 1을 찾아봅시다.
좋아요. 재생해봅시다.
네, 꽤 괜찮네요. 그녀가 별로 행복해 보이지는 않지만요.
좋아요. 좋은 시작이에요. 완벽해요.
이제
이제 할 수 있을 것 같아요. 그래서 지금
할 일은 이걸 실행하는 거예요.
진행할게요. 모든 장면을
살펴보면서 필요한 모든
클립들을 만들 거예요. 그다음에
합성하고 새로운 요소들을 추가해서
모든 걸 합칠 거예요.
음악도 생성하고, 썸네일도
필요하겠네요. 최종 결과가
어떨지 흥미롭겠지만, 모든
클립이 준비되면 다시 보여드릴게요.
아마 시간이 좀 걸릴 거예요.
여러분에게는 1초밖에 안 걸리겠지만요.
좋아요. 이제 필요한 모든 장면이
준비됐습니다. 모든 걸 합치기 전에
한두 가지가 더 필요해요.
배경음악이 좀 필요하고, 그래서 MCP
서버를 설정했어요. 그걸로 할 수 있고
몰입감 있는 썸네일도 생성해야 해요.
맞아요. 이 영상을 위한 배경음악부터
시작해보죠. 미니멀한
로파이 배경음악을 만들어보겠습니다.
영상용으로요. 여기 Sonato AI를
설정해 놨어요. 음악 생성기인데
이걸 위한 MCP 서버로 사용할 수 있어요.
꽤 간단할 거예요. 네, 음악
서버를 사용할 거예요. 그냥
시도해보겠습니다. 잘 모르겠지만
첫 번째 걸로 해볼게요. 마음에 안 들면
다시 시도하면 되고요. 그 다음에는
썸네일에 대해 좀 생각해볼 거예요.
왼쪽에는 텍스트가 필요하고
오른쪽에는 얼굴이 있어야 할 것 같아요.
하지만 배경음악을 먼저 하고
그 다음에 썸네일을 만들어보죠.
좋아요. 음악 파일이 생겼네요.
좀 들어보겠습니다.
음악이 나와요.
[음악]
네, 괜찮을 것 같네요.
볼륨만 완전히 줄이면
꽤 좋을 거예요. 그래서 이제
썸네일을 만들어보죠. 할 때
대본이나 스크립트를 참고할
것 같아요.
썸네일을 생성하는 프롬프트를
생각해보겠습니다. 스크립트에서
썸네일이 필요하다고 해보죠.
간단하지만 강력한 걸로 만들어보겠습니다.
영상 제목이 '이 이상한 아침 루틴이
나를 무적으로 만들었다'였으니까
이걸 반영하는 네 단어 정도를
'지금 하라' 같은 걸로 선택해서
왼쪽에 넣을 거예요. 오른쪽에는
스크립트에 맞는 여성의
얼굴이 필요해요. GPT-1 이미지를
사용해서 이걸 만들 거예요.
16:9 형식으로요.
좋아요. 그렇게 해보죠.
마음에 드는 썸네일이 생기면
합성을 시작할 거예요. 좀 복잡한
과정이지만
그렇게 어렵지 않을 거예요.
좋아요. 이걸 얻었네요.
꽤 좋지 않나요? 얼굴이
정말 마음에 드는데, 텍스트를
바꿔야겠어요. 그냥 텍스트를
'지금 하라'로 바꿔보죠.
그런 식으로요. 완벽할 거예요.
여기 얼굴이 정말 마음에 들어요.
좋아요. '3분이 당신의 인생을
바꿀 것이다' 이런 식으로 해보겠습니다.
그런 느낌으로요.
여기 얼굴이 정말 마음에 들어요.
3분이 당신의 인생을 바꿀 거라고
뭐 그런 식으로 하겠습니다.
좀 더 개선해볼 수 있을지 봅시다.
첫 번째 시도치고는 꽤 괜찮았다고 생각하지만요.
제가 생각하기에는요.
좋아요. 이것을 만드는 과정에서 좀 실험해봤습니다.
CSS 명령어를 사용하면
텍스트를 원하는 위치에 배치할 수 있다는 걸 알아냈어요.
X축 20%와 X 20으로 설정하고
Y축에는 70과 20으로 설정하겠습니다.
이렇게 하면 꽤 괜찮을 것 같아요.
이제 결과를 기다려보죠.
여기 결과가 나왔습니다.
꽤 좋네요, 그렇죠?
완벽하지는 않아요. 텍스트가 좀 왼쪽에 치우쳐 있지만
괜찮습니다.
읽을 수는 있으니까요. 이게 우리가 사용할
썸네일입니다. 배경 음악도 있고
이제 모든 걸 합쳐서
업로드하기만 하면 됩니다.
흥미로울 것 같네요.
아주 간단하게 해보겠습니다.
먼저 모든 비디오를 합치고
ffmpeg를 사용해서
그다음에 보이스오버를 추가하고
마지막에 볼륨 슬라이더로
음악을 추가할 거예요.
음악을 추가할 거예요.
그래서 이걸 수행할 수 있는
프롬프트를 작성해보겠습니다.
ffmpeg로 이 작업을 하도록 지시하는
프롬프트를요.
hopefully we can do that. 뭔가 생각해보죠.
씬 1에서 81까지의
모든 클립을 순서대로 합쳐서
final_vid.mp4로 저장하고
ffmpeg를 사용할 거예요.
제가 보기에는 꽤 쉬울 것 같은데요.
그다음에 음악과
보이스오버를 겹칠 거예요.
bash 명령어를 사용해서
ffmpeg 명령을 실행하겠습니다.
어떻게 될지 봅시다.
지금 합치고 있습니다.
최종 비디오가 완성됐네요.
확인해봅시다. 51초 길이고
스토리를 좀 수정했기 때문입니다.
이제 제 계획은
보이스오버를 다시 써서
51초에 맞추는 거예요.
보이스오버를 비디오에 합치기 전에
그 작업을 먼저 해보겠습니다.
네, 다시 작성해보겠습니다.
문자 수를 세어서
계산을 좀 해보고
51초 길이에 맞추려면
몇 글자가 필요한지 알아볼 거예요.
크게 중요하지는 않지만
한번 해보죠.
조정을 좀 했더니
이제 길이가 49초네요.
완벽해요. 1초밖에 차이 안 나네요.
완벽해요. 이제 해야 할 일은
MP3 파일을
최종 비디오와
합치는 거예요.
MP3 파일을 최종 비디오와 합치려고 합니다.
그 다음에는 배경 음악을
10% 볼륨으로 합칠 거예요.
이전에 해본 적이 없어서
어떻게 될지 봅시다.
어떻게 될지 봅시다.
이제 최종 작업을 해보겠습니다.
소리를 켜고 들어보겠습니다.
6개월 전, 저는 항상 지쳐있었고
계속 스누즈를 누르며
하루하루를 급하게 보냈습니다.
그때 이것을 발견했어요. 얼음물
명상을 하루 3분씩.
매일 아침 3분씩 명상을 합니다.
하나의 특별한 의식이 제 인생을 바꿨습니다.
도전해볼 용기가 있으신가요? 네,
잘 작동하고 있습니다. 완벽해요. 이제
두 단계만 남았습니다. 비디오를 업로드하고,
실제로 썸네일을 추가하는 것입니다. 그런데
비디오 제목이 뭐였죠? 찾아봐야겠네요.
비디오 업로드를 해보겠습니다.
제목은 네, 기억납니다.
적절한 설명과 태그를 추가하겠습니다.
이제 제가 만든
YouTube MCP 서버를 사용해보겠습니다.
인증이 되어 있어야 하고,
아, 그런데 언급하지 않았지만
이제 터미널을 추가할 수 있습니다.
나중에 할 생각이었는데,
한번 해보죠. 제목이 있네요.
업로드할 수 있는지 확인해보겠습니다.
길지는 않네요.
Wim Hof, 좋은 선택이군요.
바이오해킹. 네, 업로드가 성공했습니다.
나중에 확인해보겠습니다.
비공개로 설정되어 있는데 괜찮습니다.
이제 썸네일을 추가하겠습니다.
정의되지 않았다고 나오네요.
썸네일 문제는
최대 크기인 2MB를 초과했기 때문입니다.
이제 압축된 버전을 다시 업로드해보겠습니다.
bash 스크립트로 수정할 수 있습니다.
여기서 말이죠. 정말 좋네요.
이제 작동하는지 확인해보겠습니다.
완벽합니다. 끝났네요.
다음 단계로 YouTube로 가서
채널을 확인하고 비디오가 있는지 봅시다.
여기로 가면, 와!
보이시죠. 완벽합니다. 여기 비디오가 있습니다.
3분짜리 비디오네요.
썸네일이 꽤 잘 나왔습니다.
전체 이미지를 실제로 보지 못했을 때
가지고 있었기 때문이죠.
이건 정말 좋았습니다.
3분이 당신의 인생을 바꿀 것입니다.
이게 썸네일이에요.
네, 여기 지침들이 있고요.
태그가 있나요? 확인해보죠.
네, 여기 태그들이 있네요.
모닝 루틴. 이제 제가 할 일은
아, 공개되어 있네요.
비디오를 끝까지 시청하고
간단히 요약해보겠습니다.
6개월 전, 저는 항상 지쳐있었고,
계속 스누즈를 누르며
급하게 하루를 보냈습니다.
그러다 발견했습니다.
얼음물 명상. 처음에는
말도 안 된다고 생각했지만, 절망적이었죠.
그래서 어느 날 아침 시도해봤습니다.
얼음물이 가득한 양동이에
얼굴을 3분간 담그는 거였죠.
첫 번째는 충격적이었습니다.
뇌가 빼라고 소리쳤지만
억지로 버텼습니다. 올라왔을 때
모든 게 바뀌었습니다.
정신이 완전히 맑아졌고,
모든 멘탈 포그가 사라졌습니다.
그 이후로 매일 아침 이걸 하고 있습니다.
생산성이 3배 증가했고,
더 이상 카페인도 필요 없습니다.
불안감이 사라졌어요. 차가운 물이
포유류 다이빙 반사를 유발해서
심박수를 늦추고 몸에
엔돌핀을 넘쳐나게 합니다.
매일 아침 3분씩.
하나의 특별한 의식이
제 인생을 바꿨습니다.
도전해볼 용기가 있으신가요?
꽤 멋지지 않나요?
이 비디오의 모든 것을
Claude Code를 사용해서
터미널에서 생성했습니다.
이건 정말 긴 과정이었어요.
몇 년 전에 이런 도구들로
비디오를 만들어보려고 했는데
정말 많이 발전했어요.
놀랍죠? 네, 모르겠어요.
이 프로젝트로 정말 재미있게 했습니다.
이런 걸 좋아하신다면 꼭 시도해보세요.
다양한 종류의 모달리티에 대해
많이 배울 수 있어요. 이미지, 비디오, 음성,
그리고 텍스트까지요.
그리고 MCP 서버를 사용할 수 있어서
이런 기능들을 추가할 수 있습니다.
이런 생성형 AI 도구들을
사용해보고 싶다면 훌륭한 프로젝트예요.
계속 작업할 예정이고
말씀드린 대로, 관심이 있으시다면
이런 설정으로 GitHub 업로드를
할 수도 있을 것 같습니다.
네, 이게 영감을 주었기를 바랍니다.