15분 만에 자율 AI 비디오 에이전트 구축하기: 이렇게 하면 됩니다

All About AI 구독자 189,000명

요약

이 영상은 15분 안에 자율적으로 YouTube 인기 쇼츠를 분석·재생성하는 AI 비디오 에이전트를 만드는 과정을 단계별로 안내합니다. YouTube Data API로 상위 조회수 쇼츠를 추출하고, Gemini 2.5 Pro의 URL 입력·장면 추출 기능을 활용해 구조화된 장면 정보를 얻습니다. 이어서 Google의 이미지·비디오 생성 모델로 각 장면을 재구성하고 Cloud Code의 Plan Mode로 전체 워크플로우를 자동화하며, 결과를 원본 쇼츠와 비교해 개선 방향을 제시합니다.

주요 키워드

YouTube Data API Gemini 2.5 Pro Cloud Code Context Engineering Plan Mode image2image video generation Autonomous AI Agent API Key Pipeline Automation

하이라이트

Warning: htmlspecialchars() expects parameter 1 to be string, array given in /var/www/youtubetranscribeapi/public/detail.php on line 954
Warning: htmlspecialchars() expects parameter 1 to be string, array given in /var/www/youtubetranscribeapi/public/detail.php on line 954
Warning: htmlspecialchars() expects parameter 1 to be string, array given in /var/www/youtubetranscribeapi/public/detail.php on line 954
Warning: htmlspecialchars() expects parameter 1 to be string, array given in /var/www/youtubetranscribeapi/public/detail.php on line 954
Warning: htmlspecialchars() expects parameter 1 to be string, array given in /var/www/youtubetranscribeapi/public/detail.php on line 954
Warning: htmlspecialchars() expects parameter 1 to be string, array given in /var/www/youtubetranscribeapi/public/detail.php on line 954
Warning: htmlspecialchars() expects parameter 1 to be string, array given in /var/www/youtubetranscribeapi/public/detail.php on line 954
Warning: htmlspecialchars() expects parameter 1 to be string, array given in /var/www/youtubetranscribeapi/public/detail.php on line 954

용어 설명

YouTube Data API

지난 7일간 조회수 상위 쇼츠를 검색하고 URL, 통계 정보를 가져오는 Google의 RESTful API입니다.

Gemini 2.5 Pro

YouTube URL을 입력받아 동영상 장면을 추출하는 Google의 AI 모델로, 구조화된 장면 설명을 반환합니다.

Cloud Code

코드 스니펫 작성·실행·디버그를 지원하는 Google Cloud의 개발 도구로, Plan Mode를 통한 자동화 워크플로우 설계가 가능합니다.

Context Engineering

AI 모델이 최적의 결과를 낼 수 있도록 API 문서·URL·프롬프트 등을 체계적으로 수집하고 정리하는 단계입니다.

Plan Mode

Cloud Code 환경에서 실제 코드 수정 없이 단계별 실행 계획을 미리 생성·확인할 수 있는 모드입니다.

15분 만에 자율적으로 동영상을 재생성하는 AI 에이전트를 설계합니다. YouTube API로 인기 쇼츠를 조회하고, Gemini 2.5 Pro를 사용해 장면을 추출한 뒤 이미지·동영상 생성 모델로 이어지는 전체 파이프라인 로직을 안내합니다.

[00:00] 자율적인 AI 영상 에이전트 구축에 대한 개요를 소개하며, 오늘 따를 로직과 프로세스를 설명합니다.

[00:25] YouTube API를 사용하여 지난 7일간 가장 많이 본 쇼츠를 찾고, Gemini 2.5 Pro로 YouTube URL을 컨텍스트로 활용하여 인기 영상에서 장면을 추출하는 방법을 설명합니다.

[00:56] 장면 설명을 바탕으로 새로운 이미지와 비디오 프롬프트를 작성하고, 구글의 Imagen 4로 이미지를 생성한 후 Kling 2.1 모델의 입력으로 사용하는 과정을 설명합니다.

Gemini video understanding API와 YouTube Data API 문서를 Cloud Code 마크다운 파일에 복사합니다. Google의 이미지·비디오 생성 모델 문서도 함께 통합해 컨텍스트 엔지니어링을 준비합니다.

[01:36] 컨텍스트 수집의 중요성을 강조하며, fal에서 Kling과 Imagen 모델 정보를 수집하고 Gemini의 비디오 이해 기능을 활용하는 방법을 설명합니다.

[02:16] Gemini 문서에서 YouTube URL을 포함하는 방법을 찾고, Python으로 구현하기 위해 필요한 문서를 수집합니다. YouTube 데이터 API의 videos와 list 참조를 확인합니다.

[02:53] YouTube API 문서와 Claude 모델 문서를 복사해서 프로젝트에 붙여넣어 필요한 API 참조 자료를 준비했습니다.

YouTube, Gemini, Foul AI(이미지·영상 생성) API 키를 Google Cloud 콘솔에서 발급받고 ENV 파일에 설정합니다. Cloud Code에 로그인해 프로젝트 문서와 환경 변수를 로드합니다.

[03:31] 프로젝트 실행을 위해 YouTube API 키, Gemini API 키, Foul AI API 키 등 필요한 API 키들을 Google Cloud 콘솔에서 수집하는 과정을 설명했습니다.

[03:55] 터미널에서 Claude를 실행하고 로그인한 후, 프로젝트 문서를 읽어 Claude 코드가 작업할 준비를 마쳤습니다.

Plan Mode로 YouTube 클라이언트, Gemini 클라이언트, 오케스트레이터 모듈 설계 후 코드를 자동 생성합니다. pip install 및 ENV 설정을 마치고 analysis.py를 실행해 장면 추출 결과를 확인한 뒤, 이미지 생성 테스트를 진행합니다.

[04:24] 플랜 모드로 전환하여 코드 편집 없이 계획을 세우기 시작했습니다. 지난 7일간 조회수 기준 상위 10개 YouTube 숏폼 콘텐츠를 찾아 Gemini로 장면 추출 및 AI 이미지 프롬프트 생성하는 프로젝트를 제안했습니다.

[05:23] Claude가 YouTube 클라이언트 모듈, Gemini 클라이언트 모듈, 데이터 처리 및 메인 오케스트레이터 구축을 포함한 단계별 구현 계획을 제시했습니다.

[05:40] AI 비디오 에이전트 구축 프로젝트의 모든 모듈이 준비되어 코드 작성을 시작할 수 있게 되었습니다.

[05:49] 클라우드 코드를 백그라운드에서 실행하도록 설정하고 프로젝트 진행을 기다리는 중입니다.

[06:04] 투두 리스트 작업이 2-3분 만에 완료되어 프로젝트가 준비되었습니다.

[06:12] AI 비디오 코스 소개 - 새로운 바이럴 AI 비디오 전략 모듈이 추가되어 수백만 조회수를 얻을 수 있는 콘텐츠 제작 방법을 다룹니다.

[07:04] 실제 프로젝트 실행을 위해 pip install requirements를 진행하고 ENV 파일에서 API 키를 구성합니다.

[07:25] python run analysis.py를 실행하여 프로젝트를 시작하고 클라우드 코드에서 직접 실행하여 오류를 즉시 확인합니다.

[07:40] 초기 실행에서 임포트 경로 문제가 발생했지만 클라우드 코드가 자체적으로 수정하여 해결했습니다.

[07:55] YouTube 쇼츠 분석이 성공적으로 시작되어 Gemini에게 데이터를 전송하고 있습니다.

[07:59] 분석이 완료되어 모든 데이터가 추출되었으며, 결과 파일에서 비디오 URL, 태그, 장면 정보를 확인할 수 있습니다.

[08:16] AI 프롬프트와 필요한 모든 것들이 준비되어 이론적으로는 재현이 가능한 상태가 되었습니다. 다음 단계는 이 장면들로부터 이미지를 생성하는 것입니다.

[08:42] 비디오 제작을 위해 장면 수를 압축하기로 결정했습니다. 5초 클립을 만들 것이기 때문에 34개 장면 대신 5개 장면으로 테스트를 진행하겠습니다.

[09:11] 장면 선택 전략이 완성되었고 5개의 서로 다른 장면이 준비되었습니다. 이제 코딩을 시작할 준비가 되었습니다.

추출된 5개 장면에 맞춰 Google 이미지 모델로 생성된 이미지를 기반으로 동영상 클립을 만들고, 애니메 스타일을 적용합니다. 원본 쇼츠와 자동 생성 클립을 비교·분석하며 향후 프로젝트 확장 및 반복 개선 방향을 제안합니다.

[09:32] 이미지 생성을 테스트하기 위해 코드를 실행했습니다. 완료 후 이미지 폴더를 확인한 결과 5개의 이미지가 성공적으로 생성되었습니다.

[09:59] 캐릭터 일관성을 위해 모든 프롬프트에서 동일한 설명이 유지되도록 업데이트를 진행했습니다. 이제 최종 단계인 클립 생성을 시작할 수 있습니다.

[10:30] 클립 생성이 완료되어 바이럴 숏폼 콘텐츠 생성이 준비되었습니다. 마지막으로 정확한 복사가 아닌 재현을 위해 전체 비디오의 스타일을 애니메이션으로 설정했습니다.

[10:59] 아니메 스타일로 변경된 비디오를 원본과 비교해보며 테스트를 시작합니다. API 키 검증 후 새로운 숏폼 콘텐츠를 찾아 재현해보는 과정을 설명합니다.

[11:27] 생성된 클립들을 확인하고 음악과 함께 편집한 결과를 보여줍니다. 원본 숏에서 의사와 환자들 사이의 컷들을 재현한 장면들을 비교 분석합니다.

[12:20] 완벽하지는 않지만 원본 숏의 장면들을 어느 정도 재현할 수 있었다고 평가합니다. 더 좋은 결과를 위해서는 많은 반복 작업이 필요하다고 설명합니다.

[12:45] 자동화 프로젝트의 재미와 발전 가능성을 언급하며, 몇 달 후 새 버전을 만들어 현재 버전과 비교해볼 계획을 밝힙니다.

[00:00] 좋아요. 오늘은 여러분만의 자율적인 AI

[00:01] 영상 에이전트를 만드는 방법을 보여드리겠습니다.

[00:03] 여기서 보시는 것은 오늘 우리가 따를

[00:06] 대략적인 로직입니다.

[00:08] 지금 이 로직을 설명하고 나서

[00:10] 클라우드 코드로 넘어가겠습니다.

[00:11] 컨텍스트를 수집하고,

[00:12] 직접 설정하는 방법을 보여드리겠습니다.

[00:14] 결과가 꽤 좋아지고 있다고 생각합니다.

[00:17] 정말 흥미진진합니다.

[00:19] 그럼 오늘 만들고자 하는 것의 로직을 살펴보겠습니다.

[00:22] 첫 번째로 필요한 것은 당연히

[00:24] YouTube API입니다.

[00:25] 이 에이전트가 지난 7일간

[00:27] 가장 많이 본 쇼츠를 찾아야 하기 때문입니다.

[00:30] 그래서 우리가 재현하거나

[00:33] 모방할 수 있는 것을 찾는 거죠.

[00:35] API를 사용하면 이런 쇼츠를 찾을 수 있고

[00:38] URL을 가져올 수 있습니다.

[00:40] Gemini 2.5 Pro는 실제로

[00:43] 입력 YouTube URL을 컨텍스트로 사용할 수 있습니다.

[00:47] 이것은 매우 중요합니다. 우리가 이

[00:50] 인기 있는 YouTube 영상에서

[00:52] 장면을 추출하고 싶기 때문입니다.

[00:55] 다음은 새로운 이미지와

[00:56] 비디오 프롬프트를 작성하는 것입니다.

[00:59] 장면 설명을 얻으면

[01:00] 이미지를 생성하여

[01:03] Kling 2.1 모델의 입력 컨텍스트로

[01:05] 사용함으로써 이를 재현할 수 있습니다.

[01:08] 이미지 생성을 위해서는

[01:10] 구글의 Imagen 4를 사용하겠습니다.

[01:12] 이 두 모델은 꽤 좋고

[01:15] 비용도 저렴하지 않습니다.

[01:17] 말씀드린 대로 입력 컨텍스트로

[01:20] 사용할 이미지를 생성합니다.

[01:21] 프롬프트로부터 이것을 생성합니다.

[01:24] 마지막으로 생성할 수 있는 클립은

[01:27] 우리가 생성한 이미지와 프롬프트로

[01:31] Kling 모델을 사용합니다.

[01:32] 이것이 기본적인 설정과 로직입니다.

[01:36] 다음에 할 것은

[01:38] 컨텍스트를 수집하는 것입니다.

[01:40] 그런 다음 클라우드 코드로 들어가서

[01:42] 이것을 실행하고 잘 되기를 바라며

[01:44] 흥미로운 결과를 얻겠습니다.

[01:46] 컨텍스트 엔지니어링을 할 때

[01:48] 이를 잘 수행하는 것이

[01:49] 매우 중요하다고 생각합니다.

[01:50] 코드 생성 과정이 매우 순조롭게 진행되도록 말입니다.

[01:53] 여기 fal에서 정보를 수집하겠습니다.

[01:55] Kling과 Imagen 모델

[01:56] 둘 다에서 말입니다.

[01:59] 비디오 이해를 위한

[02:01] Gemini의 컨텍스트와

[02:03] 구글의 컨텍스트가 필요합니다.

[02:06] 여기서 시작해보겠습니다.

[02:08] Gemini에서 말입니다. 여기에

[02:11] 비디오 이해라는 것이 있습니다.

[02:13] 이것이 우리가 필요한 문서입니다.

[02:16] 아래로 스크롤하면

[02:17] YouTube URL 포함이라는

[02:20] 항목이 있습니다. 이런 것이 필요합니다.

[02:23] Python으로 할 것 같습니다.

[02:24] 그래서 이것을 복사하겠습니다.

[02:27] 원한다면 전체 페이지를

[02:29] 그냥 가져올 수도 있습니다.

[02:31] 크게 중요하지 않지만 이걸 가져오겠습니다.

[02:33] Gemini 마크다운 파일에 붙여넣었습니다.

[02:36] 이제 입력과 장면 설명

[02:39] API를 위한 설정이 완료된 것 같습니다.

[02:43] 다음으로 YouTube에서

[02:45] 뭔가를 가져오고 싶습니다. 관련된

[02:48] YouTube 데이터 API 참조를 찾았습니다.

[02:50] 그것은 videos와 list입니다.

[02:53] 전체 페이지를 복사해서 우리 작업에 붙여넣었습니다.

[02:56] 파일 모델들도 같은 방식으로 작업할 거예요.

[02:59] 완료했습니다.

[03:01] 다시 반복하고 싶으시면,

[03:03] Claude 2.5 v12 프로로 가서

[03:05] 표준 이미지에서 이미지로, 비디오에서 이미지로, 비디오로 변환하는 기능을 확인할 수 있습니다.

[03:10] 여기서 API를 클릭하면

[03:13] 아래쪽에 문서를 찾을 수 있습니다.

[03:15] 맞죠?

[03:18] 그래서 그걸 복사해서 여기에 붙여넣었습니다.

[03:21] 이제 모델에서 필요한 모든 문서를 갖추었다고 생각합니다.

[03:23] 준비가 완료되었습니다.

[03:25] 클라우드 코드를 실행하기 전에 몇 가지 더 수집해야 할 것들이 있습니다.

[03:28] 바로 API 키들입니다.

[03:31] YouTube API 키,

[03:33] Gemini API 키,

[03:35] 그리고 비디오와 이미지를 생성하기 위한 Foul AI API 키가 필요합니다.

[03:38] YouTube API 키는 Google Cloud 콘솔에서 찾을 수 있습니다.

[03:41] Gemini API도 마찬가지입니다.

[03:44] 이것들을 수집하고 나면 준비가 완료됩니다.

[03:47] 지금 그 작업을 하겠습니다.

[03:50] 네, 그렇게 하겠습니다.

[03:52] 좋습니다. 이제 준비가 끝났습니다.

[03:55] 터미널에서 작업하겠습니다.

[03:57] 클라우드를 실행하고 로그인하겠습니다.

[03:58] 완료되었습니다.

[04:00] 로그인되었습니다.

[04:03] 프로젝트를 읽어보는 것부터 시작하겠습니다.

[04:05] 그것부터 시작하겠습니다.

[04:07] 문서와 환경 변수들을 파악하기 위해서요.

[04:09] 이 부분은 건너뛸 수 있습니다.

[04:11] 모든 문서를 읽었다는 것을 확인할 수 있습니다.

[04:13] 클라우드 코드가 이제 작업할 준비가 되었습니다.

[04:15] 오늘 무엇을 만들지 알고 있기 때문입니다.

[04:17] 좋습니다.

[04:18] 이제 플랜 모드로 들어가겠습니다.

[04:20] Shift + Tab + Tab을 누르면

[04:23] 플랜 모드를 볼 수 있습니다.

[04:24] 이것은 우리가 환경에서 어떤 편집도 하지 않는다는 의미입니다.

[04:26] 저는 항상 플랜 모드를 사용하는 것을 좋아합니다.

[04:27] 여기서 프롬프트를 작성하겠습니다.

[04:30] 프롬프트를 읽어드릴까요?

[04:32] 아니면 건너뛰세요.

[04:35] 좋습니다.

[04:36] 다음 단계는 모듈 파이썬 프로젝트를 만드는 것입니다.

[04:38] 지난 7일 동안 조회수 기준으로

[04:40] 유튜브에서 상위 10개 짧은 형태의 콘텐츠를 찾을 것입니다.

[04:43] Google API에서 URL을 얻으면

[04:45] 이 상위 URL을 Gemini에 보내고

[04:46] 이 YouTube URL 입력 기능을 컨텍스트로 사용할 것입니다.

[04:48] 비디오와 함께 Gemini에 보낼 프롬프트는 다음과 같습니다:

[04:50] 비디오에서 모든 장면을 추출하여

[04:52] 장면과 일치하는 AI 이미지 프롬프트와 함께

[04:54] 구조화된 형식으로 만들어 주세요.

[04:57] 설명적이지만 간단한 프롬프트로 해주세요.

[05:00] 이것은 지난 7일 동안 가장 인기 있었던

[05:02] 짧은 형태의 콘텐츠를 재현하는 계획을 제공할 것입니다.

[05:04] 이 모듈 프로젝트를 위한 단계별 계획을 세워주세요.

[05:07] 이제 플랜 모드에서 이것을 실행하겠습니다.

[05:09] 훌륭한 단계별 계획을 얻을 수 있기를 바랍니다.

[05:12] 작업을 시작할 수 있습니다.

[05:14] 네.

[05:16] 코딩 준비가 되었다는 것을 확인할 수 있습니다.

[05:18] 여기 클라우드의 계획이 있습니다.

[05:19] 전체 계획이 여기 있습니다.

[05:21] 꽤 좋아 보입니다.

[05:23] 구현 단계를 볼 수 있습니다:

[05:26] YouTube 클라이언트 모듈 구축,

[05:29] Gemini 클라이언트 모듈 구축,

[05:31] 데이터 처리...

[05:32] 그리고 메인 오케스트레이터까지요.

[05:34] 완벽합니다.

[05:36] 계속 진행하시겠습니까?

[05:38] 네, 코드를 작성할 준비가 되었습니다.

[05:40] 모델들, 메인 오케스트레이터. 완벽해요. 자,

[05:44] 진행하고 싶으세요? 네, 우리는

[05:45] 코드를 작성할 준비가 되었습니다. 그러니까, 저는

[05:47] 이제 클라우드 코드를 백그라운드에서 실행하도록 하겠습니다.

[05:49] 커피를 한 잔 가져오고

[05:51] 프로젝트에서 상당히 진전이 있기를 바라며 돌아오겠습니다.

[05:54] 그리고 이 업데이트된 투두

[05:57] 리스트를 얻는 것도 좋네요. 그래서 저는

[06:00] 클라우드 코드가 투두 리스트를 완료할 때

[06:02] 바로 돌아오겠습니다.

[06:04] 좋아요, 그게 완료되었네요. 그것은

[06:06] 단지 몇 분, 2-3분

[06:08] 정도밖에 걸리지 않았습니다. 이제 우리의 프로젝트가 준비되었으니

[06:10] 이것을 시도해 볼 수 있지만 먼저

[06:12] 오늘의 스폰서에 대해 말씀드리겠습니다. 그리고 다시

[06:14] 그것은 저입니다. 저는 AI

[06:16] 비디오 코스를 가지고 있습니다. 만약 여러분이

[06:17] AI 비디오 생성에 깊이 파고들고 싶다면,

[06:19] 약간의 소극적 소득이나 단지

[06:22] 새로운 모델들과 재미있게 놀고 싶다면 말이죠. 그래서 AI 비디오

[06:25] 코스에 새로운 모듈을 추가했습니다. 그러니까

[06:27] 제 대시보드로 가면, 코스로 가면

[06:30] 우리가 오늘 새로운 모듈을 추가했다는 것을 볼 수 있습니다.

[06:32] 이것은 바이럴 AI 비디오를 위한 전략이 될 것입니다.

[06:33] 만약 여러분이 짧은 형식의 콘텐츠를 만들고 싶다면

[06:36] 수천, 수십만,

[06:38] 수백만 조회수를 얻을 수 있는 콘텐츠를 만들고 싶다면,

[06:40] 이것은 여러분을 위한 좋은 모듈입니다.

[06:42] 저는 단지 저에게 효과가 있었던 것들과

[06:44] 여러분이 이것을 여러분의 워크플로에 어떻게 적용할 수 있는지를 다룹니다.

[06:46] 그래서 네, AI 비디오 코스.com에서

[06:48] 이 매우 방대한 틈새 시장에

[06:50] 깊이 파고들고 싶다면 말입니다.

[06:54] 이제 온라인에 이런 콘텐츠가 많이 있고

[06:56] 저는 이것으로 많은 재미를 느꼈습니다.

[06:58] 그래서 네, 확인해 보세요.

[07:00] 설명란에 링크가 있습니다. 프로젝트로

[07:02] 돌아가 보겠습니다. 좋아요, 여러분이 볼 수 있는

[07:04] 첫 번째로 할 일은 pip install

[07:06] requirements를 하는 것입니다. 왜냐하면

[07:08] 그런 모듈들과 라이브러리들이 필요하기 때문입니다.

[07:10] 그래서 저는 그것을 하겠습니다.

[07:12] pip install을 했습니다. 괜찮네요.

[07:14] 다음 단계는 이제 우리의 API를 구성하는 것입니다.

[07:16] ENV 파일에서 키들을 구성해야 합니다.

[07:18] 제 ENV 파일을 루트에서 확인하겠습니다.

[07:20] 여기서 돌아가서 볼 수 있습니다.

[07:22] 여러분의 설정이 좋아 보입니다. 프로젝트가

[07:24] 실행 준비가 되었습니다.

[07:25] 이제 python run analysis.py를 할 수 있습니다.

[07:28] 그래서 저는 지금 클라우드 코드에서

[07:30] 그것을 하겠습니다.

[07:32] 실행해 보겠습니다. 왜냐하면 만약 오류가 발생한다면,

[07:35] 우리는 즉시 그것을 컨텍스트로

[07:36] 가져올 수 있기 때문입니다.

[07:38] 이것을 실행하고 싶습니다.

[07:40] 우리에게 약간의 작은 문제가 있습니다.

[07:42] 그것을 고칠 수 있는지 보겠습니다.

[07:43] 네, 임포트 경로와 그런 것들이 있습니다.

[07:45] 그래서 클라우드 코드가 자체적으로

[07:47] 수정할 수 있는지 보겠습니다.

[07:49] 이것이 훨씬 더 나아 보입니다.

[07:50] 기다려 보겠습니다.

[07:52] 여기서 어떤 종류의 응답을 받을지 보겠습니다.

[07:55] YouTube 쇼츠 분석을 시작했다고 볼 수 있습니다.

[07:56] 그것은 아마 Gemini에게 보내는 중일 것입니다.

[07:59] 작동했습니다.

[08:01] 이제 모든 데이터를 분석 결과로 추출했다고 볼 수 있습니다.

[08:04] 여기로 들어가면 이 비디오의 URL을 찾을 수 있습니다.

[08:07] 좋습니다. 조금 확대해 보겠습니다.

[08:09] 그것을 닫고 모든

[08:10] 정보가 여기에 있다는 것을 볼 수 있습니다.

[08:12] 여기에 태그들이 있고 여기에 모든 장면들이 있습니다.

[08:14] 모든 장면들이 있습니다.

[08:16] AI 프롬프트와 필요한 모든 것들이 준비되었습니다. 이제

[08:20] 이론적으로는 이것을 재현할 수 있을 것 같습니다.

[08:22] 정말 괜찮네요. 이제 당연히

[08:24] 다음 단계는 이 장면들로부터

[08:26] 이미지를 생성하는 것입니다.

[08:29] 다시 계획 모드로 돌아가서

[08:30] 이 작업을 진행하겠습니다. 다음 단계는

[08:33] 장면들로부터 이미지를 생성하는 것입니다.

[08:35] 문서를 좀 읽어보겠습니다.

[08:37] 좋습니다. 그리고 이에 대한 계획을 세워보겠습니다.

[08:39] 잘 되길 바랍니다.

[08:42] 좋습니다. 여기서 조금 바꿔보고 싶은데

[08:44] 이 비디오를 위해서 말입니다.

[08:45] 입력값들을 조정해야 합니다.

[08:47] 장면들을 압축해야 합니다. 비디오 클립도

[08:49] 5초씩 될 것이거든요. 그래서

[08:51] 34개의 장면이 필요하지 않습니다. 테스트를 위해

[08:54] 지금은 이 숏 영상을

[08:56] 5개의 장면으로 각각 5초씩 만들어

[08:58] 재현해보겠습니다. 비디오를 위해

[09:01] 조금 압축해서 진행하겠습니다.

[09:02] 하지만 이것을 실제로 구현한다면

[09:04] 최대 33개의 장면까지 만들 수 있습니다.

[09:06] 다만 비디오 제작에 시간이 오래 걸릴 뿐입니다.

[09:08] 어떤 계획을 세웠는지 한번 봅시다.

[09:10] 여기서 볼 수 있듯이

[09:11] 계획이 준비되었습니다. 이제

[09:13] 장면 선택 전략을 진행하겠습니다.

[09:16] 5개의 서로 다른 장면이 있습니다.

[09:18] 괜찮네요.

[09:20] 이제 코딩을 시작할 준비가 되었습니다.

[09:22] 네, 돌아가서

[09:24] 코드가 완성되면 다시 보여드리겠습니다.

[09:26] 좋습니다. 이제 테스트할 준비가 되었습니다.

[09:28] 실행해서 이미지 생성이

[09:30] 제대로 작동하는지 확인해보겠습니다.

[09:32] 다시 돌아왔을 때

[09:33] 이미지들이 준비되어 있기를 바랍니다.

[09:36] 그러면 클립 생성은 꽤 쉬울 것입니다.

[09:39] 완벽합니다. 완료되었네요.

[09:41] 이제 이미지 폴더로 가보면

[09:43] 이미지 1, 2, 3, 4, 5가

[09:45] 있는 것을 볼 수 있습니다.

[09:46] 좋습니다. 작동하고 있네요.

[09:50] 이제 몇 가지 빠른 수정을 해보겠습니다.

[09:53] 여기에 ID 하나가 있습니다.

[09:55] 캐릭터들이 일관성을 유지하도록 확인해야 합니다.

[09:59] 모든 설명이 모든 프롬프트에서

[10:00] 동일한 프롬프트로 유지되어야 합니다.

[10:02] 모든 프롬프트에 대해서 말이죠.

[10:04] 그것만 업데이트하면 이미지 생성기가

[10:06] 준비될 것이고 최종 부분인

[10:08] 클립 생성을 시작할 수 있습니다.

[10:11] 좋습니다. 이제 최종 단계는

[10:13] 클립을 생성하는 것입니다.

[10:15] 각 장면과 일치하는 비디오 프롬프트가

[10:17] 필요하고 이 프롬프트를

[10:19] 비디오 생성 모델로 보내겠습니다.

[10:20] 각 장면에 대해 생성한 이미지와 함께

[10:22] 보내겠습니다.

[10:24] 실행해보겠습니다. 모든 것이

[10:26] 잘 되어서 곧 테스트할 수 있기를 바랍니다.

[10:30] 완료되었습니다. 이제 테스트할 준비가 되었습니다.

[10:32] 바이럴 숏폼 콘텐츠 생성 준비 완료라고

[10:34] 나와 있네요.

[10:36] 완벽합니다. 한 가지 더 추가하고 싶은 것이

[10:38] 전체 비디오의 스타일링입니다.

[10:41] 정확히 베끼는 것이 아니라

[10:44] 그 비디오를 재현하는 것이 목표이기 때문입니다.

[10:46] 테스트를 위해 애니메이션 스타일로

[10:48] 선택해보겠습니다.

[10:51] 네, 이것을 애니메이션 출력으로

[10:52] 변경해보겠습니다.

[10:55] 바꿔보겠습니다.

[10:59] 비디오 원본 대신에 다른 형태로 바꿔볼 거예요.

[11:02] 비디오를 확인하고

[11:03] 비교해볼 거예요. 자, 그럼

[11:06] 한번 해보죠. 실행해볼게요.

[11:08] 먼저 할 일은

[11:10] API 키들을 검증하고

[11:12] 새로운 숏폼 콘텐츠를 찾아서

[11:15] 그걸 재현해보려고 해요.

[11:17] 그냥 실행시켜두고 기다려볼게요.

[11:20] 좀 시간이 걸릴 거예요.

[11:21] 이미지를 5개 생성해야 하거든요.

[11:23] 최종 비디오가 완성되면

[11:26] 다시 돌아와서 보여드릴게요.

[11:27] 자, 여기서 멈췄어요.

[11:30] 보시다시피 이제 클립들이 생겼죠?

[11:32] 전체 장면은 다 하지 않았어요.

[11:35] 그래서 여기서 얻은 장면들을

[11:37] 가져다가 놓았어요.

[11:39] 우리가 선택한 숏에서 나온 이 장면들로

[11:42] 빠르게 편집해서

[11:44] 음악과 함께 합쳐놓았어요.

[11:47] 하지만 먼저 우리가 따라해보려고 했던

[11:49] 원본 숏을 봐보죠.

[11:52] 기억하시죠? 여기에 아니메 스타일을 추가했어요.

[11:54] 자, 이거였어요. 몇 초만 봐보죠.

[12:00] 네, 의사와

[12:02] 환자들 사이에 컷이 많이 있네요.

[12:04] 자, 그럼 우리가 만든 장면들을

[12:08] 합쳐놓은 게 어떤지 봐보죠.

[12:10] 어떻게 보이는지요.

[12:15] [음악]

[12:20] 네, 완벽하진 않았죠?

[12:22] 하지만 아이디어는 얻을 수 있을 거예요.

[12:23] 어느 정도는 그 숏에서 봤던 장면들을

[12:26] 재현할 수 있었어요.

[12:27] 그게 바로 여기서 의도했던 거예요.

[12:30] 이걸 제대로 만들려면 훨씬 더 많은

[12:33] 반복 작업이 필요해요.

[12:35] 하지만 이번에 추출한 장면들만으로도

[12:37] 가치가 있다고 생각해요.

[12:39] 보시다시피 모든 게 여기 있잖아요.

[12:41] 여기서 좋은 유용한 정보를 얻었어요.

[12:43] 만약 이걸 더 확장하고 싶다면 말이죠.

[12:45] 하지만 이 자동화 프로젝트로

[12:47] 놀아보는 게 정말 재미있었고

[12:50] 할 때마다 점점 더 나아지고 있어요.

[12:51] 정말 흥미진진하고

[12:55] 몇 달 후에, 6개월 후에

[12:57] 새 버전을 만들어볼 거예요.

[12:59] 2, 3개월 후에 말이죠.

[13:01] 그때 이것과 비교해보면서

[13:03] 얼마나 발전했는지 볼 수 있을 거예요.

[13:05] 하지만 가장 중요한 건

[13:07] 여러분에게 만들 수 있는 것들에 대한

[13:09] 아이디어를 줬기를 바라요.

[13:12] 이 비디오는 여러분에게

[13:13] 만들 수 있는 것들에 대한 아이디어를 주려고

[13:16] 만든 거예요. 이런 파이프라인들을 사용해서

[13:18] 클라우드 코드 커서나 아니면

[13:21] 직접 타이핑해서 만들 수도 있어요.

[13:23] 하지만 클라우드 코드를 정말 추천해요.

[13:24] 아니면 Gemini CLI로 시작할 수도 있어요.

[13:26] 그에 대한 비디오가 있으니

[13:28] 한번 봐보세요. 지금은 무료거든요.

[13:30] Gemini CLI로 먼저 놀아보시고

[13:32] 마음에 들면

[13:34] 클라우드 코드로 업그레이드해서

[13:36] 더 깊이 들어가보세요.

[13:38] 이런 파이프라인을 더 만들고 싶다면 말이죠.

[13:40] 자, 시청해주셔서 감사합니다.

[13:42] 즐거우셨길 바라고

[13:43] 아이디어를 얻으셨길 바라요.

[13:45] 곧 다시 뵙겠습니다. 더 깊이 들어가고 싶으시면

[13:47] 제 AI 비디오 코스 링크를 확인해보세요.

[13:49] 곧 뵙겠습니다.