[00:00]
좋아요. 오늘은 여러분만의 자율적인 AI
[00:01]
영상 에이전트를 만드는 방법을 보여드리겠습니다.
[00:03]
여기서 보시는 것은 오늘 우리가 따를
[00:06]
대략적인 로직입니다.
[00:08]
지금 이 로직을 설명하고 나서
[00:10]
클라우드 코드로 넘어가겠습니다.
[00:11]
컨텍스트를 수집하고,
[00:12]
직접 설정하는 방법을 보여드리겠습니다.
[00:14]
결과가 꽤 좋아지고 있다고 생각합니다.
[00:17]
정말 흥미진진합니다.
[00:19]
그럼 오늘 만들고자 하는 것의 로직을 살펴보겠습니다.
[00:22]
첫 번째로 필요한 것은 당연히
[00:24]
YouTube API입니다.
[00:25]
이 에이전트가 지난 7일간
[00:27]
가장 많이 본 쇼츠를 찾아야 하기 때문입니다.
[00:30]
그래서 우리가 재현하거나
[00:33]
모방할 수 있는 것을 찾는 거죠.
[00:35]
API를 사용하면 이런 쇼츠를 찾을 수 있고
[00:38]
URL을 가져올 수 있습니다.
[00:40]
Gemini 2.5 Pro는 실제로
[00:43]
입력 YouTube URL을 컨텍스트로 사용할 수 있습니다.
[00:47]
이것은 매우 중요합니다. 우리가 이
[00:50]
인기 있는 YouTube 영상에서
[00:52]
장면을 추출하고 싶기 때문입니다.
[00:55]
다음은 새로운 이미지와
[00:56]
비디오 프롬프트를 작성하는 것입니다.
[00:59]
장면 설명을 얻으면
[01:00]
이미지를 생성하여
[01:03]
Kling 2.1 모델의 입력 컨텍스트로
[01:05]
사용함으로써 이를 재현할 수 있습니다.
[01:08]
이미지 생성을 위해서는
[01:10]
구글의 Imagen 4를 사용하겠습니다.
[01:12]
이 두 모델은 꽤 좋고
[01:15]
비용도 저렴하지 않습니다.
[01:17]
말씀드린 대로 입력 컨텍스트로
[01:20]
사용할 이미지를 생성합니다.
[01:21]
프롬프트로부터 이것을 생성합니다.
[01:24]
마지막으로 생성할 수 있는 클립은
[01:27]
우리가 생성한 이미지와 프롬프트로
[01:31]
Kling 모델을 사용합니다.
[01:32]
이것이 기본적인 설정과 로직입니다.
[01:36]
다음에 할 것은
[01:38]
컨텍스트를 수집하는 것입니다.
[01:40]
그런 다음 클라우드 코드로 들어가서
[01:42]
이것을 실행하고 잘 되기를 바라며
[01:44]
흥미로운 결과를 얻겠습니다.
[01:46]
컨텍스트 엔지니어링을 할 때
[01:48]
이를 잘 수행하는 것이
[01:49]
매우 중요하다고 생각합니다.
[01:50]
코드 생성 과정이 매우 순조롭게 진행되도록 말입니다.
[01:53]
여기 fal에서 정보를 수집하겠습니다.
[01:55]
Kling과 Imagen 모델
[01:56]
둘 다에서 말입니다.
[01:59]
비디오 이해를 위한
[02:01]
Gemini의 컨텍스트와
[02:03]
구글의 컨텍스트가 필요합니다.
[02:06]
여기서 시작해보겠습니다.
[02:08]
Gemini에서 말입니다. 여기에
[02:11]
비디오 이해라는 것이 있습니다.
[02:13]
이것이 우리가 필요한 문서입니다.
[02:16]
아래로 스크롤하면
[02:17]
YouTube URL 포함이라는
[02:20]
항목이 있습니다. 이런 것이 필요합니다.
[02:23]
Python으로 할 것 같습니다.
[02:24]
그래서 이것을 복사하겠습니다.
[02:27]
원한다면 전체 페이지를
[02:29]
그냥 가져올 수도 있습니다.
[02:31]
크게 중요하지 않지만 이걸 가져오겠습니다.
[02:33]
Gemini 마크다운 파일에 붙여넣었습니다.
[02:36]
이제 입력과 장면 설명
[02:39]
API를 위한 설정이 완료된 것 같습니다.
[02:43]
다음으로 YouTube에서
[02:45]
뭔가를 가져오고 싶습니다. 관련된
[02:48]
YouTube 데이터 API 참조를 찾았습니다.
[02:50]
그것은 videos와 list입니다.
[02:53]
전체 페이지를 복사해서 우리 작업에 붙여넣었습니다.
[02:56]
파일 모델들도 같은 방식으로 작업할 거예요.
[02:59]
완료했습니다.
[03:01]
다시 반복하고 싶으시면,
[03:03]
Claude 2.5 v12 프로로 가서
[03:05]
표준 이미지에서 이미지로, 비디오에서 이미지로, 비디오로 변환하는 기능을 확인할 수 있습니다.
[03:10]
여기서 API를 클릭하면
[03:13]
아래쪽에 문서를 찾을 수 있습니다.
[03:15]
맞죠?
[03:18]
그래서 그걸 복사해서 여기에 붙여넣었습니다.
[03:21]
이제 모델에서 필요한 모든 문서를 갖추었다고 생각합니다.
[03:23]
준비가 완료되었습니다.
[03:25]
클라우드 코드를 실행하기 전에 몇 가지 더 수집해야 할 것들이 있습니다.
[03:28]
바로 API 키들입니다.
[03:31]
YouTube API 키,
[03:33]
Gemini API 키,
[03:35]
그리고 비디오와 이미지를 생성하기 위한 Foul AI API 키가 필요합니다.
[03:38]
YouTube API 키는 Google Cloud 콘솔에서 찾을 수 있습니다.
[03:41]
Gemini API도 마찬가지입니다.
[03:44]
이것들을 수집하고 나면 준비가 완료됩니다.
[03:47]
지금 그 작업을 하겠습니다.
[03:50]
네, 그렇게 하겠습니다.
[03:52]
좋습니다. 이제 준비가 끝났습니다.
[03:55]
터미널에서 작업하겠습니다.
[03:57]
클라우드를 실행하고 로그인하겠습니다.
[03:58]
완료되었습니다.
[04:00]
로그인되었습니다.
[04:03]
프로젝트를 읽어보는 것부터 시작하겠습니다.
[04:05]
그것부터 시작하겠습니다.
[04:07]
문서와 환경 변수들을 파악하기 위해서요.
[04:09]
이 부분은 건너뛸 수 있습니다.
[04:11]
모든 문서를 읽었다는 것을 확인할 수 있습니다.
[04:13]
클라우드 코드가 이제 작업할 준비가 되었습니다.
[04:15]
오늘 무엇을 만들지 알고 있기 때문입니다.
[04:17]
좋습니다.
[04:18]
이제 플랜 모드로 들어가겠습니다.
[04:20]
Shift + Tab + Tab을 누르면
[04:23]
플랜 모드를 볼 수 있습니다.
[04:24]
이것은 우리가 환경에서 어떤 편집도 하지 않는다는 의미입니다.
[04:26]
저는 항상 플랜 모드를 사용하는 것을 좋아합니다.
[04:27]
여기서 프롬프트를 작성하겠습니다.
[04:30]
프롬프트를 읽어드릴까요?
[04:32]
아니면 건너뛰세요.
[04:35]
좋습니다.
[04:36]
다음 단계는 모듈 파이썬 프로젝트를 만드는 것입니다.
[04:38]
지난 7일 동안 조회수 기준으로
[04:40]
유튜브에서 상위 10개 짧은 형태의 콘텐츠를 찾을 것입니다.
[04:43]
Google API에서 URL을 얻으면
[04:45]
이 상위 URL을 Gemini에 보내고
[04:46]
이 YouTube URL 입력 기능을 컨텍스트로 사용할 것입니다.
[04:48]
비디오와 함께 Gemini에 보낼 프롬프트는 다음과 같습니다:
[04:50]
비디오에서 모든 장면을 추출하여
[04:52]
장면과 일치하는 AI 이미지 프롬프트와 함께
[04:54]
구조화된 형식으로 만들어 주세요.
[04:57]
설명적이지만 간단한 프롬프트로 해주세요.
[05:00]
이것은 지난 7일 동안 가장 인기 있었던
[05:02]
짧은 형태의 콘텐츠를 재현하는 계획을 제공할 것입니다.
[05:04]
이 모듈 프로젝트를 위한 단계별 계획을 세워주세요.
[05:07]
이제 플랜 모드에서 이것을 실행하겠습니다.
[05:09]
훌륭한 단계별 계획을 얻을 수 있기를 바랍니다.
[05:12]
작업을 시작할 수 있습니다.
[05:14]
네.
[05:16]
코딩 준비가 되었다는 것을 확인할 수 있습니다.
[05:18]
여기 클라우드의 계획이 있습니다.
[05:19]
전체 계획이 여기 있습니다.
[05:21]
꽤 좋아 보입니다.
[05:23]
구현 단계를 볼 수 있습니다:
[05:26]
YouTube 클라이언트 모듈 구축,
[05:29]
Gemini 클라이언트 모듈 구축,
[05:31]
데이터 처리...
[05:32]
그리고 메인 오케스트레이터까지요.
[05:34]
완벽합니다.
[05:36]
계속 진행하시겠습니까?
[05:38]
네, 코드를 작성할 준비가 되었습니다.
[05:40]
모델들, 메인 오케스트레이터. 완벽해요. 자,
[05:44]
진행하고 싶으세요? 네, 우리는
[05:45]
코드를 작성할 준비가 되었습니다. 그러니까, 저는
[05:47]
이제 클라우드 코드를 백그라운드에서 실행하도록 하겠습니다.
[05:49]
커피를 한 잔 가져오고
[05:51]
프로젝트에서 상당히 진전이 있기를 바라며 돌아오겠습니다.
[05:54]
그리고 이 업데이트된 투두
[05:57]
리스트를 얻는 것도 좋네요. 그래서 저는
[06:00]
클라우드 코드가 투두 리스트를 완료할 때
[06:02]
바로 돌아오겠습니다.
[06:04]
좋아요, 그게 완료되었네요. 그것은
[06:06]
단지 몇 분, 2-3분
[06:08]
정도밖에 걸리지 않았습니다. 이제 우리의 프로젝트가 준비되었으니
[06:10]
이것을 시도해 볼 수 있지만 먼저
[06:12]
오늘의 스폰서에 대해 말씀드리겠습니다. 그리고 다시
[06:14]
그것은 저입니다. 저는 AI
[06:16]
비디오 코스를 가지고 있습니다. 만약 여러분이
[06:17]
AI 비디오 생성에 깊이 파고들고 싶다면,
[06:19]
약간의 소극적 소득이나 단지
[06:22]
새로운 모델들과 재미있게 놀고 싶다면 말이죠. 그래서 AI 비디오
[06:25]
코스에 새로운 모듈을 추가했습니다. 그러니까
[06:27]
제 대시보드로 가면, 코스로 가면
[06:30]
우리가 오늘 새로운 모듈을 추가했다는 것을 볼 수 있습니다.
[06:32]
이것은 바이럴 AI 비디오를 위한 전략이 될 것입니다.
[06:33]
만약 여러분이 짧은 형식의 콘텐츠를 만들고 싶다면
[06:36]
수천, 수십만,
[06:38]
수백만 조회수를 얻을 수 있는 콘텐츠를 만들고 싶다면,
[06:40]
이것은 여러분을 위한 좋은 모듈입니다.
[06:42]
저는 단지 저에게 효과가 있었던 것들과
[06:44]
여러분이 이것을 여러분의 워크플로에 어떻게 적용할 수 있는지를 다룹니다.
[06:46]
그래서 네, AI 비디오 코스.com에서
[06:48]
이 매우 방대한 틈새 시장에
[06:50]
깊이 파고들고 싶다면 말입니다.
[06:54]
이제 온라인에 이런 콘텐츠가 많이 있고
[06:56]
저는 이것으로 많은 재미를 느꼈습니다.
[06:58]
그래서 네, 확인해 보세요.
[07:00]
설명란에 링크가 있습니다. 프로젝트로
[07:02]
돌아가 보겠습니다. 좋아요, 여러분이 볼 수 있는
[07:04]
첫 번째로 할 일은 pip install
[07:06]
requirements를 하는 것입니다. 왜냐하면
[07:08]
그런 모듈들과 라이브러리들이 필요하기 때문입니다.
[07:10]
그래서 저는 그것을 하겠습니다.
[07:12]
pip install을 했습니다. 괜찮네요.
[07:14]
다음 단계는 이제 우리의 API를 구성하는 것입니다.
[07:16]
ENV 파일에서 키들을 구성해야 합니다.
[07:18]
제 ENV 파일을 루트에서 확인하겠습니다.
[07:20]
여기서 돌아가서 볼 수 있습니다.
[07:22]
여러분의 설정이 좋아 보입니다. 프로젝트가
[07:24]
실행 준비가 되었습니다.
[07:25]
이제 python run analysis.py를 할 수 있습니다.
[07:28]
그래서 저는 지금 클라우드 코드에서
[07:30]
그것을 하겠습니다.
[07:32]
실행해 보겠습니다. 왜냐하면 만약 오류가 발생한다면,
[07:35]
우리는 즉시 그것을 컨텍스트로
[07:36]
가져올 수 있기 때문입니다.
[07:38]
이것을 실행하고 싶습니다.
[07:40]
우리에게 약간의 작은 문제가 있습니다.
[07:42]
그것을 고칠 수 있는지 보겠습니다.
[07:43]
네, 임포트 경로와 그런 것들이 있습니다.
[07:45]
그래서 클라우드 코드가 자체적으로
[07:47]
수정할 수 있는지 보겠습니다.
[07:49]
이것이 훨씬 더 나아 보입니다.
[07:50]
기다려 보겠습니다.
[07:52]
여기서 어떤 종류의 응답을 받을지 보겠습니다.
[07:55]
YouTube 쇼츠 분석을 시작했다고 볼 수 있습니다.
[07:56]
그것은 아마 Gemini에게 보내는 중일 것입니다.
[07:59]
작동했습니다.
[08:01]
이제 모든 데이터를 분석 결과로 추출했다고 볼 수 있습니다.
[08:04]
여기로 들어가면 이 비디오의 URL을 찾을 수 있습니다.
[08:07]
좋습니다. 조금 확대해 보겠습니다.
[08:09]
그것을 닫고 모든
[08:10]
정보가 여기에 있다는 것을 볼 수 있습니다.
[08:12]
여기에 태그들이 있고 여기에 모든 장면들이 있습니다.
[08:14]
모든 장면들이 있습니다.
[08:16]
AI 프롬프트와 필요한 모든 것들이 준비되었습니다. 이제
[08:20]
이론적으로는 이것을 재현할 수 있을 것 같습니다.
[08:22]
정말 괜찮네요. 이제 당연히
[08:24]
다음 단계는 이 장면들로부터
[08:26]
이미지를 생성하는 것입니다.
[08:29]
다시 계획 모드로 돌아가서
[08:30]
이 작업을 진행하겠습니다. 다음 단계는
[08:33]
장면들로부터 이미지를 생성하는 것입니다.
[08:35]
문서를 좀 읽어보겠습니다.
[08:37]
좋습니다. 그리고 이에 대한 계획을 세워보겠습니다.
[08:39]
잘 되길 바랍니다.
[08:42]
좋습니다. 여기서 조금 바꿔보고 싶은데
[08:44]
이 비디오를 위해서 말입니다.
[08:45]
입력값들을 조정해야 합니다.
[08:47]
장면들을 압축해야 합니다. 비디오 클립도
[08:49]
5초씩 될 것이거든요. 그래서
[08:51]
34개의 장면이 필요하지 않습니다. 테스트를 위해
[08:54]
지금은 이 숏 영상을
[08:56]
5개의 장면으로 각각 5초씩 만들어
[08:58]
재현해보겠습니다. 비디오를 위해
[09:01]
조금 압축해서 진행하겠습니다.
[09:02]
하지만 이것을 실제로 구현한다면
[09:04]
최대 33개의 장면까지 만들 수 있습니다.
[09:06]
다만 비디오 제작에 시간이 오래 걸릴 뿐입니다.
[09:08]
어떤 계획을 세웠는지 한번 봅시다.
[09:10]
여기서 볼 수 있듯이
[09:11]
계획이 준비되었습니다. 이제
[09:13]
장면 선택 전략을 진행하겠습니다.
[09:16]
5개의 서로 다른 장면이 있습니다.
[09:18]
괜찮네요.
[09:20]
이제 코딩을 시작할 준비가 되었습니다.
[09:22]
네, 돌아가서
[09:24]
코드가 완성되면 다시 보여드리겠습니다.
[09:26]
좋습니다. 이제 테스트할 준비가 되었습니다.
[09:28]
실행해서 이미지 생성이
[09:30]
제대로 작동하는지 확인해보겠습니다.
[09:32]
다시 돌아왔을 때
[09:33]
이미지들이 준비되어 있기를 바랍니다.
[09:36]
그러면 클립 생성은 꽤 쉬울 것입니다.
[09:39]
완벽합니다. 완료되었네요.
[09:41]
이제 이미지 폴더로 가보면
[09:43]
이미지 1, 2, 3, 4, 5가
[09:45]
있는 것을 볼 수 있습니다.
[09:46]
좋습니다. 작동하고 있네요.
[09:50]
이제 몇 가지 빠른 수정을 해보겠습니다.
[09:53]
여기에 ID 하나가 있습니다.
[09:55]
캐릭터들이 일관성을 유지하도록 확인해야 합니다.
[09:59]
모든 설명이 모든 프롬프트에서
[10:00]
동일한 프롬프트로 유지되어야 합니다.
[10:02]
모든 프롬프트에 대해서 말이죠.
[10:04]
그것만 업데이트하면 이미지 생성기가
[10:06]
준비될 것이고 최종 부분인
[10:08]
클립 생성을 시작할 수 있습니다.
[10:11]
좋습니다. 이제 최종 단계는
[10:13]
클립을 생성하는 것입니다.
[10:15]
각 장면과 일치하는 비디오 프롬프트가
[10:17]
필요하고 이 프롬프트를
[10:19]
비디오 생성 모델로 보내겠습니다.
[10:20]
각 장면에 대해 생성한 이미지와 함께
[10:22]
보내겠습니다.
[10:24]
실행해보겠습니다. 모든 것이
[10:26]
잘 되어서 곧 테스트할 수 있기를 바랍니다.
[10:30]
완료되었습니다. 이제 테스트할 준비가 되었습니다.
[10:32]
바이럴 숏폼 콘텐츠 생성 준비 완료라고
[10:34]
나와 있네요.
[10:36]
완벽합니다. 한 가지 더 추가하고 싶은 것이
[10:38]
전체 비디오의 스타일링입니다.
[10:41]
정확히 베끼는 것이 아니라
[10:44]
그 비디오를 재현하는 것이 목표이기 때문입니다.
[10:46]
테스트를 위해 애니메이션 스타일로
[10:48]
선택해보겠습니다.
[10:51]
네, 이것을 애니메이션 출력으로
[10:52]
변경해보겠습니다.
[10:55]
바꿔보겠습니다.
[10:59]
비디오 원본 대신에 다른 형태로 바꿔볼 거예요.
[11:02]
비디오를 확인하고
[11:03]
비교해볼 거예요. 자, 그럼
[11:06]
한번 해보죠. 실행해볼게요.
[11:08]
먼저 할 일은
[11:10]
API 키들을 검증하고
[11:12]
새로운 숏폼 콘텐츠를 찾아서
[11:15]
그걸 재현해보려고 해요.
[11:17]
그냥 실행시켜두고 기다려볼게요.
[11:20]
좀 시간이 걸릴 거예요.
[11:21]
이미지를 5개 생성해야 하거든요.
[11:23]
최종 비디오가 완성되면
[11:26]
다시 돌아와서 보여드릴게요.
[11:27]
자, 여기서 멈췄어요.
[11:30]
보시다시피 이제 클립들이 생겼죠?
[11:32]
전체 장면은 다 하지 않았어요.
[11:35]
그래서 여기서 얻은 장면들을
[11:37]
가져다가 놓았어요.
[11:39]
우리가 선택한 숏에서 나온 이 장면들로
[11:42]
빠르게 편집해서
[11:44]
음악과 함께 합쳐놓았어요.
[11:47]
하지만 먼저 우리가 따라해보려고 했던
[11:49]
원본 숏을 봐보죠.
[11:52]
기억하시죠? 여기에 아니메 스타일을 추가했어요.
[11:54]
자, 이거였어요. 몇 초만 봐보죠.
[12:00]
네, 의사와
[12:02]
환자들 사이에 컷이 많이 있네요.
[12:04]
자, 그럼 우리가 만든 장면들을
[12:08]
합쳐놓은 게 어떤지 봐보죠.
[12:10]
어떻게 보이는지요.
[12:15]
[음악]
[12:20]
네, 완벽하진 않았죠?
[12:22]
하지만 아이디어는 얻을 수 있을 거예요.
[12:23]
어느 정도는 그 숏에서 봤던 장면들을
[12:26]
재현할 수 있었어요.
[12:27]
그게 바로 여기서 의도했던 거예요.
[12:30]
이걸 제대로 만들려면 훨씬 더 많은
[12:33]
반복 작업이 필요해요.
[12:35]
하지만 이번에 추출한 장면들만으로도
[12:37]
가치가 있다고 생각해요.
[12:39]
보시다시피 모든 게 여기 있잖아요.
[12:41]
여기서 좋은 유용한 정보를 얻었어요.
[12:43]
만약 이걸 더 확장하고 싶다면 말이죠.
[12:45]
하지만 이 자동화 프로젝트로
[12:47]
놀아보는 게 정말 재미있었고
[12:50]
할 때마다 점점 더 나아지고 있어요.
[12:51]
정말 흥미진진하고
[12:55]
몇 달 후에, 6개월 후에
[12:57]
새 버전을 만들어볼 거예요.
[12:59]
2, 3개월 후에 말이죠.
[13:01]
그때 이것과 비교해보면서
[13:03]
얼마나 발전했는지 볼 수 있을 거예요.
[13:05]
하지만 가장 중요한 건
[13:07]
여러분에게 만들 수 있는 것들에 대한
[13:09]
아이디어를 줬기를 바라요.
[13:12]
이 비디오는 여러분에게
[13:13]
만들 수 있는 것들에 대한 아이디어를 주려고
[13:16]
만든 거예요. 이런 파이프라인들을 사용해서
[13:18]
클라우드 코드 커서나 아니면
[13:21]
직접 타이핑해서 만들 수도 있어요.
[13:23]
하지만 클라우드 코드를 정말 추천해요.
[13:24]
아니면 Gemini CLI로 시작할 수도 있어요.
[13:26]
그에 대한 비디오가 있으니
[13:28]
한번 봐보세요. 지금은 무료거든요.
[13:30]
Gemini CLI로 먼저 놀아보시고
[13:32]
마음에 들면
[13:34]
클라우드 코드로 업그레이드해서
[13:36]
더 깊이 들어가보세요.
[13:38]
이런 파이프라인을 더 만들고 싶다면 말이죠.
[13:40]
자, 시청해주셔서 감사합니다.
[13:42]
즐거우셨길 바라고
[13:43]
아이디어를 얻으셨길 바라요.
[13:45]
곧 다시 뵙겠습니다. 더 깊이 들어가고 싶으시면
[13:47]
제 AI 비디오 코스 링크를 확인해보세요.
[13:49]
곧 뵙겠습니다.