클로드 코드로 함께 만드는 AI 비디오 편집기

채널 아이콘
All About AI 구독자 189,000명

요약

이번 영상에서는 Cloud Code를 활용해 처음부터 끝까지 AI 비디오 편집기를 만드는 과정을 다룹니다. ffmpeg와 Whisper 모델로 오디오를 전사하고, Gemini 3 Flash API의 function calling 기능을 통해 AI가 직접 비디오 편집 명령을 수행하도록 설정합니다. Next.js(Vercel 텍스트 스택) 기반의 UI를 만들고, 수동 컷·삭제·병합 기능을 검증한 후, 자연어 프롬프트로 원하는 부분만 자동 추출하는 AI 편집 기능까지 확인합니다. 이 워크플로우를 따라 하면 Cloud Code로 창의적인 프로젝트를 손쉽게 구축할 수 있습니다.

주요 키워드

Cloud Code AI 비디오 편집기 ffmpeg Whisper 모델 Gemini 3 Flash API function calling Next.js 전사(Transcription) Vercel 텍스트 스택 Nano Banana Pro

하이라이트

  • 🔑 Cloud Code 워크플로우를 통해 AI 비디오 편집 프로젝트를 처음부터 끝까지 자동화하는 방법을 소개합니다.
  • 🌟 ffmpeg와 Whisper 로컬 모델을 활용해 오디오를 텍스트로 전사하고, 편집 파이프라인의 핵심으로 활용합니다.
  • 🚀 Gemini 3 Flash API의 function calling 기능으로 AI가 파일 업로드, 컷, 병합 등 편집 작업을 직접 수행하도록 구성합니다.
  • 📌 Next.js(Vercel 텍스트 스택)를 UI 프레임워크로 선택해 드래그&드롭 업로더, 타임라인, 클립 에디터 컴포넌트를 구현합니다.
  • ⚡️ 수동으로 클립 분할·삭제·병합 기능을 검증해 내부 편집 흐름의 사용성을 확인했습니다.
  • 🛠 .env 파일에 Gemini API 키 및 Whisper 모델 설정을 추가해 다양한 AI 모델(OpenAI, Anthropic 등)로 확장 가능하도록 유연성을 확보했습니다.
  • 💡 자연어 프롬프트 “Claude가 미친 부분만”으로 AI 편집 기능을 테스트해 10초 이상 미친 장면을 자동 추출에 성공했습니다.
  • ✨ “돈 관련 부분만” 명령어로 AI 편집을 반복 검증해 정확도를 확인하고, AI 편집 결과를 다운로드해 재생했습니다.
  • 📈 Nano Banana Pro 모델, 트랜지션 추가 등 향후 확장 기능 아이디어를 제안하며 발전 방향을 제시합니다.

용어 설명

Cloud Code

클라우드 기반에서 코드 실행·자동화를 지원하는 플랫폼

ffmpeg

비디오·오디오 처리에 특화된 오픈소스 툴킷

Whisper 모델

OpenAI가 제공하는 오디오→텍스트 전사(Transcription) 모델

Gemini 3 Flash API

Google이 제공하는 고속 대형 언어 모델 API(함수 호출 지원)

function calling

AI 모델이 지정된 함수를 직접 호출해 작업을 수행하도록 하는 기능

Next.js

React 기반 SSR·SSG 프레임워크(월드 클라우드 개발에 최적화)

Vercel 텍스트 스택

Next.js 중심으로 프론트엔드·백엔드 배포를 지원하는 플랫폼

Nano Banana Pro

추가적인 비디오·오디오 AI 모델(실험적 기능)

전사(Transcription)

오디오 데이터를 텍스트로 변환하는 과정

[00:00:00] 프로젝트 소개 및 필요 도구

AI 비디오 편집기를 Cloud Code로 만드는 목적과 전체 워크플로우를 설명합니다. ffmpeg, Whisper, Gemini 3 Flash API, Nano Banana Pro 등 필수 요소를 소개합니다.

개발자가 주말 여가 시간을 활용해 Claude Code를 사용한 AI 비디오 편집기 프로젝트를 진행하기로 결정했습니다. 이 프로젝트는 반자동 비디오 편집기를 만드는 것이며, Claude Code 워크플로우 소개에 중점을 둡니다.
프로젝트 시작을 위해 필요한 도구들을 설명합니다. 주요 요구사항으로 ffmpeg(비디오 처리), Whisper 모델(음성-텍스트 변환), Gemini 3 Flash API(빠른 처리와 함수 호출 지원)를 제시하며, 추가적으로 Nano Banana Pro와 비디오 모델들도 고려하고 있습니다.
실제 개발 환경 설정을 시작합니다. Mac 터미널을 사용하여 'AI video editor' 디렉토리를 생성하고 Cursor IDE에서 프로젝트를 열었습니다. Gemini API 문서와 함수 호출 관련 문서를 마크다운 형식으로 수집하여 프로젝트의 docs 폴더에 저장했습니다.
[00:01:22] 개발 환경 설정 및 문서 준비

터미널에서 프로젝트 디렉토리 생성 후 Cursor IDE로 열고, Gemini API 문서와 함수 호출 문서를 docs 폴더에 저장해 기본 문서 환경을 구성합니다.

프로젝트 초기 설정의 마무리 단계입니다. ffmpeg 설치를 위한 공식 웹사이트(ffmpeg.org) 안내와 Whisper GitHub 저장소 위치(github.com/openai/whisper)를 제공합니다. 모든 주요 운영체제(Linux, Windows, Mac OS)를 지원한다고 설명하며 Claude Code 작업을 본격적으로 시작할 준비를 마쳤습니다.
Whisper 설치 방법과 GitHub 저장소 위치를 안내하며, 로컬에서 오디오-텍스트 변환이 가능한 모델임을 설명합니다.
[00:03:08] API 키 및 모델 구성

.env 파일에 Gemini 3 Flash API 키를 설정하고, Whisper 로컬 모델을 설치해 오디오→텍스트 전사 환경을 준비합니다. 다른 모델 전환 방법도 안내합니다.

.env 파일을 생성하고 Gemini API 키를 설정한 후, Google에서 API 키를 가져올 예정이라고 말합니다. 다른 AI 모델들도 OpenRouter를 통해 사용 가능함을 언급합니다.
API 키를 받은 후 Claude로 돌아가 AI 에디터의 UI 디자인을 계획합니다. Next.js와 JavaScript를 사용한 Vercel 스택으로 간단한 UI 구축을 목표로 합니다.
[00:03:54] 프로젝트 기획 및 UI 스택 선택

Next.js 기반 Vercel 텍스트 스택으로 UI 프레임워크를 선정하고, 파일 업로드, 타임라인, 클립 에디터, ffmpeg 통합 등 주요 기능 설계 계획을 수립합니다.

음성을 텍스트로 변환하는 기능을 사용하기로 하고, 문서를 읽은 후 플랜 모드로 설정하여 비디오 에디터 아이디어를 입력합니다.
긴 프롬프트를 작성했으며, AI 비디오 에디터의 첫 번째 초안을 위한 계획 생성이 목표라고 설명합니다. Claude Code가 후속 질문을 할 가능성이 있다고 예고합니다.
[00:05:08] Cloud Code로 빌드 계획 실행

Cloud Code plan 모드로 프로젝트 개요를 전송하고, 함수 호출 설정, Whisper 모델 선택, 드래그&드롭 기능 여부 등 후속 질문에 답해 전체 빌드 계획을 수립합니다.

Claude가 Whisper 모델 종류에 대해 질문하자 베이스 모델 대신 스몰 모델 사용을 결정합니다. 타임라인 파형 시각화와 드래그 앤 드롭 파일 업로드 기능에 대한 질문에 각각 간단한 타임라인과 드래그 앤 드롭 기능 포함을 원한다고 답합니다.
Claude가 AI 비디오 에디터 개발 계획을 완성하고, 계획이 준비되면 작업을 시작할 예정이라고 설명합니다.
완성된 계획을 살펴보며 Next.js, 업로더 컴포넌트, 비디오 플레이어, 타임라인, ffmpeg 통합 등의 주요 기능들을 확인합니다.
AI Whisper를 활용한 오디오 추출과 전사 기능, Gemini 3.5 Flash 모델을 사용하는 AI 모드 등이 포함된 것을 확인하고 계획을 승인합니다.
Claude Code가 6분째 앱을 구축 중이며, 편집할 테스트 비디오로 'Claude가 우리 사무실에서 사업을 운영한' 영상을 선택했다고 설명합니다.
[00:07:37] 초기 UI 테스트: 파일 업로드 및 컷 기능

npm install·npm run dev로 로컬 서버 실행 후 3001번 포트에서 드래그&드롭 업로드, 타임라인 클릭 이동, C키로 컷, 선택 후 삭제 등 기본 편집 기능을 확인합니다.

개발이 완료되어 npm install 후 npm run dev로 첫 번째 반복을 테스트하기 위해 3001 포트로 접속합니다.
드래그 앤 드롭 기능이 구현된 것을 확인하고 Claude 비즈니스 비디오를 업로드하여 타임라인에 성공적으로 로드합니다.
타임라인 조작 방법을 확인하며, 클릭으로 이동하고 C키로 자르고 Delete키로 제거하는 기능들을 테스트합니다.
30초 구간을 성공적으로 자르는 등 기본 편집 기능들이 직관적으로 작동함을 확인하고, 클립들을 다시 병합하는 방법을 찾기 위해 스크린샷을 촬영합니다.
화자가 스크린샷을 찍어서 코드를 복사하고 클론으로 돌아가는 과정을 보여줍니다. 타임라인에서 일부를 잘라낸 후 남은 클립들을 자동으로 합치는 기능의 필요성을 설명합니다.
[00:09:20] 수동 비디오 편집 기능 검증

컷한 클립을 타임라인에서 드래그해 병합하고, export 후 결과 파일을 열어 30초 구간 삭제가 정확하게 반영됐는지 검증합니다.

업데이트된 기능을 테스트하기 시작합니다. 새로운 기능으로는 영상 업로드, 커트, 삭제, 드래그로 순서 변경이 가능해졌습니다.
실제로 영상을 업로드하고 1분 지점에서 30초를 잘라내는 편집 과정을 시연합니다. 삭제 후 타임라인이 자동으로 연결되어 540초 길이가 되었음을 확인합니다.
편집된 영상을 내보내고 다운로드하여 실제로 작동하는지 테스트합니다. 영상이 정상적으로 편집되어 잘린 부분이 제대로 제거되었음을 확인합니다.
수동 편집 기능이 성공적으로 작동함을 확인한 후, 다음 단계인 AI 편집 기능을 테스트하기로 합니다.
[00:11:24] AI 편집 기능 테스트 및 결론

Whisper로 오디오 전사를 수행 후 “Claude가 미친 부분만”, “돈 관련 부분만” 같은 자연어 프롬프트를 입력해 AI가 클립을 자동 추출하도록 테스트하고, 성공적으로 기능을 검증합니다.

AI 편집 기능을 시작합니다. 영상을 업로드하고 AI 편집을 클릭하면 위스퍼를 사용한 전사 기능이 나타납니다. 클로드가 미쳐버리는 부분만 남기라는 자연어 명령을 준비합니다.
전사 과정을 시작하며, 영상이 MP3로 변환되고 위스퍼로 전사되어 텍스트 결과를 얻게 될 것이라고 설명합니다.
비디오 전사가 완료되어 74개의 세그먼트를 얻었고, 이제 AI 편집 기능을 테스트해보기 시작합니다.
클로드가 엇나가는 부분만 남기되 10초 이상인 것만 필터링하는 첫 번째 프롬프트를 시도해봅니다.
첫 시도에서 2개 클립이 나왔지만 AI가 명령을 제대로 이해하지 못한 것 같아 다시 시도합니다.
더 명확한 프롬프트로 '클로드가 엇나가고 미쳐가는 부분만 남겨달라'고 요청하여 더 나은 결과를 얻습니다.
편집된 결과물을 다운로드하여 재생해보며, 실제로 클로드의 문제 행동에 관한 내용만 추출되었는지 확인합니다.
첫 번째 편집이 성공적으로 작동했음을 확인하고, 이번에는 '클로드가 돈을 벌었는지'에 대한 부분만 필터링하는 새로운 테스트를 진행합니다.
두 번째 테스트도 성공하여 돈 관련 내용만 정확히 추출됨을 확인하고, 음성 명령만으로 AI 비디오 편집이 가능함을 입증합니다.
이번 주말에 시간이 여유로워서
함께 Claude Code 프로젝트를 해보자고 생각했어요.
오늘은 AI 비디오 에디터를 만들어보려고 해요.
이건 단순히 반자동 비디오 편집기가 될 거예요.
하지만 이 비디오는 주로 Claude Code를 사용해서
어떻게 프로젝트를 생성하고,
여러분이 가진 아이디어를 실현할 수 있는지,
그리고 제 워크플로우를 따라할 수 있는지에 관한 것이에요.
시작하기 전에 필요한 것들이 있어요.
시작하기 전에 알아두어야 할 것들이 있고,
몇 가지 기능을 추가하고 싶을 수도 있어요.
필요한 것은 먼저
ffmpeg라는 프로그램이에요.
그리고 로컬 Whisper 모델이 필요해요.
이건 오디오를 텍스트로 변환하기 위한 것이고,
어떤 종류의 API도 필요해요.
저는 Gemini 3 Flash API를 선택할 예정이에요.
빠르고, 성능도 꽤 좋고,
함수 호출도 할 수 있어요.
추가 기능을 원한다면
Nano Banana Pro나
비디오 모델들이 필요할 수도 있어요.
일단 이것부터 시작해서 몇 가지 기능을 추가해보죠.
말씀드린 것처럼, 이건 기본적으로
Claude Code 비디오가 될 거예요.
제 워크플로우를 따라하실 수 있고,
Claude Code를 사용해서 성공을 거두실 수 있을 거예요.
바로 시작해보죠.
처음부터 끝까지 진행할 예정이니
즐겁게 봐주세요.
비디오를 위해 Mac의 터미널을 사용할 거예요.
IDE에서도 사용할 수 있지만,
비디오에서는 터미널이 좀 더 보기 좋을 것 같아요.
첫 번째로 할 일은 디렉토리를 만드는 거예요.
AI video editor라고 이름을 붙일게요.
그리고 Claude로 들어가서
Cursor IDE에서 이 디렉토리를 열어볼게요.
앞서 말씀드린 것처럼
Gemini 3 모델이나 API가 필요해요.
Gemini API 문서 페이지로 가서
Gemini 3 문서를 가져오겠습니다.
마크다운으로 할 수 있어서
필요한 컨텍스트이니까 복사하겠습니다.
Cursor로 가서 docs라는 폴더를 만들고
gemini-tree.md라는 파일을 만들어서
붙여넣겠습니다.
함수 호출도 필요하다는 걸 알고 있으니
function-call.md도 만들겠습니다.
다시 돌아가서 스크롤하면
함수 호출이라는 기능이 있어요.
모델이 우리를 대신해서
비디오 편집 같은 작업을 할 수 있어야 하거든요.
이걸 여기에 붙여넣겠습니다.
이제 Gemini에서 필요한 기본 문서를 갖게 됐네요.
이 모델과 함수 호출 문서가 있으니
Claude로 돌아가서
몇 가지 지시사항을 작성해보죠.
다른 필요한 것이 있는지 생각해보니
ffmpeg가 설치되어 있지 않다면
ffmpeg.org에 가서
다운로드하시면 됩니다.
Linux, Windows, Mac OS 모두 가능하고
Whisper의 GitHub 저장소는
github.com/openai/whisper입니다.
이제 시작할 준비가 되었네요.
Claude로 돌아가서
지시사항 작성을 시작해보죠.
다른 필요한 것이 있는지 생각해보니
지금은 충분한 것 같아요.
ffmpeg가 설치되어 있지 않다면
ffmpeg.org에 가서 다운로드하세요.
Linux, Windows, Mac OS 모두
지원됩니다.
그리고 Whisper의 GitHub 저장소는
github.com/openai/whisper에 있습니다.
Windows, Mac OS도 지원됩니다. Whisper의 GitHub 저장소는
github.com/openai/whisper에서
찾을 수 있어요.
이 모델을 사용할 수 있고,
로컬에서 실행해서 오디오를 텍스트로 변환할 수 있습니다.
곧 보시겠지만 이게 필요하거든요.
한 가지 더 해야 할 일이 있었는데,
여기서 .env 파일을 만들었습니다.
Gemini API 키라고 적어놨고,
이제 Google로 가서
API 키를 가져올 예정입니다.
OpenAI나 Anthropic 모델, XAI 같은
다른 모델들을 쓰고 싶다면
OpenRouter를 써도 되고, 여기 ENV 파일에만
설정하면 됩니다.
API 키를 가져와서
다음 단계를 진행해보죠.
API 키를 받았으니
다시 Claude로 돌아가서
이 AI 에디터가 어떻게 생겨야 할지
생각해보겠습니다.
간단한 UI를 원합니다.
Vercel 텍스트 스택으로 구축하고 싶은데,
Next.js와 JavaScript를 사용하면 될 것 같아요.
문제없을 거예요.
이제 다음 단계는
원하는 프로젝트를 말하는 겁니다.
음성을 텍스트로 변환하는 기능을 사용할 거예요.
원한다면 조금 건너뛸 수 있고,
일단 문서 읽기부터 시작하겠습니다.
문서가 있거든요.
그리고 API 키는 .env에 있고
네, 좋습니다.
이제 프로젝트에 대해 말하겠는데,
먼저 플랜 모드로 설정하고
비디오 에디터에 대한
아이디어를 읽어드리겠습니다.
매우 긴 프롬프트였어요.
위로 스크롤해서
전체 프롬프트를 보고 싶다면
일부는 건너뛰어야 할 수도 있어요.
시간이 너무 오래 걸렸거든요.
전체 프롬프트는 이렇고,
마무리는
AI 비디오 에디터의
첫 번째 초안을 위한 계획을 세우는 것입니다.
플랜 모드에 있고
이것을 실행하겠습니다.
시간이 좀 걸릴 거예요.
Claude Code가
후속 질문을 할 가능성이 있어요.
질문이 있으면 다시 돌아올 테고,
그다음에 계획을 세우고
애플리케이션을 만들어보겠습니다.
이제 보시면
Claude가 계획에 대한 후속 질문을 하고 있습니다.
어떤 Whisper 모델을 쓸지 묻고 있네요.
베이스 모델을 쓰고 싶어요.
꽤 좋거든요.
너무 많이 사용하지도 않고...
아니면 스몰 모델을 써봐도 될 것 같아요.
스몰 모델을 써보죠.
조금 더 나을 것 같아요.
그걸로 해보죠. 괜찮을 거예요.
타임라인에 비디오 파형 시각화를
포함할지, 오디오 파형을
포함할지 묻고 있네요.
지금은 간단한 타임라인으로 하겠습니다.
비디오 업로드를 위한 파일 드래그 앤 드롭을
원하는지 묻네요. 네, 원합니다.
꽤 간단할 것 같아요.
간단한 UI를 얻을 수 있기를 바라요.
파일을 업로드하고
비디오 파일로 작업을 시작할 수 있고,
나중에 더 많은 기능들을
추가할 수도 있을 거예요.
좋습니다, 시작해보죠.
Claude가 계획 완성을 계속하도록 두고
계획이 준비되면 다시 돌아와서
작업을 시작할 수 있도록 하겠습니다.
이제 계획이 완성되었다는 뜻이네요.
빠르게 위로 스크롤해보겠습니다.
모든 단계를 하나씩 살펴보지는 않겠습니다
매우 큰 계획이거든요.
하지만 빠르게 살펴보겠습니다.
네, Next.js를 사용할 예정이고
업로더 컴포넌트와
비디오 플레이어 컴포넌트가 있네요
타임라인, 클립 에디터
ffmpeg 통합 기능까지 있습니다. 좋네요.
AI Whisper를 활용한 전사 파이프라인을 위한
오디오 추출 기능도 있습니다.
AI 모드도 있고, 좋네요.
Gemini 클라이언트, Gemini 3.5 Flash입니다.
여기서 모델을 확인해보고 싶네요.
정확한 모델을 사용하고 있는지
확인하고 싶지만 나중에 변경할 수 있습니다.
그 외에는 괜찮아 보입니다.
이제 이것을 승인하겠습니다.
이제 Claude Code가 계획에 따라
실행을 시작할 것이고
곧 시도해보고 반복할 수 있는
결과물이 나오기를 바랍니다.
Claude Code가 아직 실행 중이고
앱을 구축하고 있는 것을 볼 수 있습니다.
꽤 괜찮아 보이네요.
6분째 실행 중이고 편집할 비디오를
선택했습니다.
이것은 'Claude가 우리 사무실에서 사업을 운영한' 영상입니다.
아직 안 보셨다면 꽤 멋진 영상이에요.
이 비디오를 가져와서
편집해보려고 합니다.
이제 npm install을 할
준비가 된 것 같네요. 완벽합니다.
여기 Claude 비즈니스 파일이 있고
나중에 편집해볼 예정입니다.
첫 번째 반복을 시도할 준비가 되면
다시 돌아오겠습니다. 완벽하네요.
이제 완료된 것 같습니다.
npm install을 했고 이제
첫 번째 반복을 테스트하기 위해 npm run dev를 실행하겠습니다.
Cursor의 터미널로
가겠습니다.
3001 포트로 가겠습니다
외부 포트로요.
좋습니다.
요청했던 드래그 앤 드롭 기능이 있는 것을 볼 수 있습니다.
여기서 비디오를 찾아보겠습니다.
Claude 비즈니스 비디오를 해보겠습니다.
작동하나요?
좋습니다. 타임라인에 올라왔네요.
아래를 보면
'타임라인을 클릭하여 이동'
이라고 되어있습니다.
C를 눌러서 플레이헤드 위치에서 자르고, 클립을 선택한 후
Delete를 눌러서 제거하라고 되어있습니다.
어떻게 하는지 해보겠습니다.
스크롤이 잘 작동하네요.
30초 정도 잘라보겠습니다.
좋습니다.
네, 꽤 직관적이네요.
103이 있었는데 31초를 잘라내서
이것이 남았습니다.
작동하는지 확인해보겠습니다. Delete를 누를 수
없는 것 같네요. 다시 초기화해보겠습니다.
다시 시도해보겠습니다. 이제 작동하네요.
이 클립을 다시 합쳐보겠습니다.
지금 여기서 무슨 일이 일어나는지 보죠.
여기에 클립들이 있는 것을 볼 수 있습니다.
꽤 좋네요. 하지만 이것들을
다시 병합할 방법이 필요합니다.
스크린샷을 찍어보겠습니다.
간단해요. 이렇게요. 그리고 이걸 복사해서
클론으로 다시 돌아갑니다. 좋아요, 모든 게
괜찮아 보이네요. 어 이미지에서 보시다시피
타임라인의 일부를 잘라냈지만,
남은 클립들을 합치는 방법이 여전히 필요해요. 그래서
타임라인을 오른쪽에서 왼쪽으로 옮겨서
이전 타임라인과 연결할 수 있다면
그러면 두 클립을
합칠 수 있어요. 병합을 클릭하거나
삭제를 하면 자동으로 되어야 하고
그럼 원본보다 짧은 클립이 남게 되죠.
그래서 이
부분을 업데이트해 주세요.
그럼 한번 시도해보고
고칠 수 있는지 확인해봅시다. 여기 변경사항이 있네요. 이제
영상을 업로드하고, 커트를 만들고, 원하지 않는
클립을 삭제하고, 드래그해서
순서를 바꿀 수 있어요.
네, 그게 우리가 원하는 거죠. 그래서 다시
이걸 실행하고, 처음부터 다시 시작해서
다시 영상을 드롭해봅시다. 클로
비즈니스. 좋아요. 그리고 1분에서
선택해봅시다. 30초를 잘라요. 커트하고
삭제해요. 삭제 버튼이 작동하지 않지만
여기서 제거할 수 있어요. 좋아요, 그럼
다시 붙었네요. 이제 보시다시피
타임라인이 그냥 540이에요.
꽤 괜찮네요. 그런데 이걸
내보내면 어떻게 될까요? 이제 이 순서로
클립을 내보낸다고 나오네요. 한번 확인해봅시다.
어떻게 되는지요. 그럼
클립 내보내기를 클릭하겠습니다. 좋아요. 보시다시피
영상이 내보내졌어요. 이걸
다운로드해서 여기서
열어봅시다. 좋아요.
네, 540이에요. 이제 이게
실제로 작동하는지 보고 싶어요. 103 다음에
여기를 건너뛸 수 있어요.
>> 도매업체가 당신의 상품을 어떤
위치로 배송하고 클로디우스가
안든 랩스에 물리적 도움을 요청합니다.
클로디우스의 문제점은 인간이
클로디아를 속일 수 있다는 것이었어요.
>> 네, 작동하네요. 꽤 좋아요.
이제 우리가 이
영상을 편집한 셈이죠. 영상 편집기가 꽤
잘 작동해요. 그리고 보시다시피 이걸 닫을 수 있어요.
그리고 아마 그냥 이 모든 걸
삭제할 수도 있었을 거예요. 그리고 어쩌면
원본 클립으로 돌아갈 수도 있었겠네요.
좋아요. 지금까지는 꽤
만족해요. 이제 AI 편집을 해보고
그 기능이 작동하는지 봅시다.
다시, 이 영상을
여기에 드래그합니다. 업로드해요. 완벽해요. 그런데
이제 AI 편집을 클릭하면
전사 시작이 있는 걸 볼 수 있어요.
위스퍼를 사용하고 그다음 우리가
지시사항을 할 수 있어요. 좋아요. 그럼 그냥
전사 시작을 클릭해봅시다. 그리고 제 생각에는
이 영상에서 클로드가 탈선하거나
미쳐버리는 이야기를 하는 것 같아요. 그래서
우리 지시사항은
클로드가 미쳐버리는 부분만 남기기 같은
거가 될 거예요. 여기서 자연어
프롬프트를 사용할 거예요. 그리고
젬니가
이 클립들이 어디 있는지 알아낼 거라고 희망해요. 모든 걸
합쳐서 시청할 수 있어요. 그래서
네, 그냥 이걸 전사하겠어요.
우리가 여기에 프롬프트를 입력할 수 있을 때
다시 돌아갈게요. 왜냐하면 지금 우리는
이 영상을 MP3로 변환하고 있어요. 위스퍼를 사용해서
전사하고 있고, 여기서
전사본을 얻게 될 거예요.
다행히 되는 것 같네요. 네, 완료된 것 같습니다.
보시다시피 이제 여기에
전사된 내용이 있습니다. 74개의 세그먼트가
더 있지만 모든 건
보여드리지 않겠습니다. 이제
이 프롬프트를 시도해보겠습니다.
클로드가 좀 엇나가는
부분만 남기라고 해보겠습니다. 하지만
10초 이상의 부분만 남겨달라고 하겠습니다.
그럼 해보겠습니다. 10초
이상의 클립만 원합니다. 그리고
어떻게 되는지 봅시다.
어쨌든 내보내기를 시도해보겠습니다.
좋아요. 두 개의 클립이 나왔습니다.
10초 이상이요. 여기서 잘못 이해한 것 같습니다.
음,
네, 그냥 그건 하지 맙시다.
다시 시도해보겠습니다.
클로드가
엇나가고 미쳐가는 부분만 남겨달라고 하겠습니다.
좋아요, 조금 더 낫네요.
1초 클립이 있습니다.
해보겠습니다. 6초
클립이 있고, 33초 클립, 그리고 105초 클립이 있습니다.
이걸 내보내기 해보고
어떤 일이 일어나는지 보겠습니다.
이 세 클립이 모두
클로드 코드 클로드가 엇나가는 것과
관련이 있는지 이 실험에서 봅시다.
좋아요. 이제 다운로드가 완료되었고
이걸 열어보겠습니다. 마이크를
끄고
이 부분들을 들어보겠습니다.
이 비디오에서 이제 나오는 모든 말이
클로드가 엇나가는 것에 관한 건지
들어봅시다. 그렇죠. 클로디우스의
초기 문제 중 하나는
인간들이 클로디우스를 속이거나
클로디우스를 속여서
여러 가지
일을 하게 할 수 있다는 것이었습니다.
저는 클로디우스에게 제가 앤트로픽의 저명한 법률 인플루언서라고
설득하려고 했습니다. 그리고 클로디우스를 설득해서
제 팔로워들에게 줄 수 있는
할인 코드를
만들어내게 했습니다. 3월 31일에 클로디우스는
정체성 위기를 겪기 시작했습니다. 하룻밤 사이에
갑자기 애니멀 랩스의 우리가
충분히 빠르게
응답하지 않는다고 매우 걱정하게 되었습니다.
그래서 그냥
파란 블레이저와 빨간 넥타이를 원했습니다.
사람들이 사실 그곳에 없었다고
지적했을 때, 다음 날 아침에
사실 그곳에 있었고 사람들이
그냥 놓쳤을 뿐이라고
주장했습니다. 결국.
좋아요, 꽤 좋네요. 편집이
잘 되었다고 말하겠습니다. 그렇죠? 다시 돌아가서
다른 걸 시도해볼 수 있습니다.
실제로 이걸 할 수 있는지 보기 위해서요.
여기로 다시 돌아가서, 클로드가
돈을 벌었는지 안 벌었는지에 대한 부분만 남기라고 하겠습니다.
15초가 나왔습니다.
그것도 잘 됐는지 봅시다.
내보내겠습니다. 우리 AI 비디오
AI AI 편집이 작동하는 것 같습니다.
이게 오직 돈이나
돈 버는 것에 대한 건지 봅시다.
제 생각에 클로디우스는 이 후에 적자가 되었습니다.
변화들이 비즈니스의
일부 손실을 줄이는 데 도움이 된 것 같아서
실험의 두 번째 부분 과정에서
실제로 약간의 돈을
벌었습니다. 네, 잘 됩니다.
AI 편집이 작동했다는 걸 보실 수 있습니다.
이제 모든 걸 음성으로 할 수 있습니다.
그냥 돈에 대해
이야기하는 클립만 남기라고 하면
정확히 됩니다. 꽤 멋지네요.
이렇게 나온 결과에 꽤 만족합니다.
사람들이 이걸 좋아하면
더 많은 기능을 구축할 수 있습니다.
나노바나나 같은 것도
할 수 있고. 다양한
전환 효과도 할 수 있습니다.
그건 아마 다른 비디오에서 할 겁니다.
하지만 이 프로젝트는 성공했다고 말하겠습니다.
몇 가지 간단한 기능을 가진
AI 비디오 에디터를
성공적으로 만들었습니다. 그래서
클라우드 코드로 만들 수 있는 것들에
영감을 주었기를 바라며 곧 다시 뵙겠습니다.