AI로 유튜브 콘텐츠 자동화: 도구, 비용 및 전략

채널 아이콘
Parker Rex Daily Uploads 구독자 862명

요약

이 영상에서 Parker Rex는 AI를 활용해 유튜브 콘텐츠를 자동화하는 전체 파이프라인과 전략을 공유합니다. OpenAI의 Cursor 통합 기능과 코딩 폴리글롯 성능 비교를 통해 효율적인 개발 환경을 탐구합니다. 서버리스 함수와 GCS 기반 워크플로우로 자막, 편집, 썸네일 생성 과정을 자동화하는 과정을 데모합니다. 마지막으로 GCP 서버리스와 자체 VPS 호스팅 비용을 비교 분석하며 실전 적용 팁을 제시합니다.

주요 키워드

AI 자동화 서버리스 에이전트 12팩터 앱 썸네일 생성 벡터 검색 VPS GCP Cursor Vertex AI

하이라이트

  • 🔑 OpenAI가 Cursor 에디터에 통합돼 전체 파일 코드 변경이 가능해졌습니다. 이는 Xcode 사용자에게도 큰 이점입니다.
  • ⚡️ Coding Polygot 리더보드에서 GPT-4o가 최고 성능을 보였지만 비용은 다른 모델의 10배 수준입니다.
  • 💡 프로덕션 AI 시스템은 모놀리식 에이전트 대신 모듈화된 소규모 루프와 잘 설계된 소프트웨어로 구축됩니다.
  • 🚀 GCS에 영상 파일을 드롭하면 서버리스 함수가 자막, 편집, 캡션까지 자동으로 처리합니다.
  • 🌟 Vertex AI 이미지 생성으로 첫 번째 썸네일 초안을 자동 생성하고 디스코드로 선택할 수 있습니다.
  • 📌 Looker 대시보드와 벡터 검색을 결합해 시장 트렌드와 유튜브 댓글 인사이트를 실시간으로 파악할 수 있습니다.
  • 🛠️ GCP 서버리스 함수 무료 티어로 최대 300,000회 실행이 가능하지만, VPS 호스팅($14) 대비 비용 최적화가 필요합니다.
  • 🚀 Wop 플랫폼을 통해 간단한 API 호출로 멤버십·구독 기반 앱 내 수익화를 구현할 수 있습니다.

용어 설명

서버리스 함수

서버 관리 없이 코드만 배포해 실행하는 클라우드 함수 서비스입니다.

에이전트 프레임워크

AI 모델을 도구 호출·워크플로우에 연동해 작업을 자동화하는 소프트웨어 프레임워크입니다.

12팩터 앱

Heroku에서 제안한 모듈화된 클라우드 네이티브 애플리케이션 설계 원칙입니다.

벡터 AI 검색

문서나 댓글을 임베딩(벡터)으로 변환해 의미 기반으로 검색하는 기술입니다.

GCS

Google Cloud Storage의 약자로, 대용량 파일 저장과 관리를 위한 클라우드 스토리지 서비스입니다.

Vertex AI

구글 클라우드에서 제공하는 ML·AI 모델 개발·호스팅 플랫폼입니다.

[00:00:00] 채널 소개 및 세그먼트 설명

채널 구성과 일일 업로드 방식을 소개합니다. 뉴스, Q&A, 전략 세그먼트로 구성됩니다.

Parker Rex가 자신을 소개하며, 2300만 달러에 매각된 스타트업의 기술 책임자 경험과 실패한 음악 관련 스타트업 시도를 언급합니다.
채널의 주요 콘텐츠로 AI 뉴스, 시청자 질문 답변, 그리고 자신의 전략과 프로젝트를 공유한다고 설명합니다.
[00:00:43] AI 뉴스: Cursor 통합

OpenAI가 Cursor 코드 에디터에 AI 기능을 넣은 소식을 다룹니다. 전체 파일 범위의 코드 적용이 가능합니다.

OpenAI가 Cursor를 인수하려는 소식을 전하며, 새로운 기능으로 OCR을 넘어선 코드 변경 기능이 추가되었음을 시연합니다.
구글 원탭 로그인 기능 구현 작업을 진행하면서 Cursor의 새로운 기능들을 시연하고 설명합니다.
이러한 변화가 OpenAI와 Xcode 사용자들에게 큰 이점이 될 것이라고 평가하며, 기술적 구현 방식에 대한 궁금증을 표현합니다.
OpenAI가 Cursor의 기능을 점진적으로 흡수하고 있는 상황에 대한 우려를 표명하고, Aider 폴리글랏 리더보드에 대해 소개합니다.
[00:03:21] 코딩 폴리글롯 리더보드

다양한 모델의 아키텍트·코딩 모드 성능 순위를 공유합니다. GPT-4o 성능 우수하지만 비용이 높습니다.

GPT-4 Turbo가 최고 성능을 보이지만, GPT-3.5 Turbo에 비해 10배나 비싼 비용 문제를 지적합니다.
Aider와 Klein의 혁신성을 언급하며, Cloud Code와 Codex 출시 이후 Aider의 인기 하락에 대해 설명합니다.
[00:04:17] YouTube 영상 분석 데모

Vertex AI로 자동 비디오 분석을 시도합니다. API 한계로 AI Studio로 전환해 처리합니다.

Vertex AI를 사용해 YouTube 동영상 분석 자동화 시도를 설명하고, API 제한으로 인한 어려움을 공유합니다.
[00:05:26] 프로덕션 AI 시스템 원칙

모놀리식 에이전트보다 모듈화된 루프 활용을 권장합니다. 12팩터 앱 방식의 에이전트 설계를 설명합니다.

AI Studio로 전환하여 구조화된 출력을 시도하고, 시스템 최적화를 위한 설정을 조정합니다.
실제 운영 중인 AI 시스템의 작동 방식을 이해하기 위한 광범위한 연구와 전문가 소통 경험을 공유합니다.
AI 시스템의 실제 구현 방식에 대한 통찰을 공유하며, 성공적인 AI 시스템들은 단일 에이전트가 아닌 잘 설계된 소프트웨어에 LLM 기능을 통합하는 방식으로 구축되었다고 설명합니다.
[00:06:55] 콘텐츠 자동화 파이프라인

GCS 드롭 구동 서버리스 함수로 자막·편집·캡션을 자동 생성합니다. 파이썬 함수로 후속 업로드를 자동화합니다.

5분짜리 유튜브 영상을 분석하면서 테스트를 진행하고, 87,000 토큰으로 처리를 시도합니다.
12팩터 에이전트 원칙을 소개하며, 이 내용이 해커 뉴스 첫 페이지에 올라 커뮤니티의 좋은 반응을 얻었다고 설명합니다.
SaaS 개발자들의 AI 전환 시도와 그 과정에서의 도전과제를 설명하며, 기존 도구로는 70-80% 이상의 신뢰도를 얻기 어려웠다는 경험을 공유합니다.
자연어를 API 호출로 변환하는 원칙을 설명하고, 실제 사용 사례들을 예시로 들며 시스템의 실용적인 측면을 강조합니다.
에이전트 개발 방식에 대한 논의를 시작하며, 복잡한 시스템인 Perplexity의 다양한 내장 도구들을 예시로 들어 설명합니다.
에이전트 구성 요소들(프롬프트, 인터페이스, 역할, 목표 등)과 제어 방식에 대해 상세히 설명하고, 프롬프트에 더 가까이 접근해야 하는 필요성을 강조합니다.
결정론적 접근 방식의 중요성을 설명하며, API 호출과 파이프라인 실행 등 실제 구현 방식에 대해 논의합니다.
유튜브 댓글 자동화 시스템을 예시로 들어, GPT를 활용한 댓글 분류 및 처리 방식을 설명합니다.
마케팅을 위한 생성형 AI 시스템 구축 경험을 공유하며, 구글 클라우드 스토리지를 활용한 자동화된 비디오 처리 파이프라인을 설명합니다.
[00:11:15] 썸네일 자동 생성 워크플로우

Vertex AI Image로 썸네일 초안을 제작합니다. 디스코드 메시지로 선택·업로드를 처리합니다.

비디오 처리 파이프라인의 세부 기능(전사, 자막, 편집, 후처리 등)에 대해 상세히 설명합니다.
VTT와 JSON 형식의 자막 파일을 확인하고 이를 활용한 업로드 자동화 시스템 구축 계획을 설명합니다.
이미지 생성 기능을 시연하면서 지브리 스튜디오 스타일의 오리 이미지를 성공적으로 생성합니다.
자동화된 썸네일 생성 및 선택 시스템을 구축하여 디스코드를 통한 승인 프로세스를 설명합니다.
GCP 대신 VPS를 활용한 비용 효율적인 호스팅 방안과 마케팅 자동화 시스템의 확장 가능성을 논의합니다.
[00:15:00] 마케팅 오케스트레이션

Looker 대시보드와 벡터 검색으로 시장·유튜브 댓글 트렌드를 분석합니다. 다국어 뉴스 스크래핑도 통합합니다.

뉴스 스크래핑, 번역 API, Looker 대시보드 등을 활용한 종합적인 마케팅 오케스트레이션 시스템을 소개합니다.
마케팅 데이터 시각화와 분석 도구에 대해 설명하며, 특히 관객 및 인사이트 파인더 기능을 소개합니다.
구글 트렌드와 유튜브 데이터를 분석하여 시장 동향을 파악하고, 댓글 벡터화 기능을 통해 하루 10,000건까지 처리할 수 있다고 설명합니다.
Vertex 기반 모델을 사용한 콘텐츠 생성 기능과 Performance Max 캠페인에 대해 소개합니다.
Gemini 모델의 파인튜닝과 문서 요약 기술, 웹 검색 기능에 대해 설명합니다.
구글 클라우드 웹사이트에서 다양한 AI 서비스를 검색하고 활용하는 방법을 데모로 보여줍니다.
미주리 대학교 사례를 통해 블렌디드 검색 엔진의 활용 방법과 스택 오버플로우 커스텀 임베딩 기능을 소개합니다.
Reddit에서 흥미로운 콘텐츠를 발견하고 직접 찍은 이미지를 활용한 검색 기능을 시연합니다.
뉴스 소스를 통합하고 검색할 수 있는 기능의 가치를 설명하며, 마케팅 인사이트 도구를 탐색합니다.
프로젝트 진행 상황을 공유하며, AI 통합 작업과 사용자 전환을 위한 새로운 기능 추가에 대해 설명합니다.
VPS 구축 계획을 설명하고, 사용자들의 비용 관련 질문에 대한 답변을 시작합니다.
[00:19:29] 비용 분석: GCP vs VPS

GCP 서버리스 무료 티어 및 유료 요금 구조를 살펴봅니다. VPS 호스팅($14) 대비 비용 효율성을 비교합니다.

GCP의 무료 티어와 서버리스 함수의 가격 구조를 상세히 설명하며, 실제 사용 사례별 비용을 분석합니다.
서버리스 컴퓨팅의 비용 구조를 분석하면서, 1초짜리 작업 300만 회 실행 시 월 18달러가 든다는 것을 확인했습니다.
클라우드 서비스 비교 결과, Azure와 AWS는 비슷한 가격대를 보이며, GCP는 CPU 비용으로 인해 더 높은 가격을 보여줍니다.
GCP의 높은 비용 문제를 해결하기 위해 Node.js 대신 Python 함수를 사용하는 방안을 고려하고 있습니다.
VPS와 Docker Swarm 경험이 부족한 상황에서, 하루 10,000개 작업 처리가 가능한 시스템 구축을 검토 중입니다.
[00:23:29] Q&A: Wop 앱 수익화

Wop 플랫폼으로 API 기반 멤버십·구독 모델 구축 방법을 소개합니다. 직접 사례 코드도 간략히 확인합니다.

Whop 플랫폼을 살펴보면서 네이티브 앱 개발, API 연동, 접근 권한 판매 등 다양한 기능을 확인했습니다.
학교에서 배우지 못한 실용적인 도구에 대한 감탄을 표현하며, 이 프로젝트에 약 10시간을 투자했고 오늘만 6시간을 사용했다고 설명합니다.
PRD 작업에 많은 시간을 투자한 것에 대해 언급하며, 독립적으로 작업하지 않을 때의 단점에 대해 논의합니다.
whop.com 플랫폼을 탐색하며 개발자 현황과 GitHub 저장소를 확인하고, 여러 프로젝트의 코드와 기능을 분석합니다.
안녕하세요, 저는 Parker Rex입니다. 저는
2300만 달러에 매각된 스타트업의
기술 책임자였습니다. 그 후에는
음악계의 에어비앤비를 만들어보려 했지만 실패했죠.
이 채널에서는 매일
업로드를 하면서 AI 관련 뉴스 중
이야기할 가치가 있는 것들을 공유하고 있습니다.
필터 역할을 하려고 노력하죠. 그리고
우리 채널에서 받은 질문들을
다룹니다. 일일 채널과
메인 채널이 있는데요. 그 다음에는
제가 진행 중인 전략적인 것들,
제가 만들고 있는 것들,
흥미로운 것들을 다룹니다. 사람들은 보통
몇 가지를 배워가고 재미있어 하더라고요.
피드백을 받고 나서 제 모습을 좌측 하단으로
옮겼는데, 제가 영상에서
방해가 된다는 걸 깨달았거든요. 이제
뉴스부터 시작해서, 질문도 다루고,
전략도 이야기해보겠습니다. 먼저,
OpenAI가 확실히 Cursor에 진출하고 있는데,
이게 정말 흥미롭습니다.
왜냐하면 그들이
Warp도 인수하려고 하거든요. 아마 이미
이 소식을 보셨을 텐데, 지금 사용해보니 흥미롭네요.
제가 변경이 필요한 부분이 있으면,
이제 이런 작은 기능을 슬쩍 넣기 시작했는데
여기에 이걸 넣으면서 작동하는
앗, 이걸 옮겨야겠네요.
작동하는데, 이제는 실제로
OCR을 넘어서서 변경사항을 적용할 수 있게
됐어요. 어떻게 구현했는지 모르겠지만,
잘 작동합니다. 정말 놀랍죠.
보시다시피 저는 이 엣지
함수들을 디버깅하면서 모든 사용자 역할이
제대로 되어있는지 확인하고 있어요. 역할이 많아서
제가 구글 원탭 로그인을
추가했거든요. 혹시 이전에
Xedia 같은 웹사이트에서
'Parker로 계속하기'라고 뜨는 걸
보셨다면 바로 그겁니다. 지금 그걸
엣지 함수로 설정하고 있는데
그게 제가 지금 하는 일이에요. 네,
흥미로운 점은 제가 그냥
컴패니언을 열고 '이 페이지를
개선해줘'라고 하면 어떻게 되는지 보세요.
04 미니가 실행 중입니다. 지금
추론 중이에요. Cursor를 살펴보고 있죠.
이전에는 0번 라인부터
40번 라인까지만 할 수 있었는데,
이게 그 정도였죠. 하지만 이제는 전체를
다룰 수 있어요. 자, 구현해볼까요. 감사합니다.
작동하는 걸 보세요. 멋지네요.
코드를 작성하고 있고 자동 적용이
켜져 있네요. 글쎄요. 그리고
보시면 그냥 실행돼요. 네, 이제
한 줄에 보이는 것뿐만 아니라 모든 것을 포함하죠.
어? 어디 갔지? 아,
이미 적용됐네요. 보세요,
흥미롭죠? 그냥 실행되거든요.
여기서 차이점을 볼 수 있어요.
OpenAI에게는 큰 승리죠. 하지만
Xcode 사용자들에게도 큰 승리에요.
아마 지금 이걸 정말 좋아할 거예요. 그리고
제가 그냥 되돌리기를 할 수 있다는 게 정말 대단하죠.
이게 어떻게 작동하는지 정확히 모르겠어요.
어쩌면 이 두 앱 사이에 중간자 프록시를
보면 재미있을 것 같은데, 지금은
시도해보지 않을게요. 하지만
이 코드베이스에서 어떤 부분이 모든 내용에 접근을
허용하는지 알고 싶네요.
그리고 Cursor는 이에 대해 어떻게 생각할까요?
분명히 접근을 허용하거나
이를 가능하게 했을 텐데 말이죠.
서서히 Cursor의 영역을 잠식해가는 것 같네요.
정말 이상한 일이죠. 오늘 이것을
발견했는데 언급하고 싶었어요.
다음으로, Aider 폴리글랏
리더보드에 대해 이야기하고 싶은데요,
네, 코딩 폴리글랏이 맞습니다.
여기서 볼 수 있듯이, 모델들을 architect 모드와
코딩 모드로 조합했을 때의 평가를 보여줍니다.
Architect 모드는 읽기 전용이고
코딩 모드는 실행자 역할을 합니다.
GPT-4 Turbo가 상위권에 있지만, 비용이 얼마냐면...
GPT-3.5 Turbo 프리뷰를 사용하는 것보다 약 10배나
더 비쌉니다.
꽤 말이 안 되는 상황이죠, 그렇죠?
맞아요, 정말 말도 안 됩니다.
이걸 6번 연속으로 실행해도
여전히 이기는 상황이에요.
그들이 잘했지만, 비용 면에서는
그다지 말이 안 되네요.
혹시 Aider를 모르시는 분들을 위해 설명하자면,
저는 Cursor가 따라잡기 전까지 오랫동안 Aider를 사용했어요.
Aider와 Klein은 정말 대단해요.
그들은 끊임없이 혁신을 만들어내죠.
하지만 Aider는 아마도
Cloud Code와 Codex가 나온 후에
많은 인기를 잃은 것 같아요.
저는 Codex를 전혀 사용해보지 않았는데,
혹시 Codex를 사용해보신 분이 계시다면,
어떠신지 의견을 들려주세요.
다음으로, 데모를 하나 보여드리려고 했는데요.
아이디어가 어떤 건지 빠르게 보여드리겠습니다.
만약 제가... 이걸 써야 할 것 같네요.
지금 좀 헷갈리는데요. 모델만 있으면 되나요?
한번 확인해보죠.
이걸 파악해봅시다.
제가 하고 싶은 건 Vertex에서 프롬프트를 만들어서
YouTube 동영상을 분석하고 시청한 다음
가장 좋은 포인트들을 추출하는 건데요.
Vertex 예제에서요.
이걸 실현하려면 어떻게 해야 할까요?
여기 프롬프트가 있습니다.
때로는 계획대로 되지 않죠.
이걸 여기에 두면서 기다려보죠.
아니에요, 너무 빠르네요.
수동으로 YouTube 자막을 보여줘야 하는데,
트랜스크립트가 필요하네요.
API로는 안 되나 보네요.
그건 좀 아쉽네요. AI Studio에서
할 수 있는지 봅시다. 여기선 된다는 걸 알아요.
Vertex에서 안 되는 게 이상하네요.
거기서도 할 수 있을 텐데요.
계속 창을 닫는 이유는
해결될 거라고 생각해서예요.
아, 여기 있네요. 됐어요!
방금 Vertex를 사용하려다가 실패했지만,
여기선 잘 작동하는 것 같네요.
구조화된 출력이 필요한데,
뭐, 상관없을 것 같네요.
이걸 실행해보죠.
temperature를 낮추고,
도구는 필요 없어요. 실행합니다.
백만 마크 정도에서요.
그 정도면 되겠네요. 시간이 좀 걸릴 텐데요.
꽤 시간이 걸릴 것 같아요.
여기 두고, 여러분들이
텍스트 리뷰를 너무 오래
보지 않도록 하겠습니다.
이 글을 살펴보고 싶었는데,
이건 좋을 것 같네요.
중요한 부분을 건드린 것 같아요.
실제 운영중인 AI 시스템이 어떻게 작동하는지
이해하려고 노력하면서 시작됐어요.
모든 에이전트 프레임워크를 사용해보고
많은 뛰어난 개발자들과 대화를 나눴죠.
AI로 인상적인 것들을 만드는
창업자들과 이야기를 나눠봤는데,
놀랍게도 성공적인 AI 시스템들은
'여기 프롬프트가 있고, 여기
도구들이 있습니다'라는 방식이 아닌
LLM 기능이 잘 통합된 잘 설계된
소프트웨어였습니다. 핵심은,
고품질 AI를 출시하는 기업들은
거대한 단일 에이전트를
처음부터 만들지 않는다는 거죠. 아, 생성에 실패했네요.
아쉽네요. 더 짧은 걸로 해보겠습니다.
유튜브로 가보죠. 제발,
지금 브라우저 MCP 디버깅하고
싶지 않네요. 돌아가서
이것들 중 하나를 사용해보죠.
이걸 못할 줄 알았는데.
이것도 한 시간짜리네요. 이건 어떨까요?
그래요. 만약 이것도 안되면
정말 실망스러울 것 같네요.
여기 넣고, 저기 넣고, 이건 삭제하고.
이런, 다시 해보죠. 이제 유튜브 영상에서는
아예 보이지도 않네요.
뭐죠? 진짜 버그가 많네요. 좋아요. 5분짜리
영상입니다.
제발 이건 됐으면 좋겠네요. 87,000
토큰이네요. 할 수 있을 거예요. 자, 이 사람이
에이전트에 대해 이야기했는데,
작고 집중된 LLM 루프를
통합해서 한 가지 일을 잘 하도록 만든다고 하네요.
맞아요, 제가 계속 얘기했던 거죠.
그래서 프로덕션용 LLM 애플리케이션과
12팩터 에이전트를 만들기 위한
원칙들을 정리했더니
수요일에 하루 종일 해커 뉴스
첫 페이지에 올랐고,
커뮤니티에서 좋은 토론이 있었어요.
아래 링크를 확인해보세요.
빠진 요소가 있다면 알려주세요.
자, 이제...
Heroku의 12팩터 앱의 정신을 따라서,
이건 잘 작동했네요. 좋은 데모였어요.
Heroku의 12팩터 앱처럼,
사실 저는 그게 뭔지도 몰랐어요.
12팩터라... 이 12팩터 앱이
아, 맞다. 이거 아주 오래 전에
읽었었네요. 네, 정말 오래됐죠.
많은 SaaS 개발자들이
AI로 전환하려고 시도하면서
에이전트 프레임워크로
새 프로젝트를 시작했지만
기본 도구로는 70-80% 이상의 신뢰도를
얻지 못했죠. 랭체인이 대표적이죠.
그리고 성공한 곳들은
작고 모듈화된 에이전트
개념들을 가져와서
기존 제품에 통합했더라고요.
네, 정확히 그거예요.
앱의 작은 부분들에
명확하게 정의된 작업을 처리하도록
적용하는 거죠. 첫 번째 원칙은 자연어를
도구 API 호출로 변환하는 거예요.
'파일 캐비닛 재고 보충 티켓 추가',
'이메일 스레드를 읽고 Acne Corp의 CRM 업데이트',
'내 패키지 상태는 어떻죠?'
XYZ 프로젝트를 사용하면 이점이
마법 같아요. 연락이 오면,
다음 단계를 결정하고, 데이터를 읽고 쓰죠.
이해가 되네요. 안타깝게도
우린 이걸 힘들게 깨달았어요.
새로운 것을 만들 때는
프레임워크가 쓸모없어요.
다른 창업자들에게 특정 기능에 대해 물어보면
항상 '우리가 직접 만들었다'고 하더라고요.
맞아요, 정확히. 다른 작업 제목은
'에이전트를 어렵게 만들기'가 될 것 같네요.
이게 제가 실제로 고민하는 부분인데
Perplexity를 생각해봐야 해요.
Perplexity에는 정말 많은
다양한 도구들이 내장되어 있지만
우리가 그걸 잘 인식하지 못하죠.
활성화, 소유자 프롬프트, 에이전트
인터페이스, 역할을 문자열로, 목표를 문자열로,
성격 문자열, 작업,
지시사항 문자열, 예상 출력,
기본 모델 유형. 그리고 도구들,
도구 목록, 블랙박스와 완전 제어 방식이 있죠.
네, 프롬프트에 더 가까이 가야 해요.
이게 제가 나중에 전략 파트에서
이야기하려고 했던 내용인데,
전략적인 부분에서 제가
가능한 한 프롬프트에 가깝게
직접 제어하고 싶기 때문이에요.
이 경우에는, 먼저 프롬프트로
다음 단계를 결정하고 스위치 구문으로
API를 호출할지 결정합니다. 우리는
결정론적 코드를 원하고, 데이터베이스를
업데이트하는 파이프라인을 실행할지 결정하고
최종 답변을 얻게 되죠. 반면에
이게 잘못됐을 경우에는
계속 반복하게 되는데, 이해했어요.
컨텍스트를 제공하면서 루프를 돌리는 거군요.
완전히 이해는 못했지만, 하나의 프롬프트로
이 중 하나를 수행하게 되는 거군요.
네, 이해가 되네요. 이게 바로
제가 에이전트 워크플로우에 대해
생각하는 방식이에요. 자동 답변이나
답글을 작성할 때, 유튜브 댓글을
스크래핑해서
분류할 때도 이런 방식을 사용하죠.
GPT에게 '이게 질문인가요?', '컨텍스트 기반으로
처리할 수 있는 질문인가요?'
'이건 일반 댓글인가요?'
'이건 논란의 소지가 있는 의견인가요?' 각각에 대해
읽고 파악할 수 있어요.
그리고 숫자로 분류할 수 있죠.
그래서 이런 식으로 분류하고,
꼭 숫자를 줄 필요는 없지만
N으로 할 경우에는 그렇고,
분류한 다음에 다른 기능을
호출하게 되죠. 이건 본질적으로
터보 모드의 NLP이고 그 다음에
결정론적인 작업을 원하는 거죠.
이런 접근법은 제 귀에 음악처럼 들리네요.
한동안 이것에 대해 이야기해왔는데,
전체 에이전트 모드로 해봤지만 잘 안 됐어요.
특히 의료 정보 같은 경우에는
정말 어려웠죠. 맞아요.
자, 이제 마케팅을 위한 생성형 AI를 볼까요.
이게 제게 특히 흥미로운 이유는
최근에 많은 시간을 들여
오케스트레이션 레이어를 구축하기 시작했기 때문인데요.
파인더를 열면,
우선, 이게 정말 멋진데요.
어제 보여드렸지만, GCS 뷰를 통해
구글 클라우드 버킷에 바로 접근할 수 있어요.
그리고 아이디어는 영상을 완성하자마자
여기에 바로 드롭하면 됩니다.
이건 제 테스트용인데요.
여기에 넣으면 서버리스 함수가
트리거되어 실행되고,
서비스를 호출해서 여러 가지
후처리 작업을 수행하고, 전사와
자막, 캡션 작업을 하고,
이 모든 것들을 처리하고,
소리도 좋게 만들고 편집도 합니다.
그래서 멈춤이나 불필요한
단어들을 잘라내고,
그 다음에 처리된 파일을
processed 폴더에 넣습니다.
좋네요. VTT 파일이 있는데
이건 자막이나 JSON 형식이고
그리고 이런 것들이 있네요. 꽤 괜찮습니다.
이걸로 할 수 있는 건
다른 파일, 다른 파이썬 파일로
업로드를 처리할 수 있어요. 메인 채널에
업로드하고, 데일리 채널에도
업로드할 수 있죠. 이것만으로도
엄청난 시간을 절약할 수 있어요. 이게 1단계고,
이제 2단계로 넘어가볼게요.
이미지 생성을 어떻게 활용할 수 있는지 보여드리겠습니다.
예상하셨듯이 이미지 생성인데요.
vertex imaging으로 가보죠. Gemini로 가서... 아, 여기가 아니네요.
콘솔로 들어가서, vertex로 가보겠습니다.
프롬프트 에이전트나 가든 에이전트를 만들어볼 건데
어디 있더라... 가든으로 가서
이미지 섹션으로 가면
정말 멋진 걸 사용할 수 있어요.
이걸 호출해서
원하는 대로 다양한 이미지를 만들 수 있죠.
궁금한 게 있는데,
지브리 스튜디오 스타일로
연못 속 오리를 표현해달라고 해볼게요.
될지는 모르겠지만,
한번 시도해보죠.
지브리 스타일을 할 수 있을진 모르겠네요. 어쩌면...
오, 세상에!
저 아래 이미지 보세요. 믿을 수 없네요!
완벽하네요. 정말 잘됐어요.
이걸 보니 정말 신나는데요,
첫 단계로 이걸 만들고
그 위에 다른 걸 활용해서
텍스트를 추가할 수 있거든요.
제목들을 생성하고
디스코드 웹훅으로 알림을 받을 수 있어요.
여기 제목들이 있는데
어떤 걸 원하시나요? 하고 물어보면
전 그냥 답장만 하면 되죠. 트랜스크립트 기반으로
1부터 10까지 중에서
이 모든 걸 바탕으로
골라서 보내면 되는거죠. 정말 멋지죠?
말 그대로 녹화하고,
드래그 앤 드롭하면 썸네일을 문자로 받고
원하는 걸 선택하기만 하면 됩니다.
제가 선택하면 다른 파이썬 함수가 실행되어
썸네일을 업로드하죠.
그러면 링크를 보내주면서
"모든 게 괜찮아 보이나요?"라고 물어보고
정말 멋지잖아요. 너무 신나네요.
그리고 이 시스템의 유연성이
좋은 점은 꼭
GCP일 필요는 없다는 거예요.
저는 성능 좋은 VPS가 있는데
이 모든 걸 처리할 수 있게
설정할 예정이에요. 결국
파이썬 함수들의 모음이니까요.
비용 측면에서 GCP에 호스팅하는 건
말이 안 되지만, 일단 배워보고 싶어서요.
그래서 그게 흥미로웠어요.
그리고 제가 보여드릴게 있는데
이걸 실행한 로그들이 있어요.
Google GitHub가 어디 갔더라... 아, 여기 있네요.
이게 정말 멋진 거예요. 강력하거든요.
한번 보세요. 아이디어는
마케팅 오케스트레이션을 위한
거대한 시스템을 구축하는 거예요.
뉴스 스크래핑도 할 수 있고
번역 API로 다른 지역의
뉴스도 처리할 수 있어요.
제 경우에는 그냥 읽어드릴게요.
더 쉬울 것 같네요.
Looker 대시보드를 사용해서
데이터에 접근하고 시각화할 수 있죠
마케팅 데이터에 접근하고
마케터들이 데이터 기반 의사결정을 위해
데이터를 시각화할 수 있죠. 하지만
정말 흥미로운 것은
이 관객 및 인사이트 파인더입니다.
데이터가 있을 때는 그게 아니었는데,
트렌드 스포팅이 있습니다. 구글
트렌드 데이터를 Looker 대시보드에서
분석하여 새로운 트렌드를 파악할 수 있죠.
유튜브도 마찬가지입니다.
트렌드를 확인할 수 있고,
사람들이 검색하는 시장 동향뿐만 아니라
관심사를 파악할 수 있으며
유튜브 내에서도 분석이 가능합니다.
또한 자신의 영상 댓글과
다른 영상의 댓글도 하루
최대 10,000건까지 벡터화할 수 있어요.
정말 대단하죠. 그리고 콘텐츠 검색도 있어요.
벡터 AI 검색을 사용할 수 있는데,
이건 내부용이네요. 시간을 절약하기 위해
Vertex 기반 모델을 사용해서
이메일 카피, 웹사이트 글,
소셜 미디어 포스트, Pmax용 자료를 만들 수 있습니다.
이건 뭐죠? Performance Max 캠페인이네요.
잘 모르겠네요. 구글 광고를 위한
캠페인 같아 보이네요.
하지만 이게 정말 흥미로운 부분이에요.
그리고 이건 랭체인을 사용하네요.
왜 사용하는지는 모르겠지만
이건 새로운 요약 기능이에요.
이미지 생성 파인튜닝도 있네요.
살펴봐야겠어요. Gemini를
데이터셋으로 튜닝해서 모델의 응답을
브랜드 톤앤보이스와
문서 요약 기술을 개선할 수 있습니다.
Vertex AI 웹 검색으로
문서 corpus를 검색할 수 있어요.
웹이라고 부르는 게 이해가 안 되네요.
웹 검색과
문서 검색의 차이를 모르겠어요.
안녕하세요, 제 이름은 Holt SK입니다.
클라우드 콘솔에 이미 가져온
데이터가 있는데요.
여기 몇 가지 예시가 있습니다.
예를 들어,
구글 클라우드 웹사이트가 있어요.
Vertex AI나
Vertex AI 검색 또는
Document AI 같은 것을 검색할 수 있죠.
여기 보시면,
cloud.google.com의 모든 내용이
검색 대상이 됩니다.
다른 예시들도 있어요.
위키피디아 같은 웹사이트도 있고
전체 위키피디아를 검색할 수 있는
엔진도 있어요. 미주리 대학교용도 있죠.
이건 실제로 블렌디드 엔진이라
여러 소스를 사용합니다.
미주리 대학교 서브레딧과
미주리 대학교 웹사이트 등
여러 소스를 사용하죠.
실제 미주리 대학교 웹사이트에서
'컴퓨터 과학'을 검색하면
보실 수 있습니다. 네, 여기 있네요.
이건 제가 찾고 있던
노트북인데
같은 카테고리의 고급 웹사이트 인덱싱이에요.
스택 오버플로우용도 있는데
커스텀 임베딩을 사용하고
이를 설명하는 노트북도 있어요.
웹사이트가 여기 있는데
검색해볼까요?
다시 Vertex AI를 검색하거나
탭을 검색해볼 수 있습니다.
흥미로운 Reddit 글들이 있네요.
여기 이 이미지는 제가 직접 찍은 건데,
텍스트 검색으로 나온 게 아닙니다.
이 양말 관련 검색을 해볼게요.
네, 기본적으로 뉴스 소스들을
한데 묶어서 그 안에서
정보를 찾을 수 있게 해주죠. 완전히 이해하진 못했지만
이런 기능들이 정말 가치 있다고 생각해서
이것들을 가지고 실험해보는 게 기대됩니다.
그리고 마케팅 인사이트를 위해
이걸 한번 살펴보죠.
아니네요, 이게 아닙니다.
이게 제가 앞서 언급했던
전략적인 부분과 연결되는데요.
잠깐 언급했었지만,
기본적으로 첫 단계인
이것을 완료했고,
그 다음으로 구축 중인 것들이 있는데,
AI와 함께 작업하는 것과
오늘 추가한 기능이 사용자 전환에
정말 도움이 될 거예요.
프롬프트 저장 등 모든 기능을 포함해서요.
정말 단순한 설정이에요.
제가 시간을 여러 프로젝트에
분산해서 작업했기 때문에
콘텐츠와 코드 작업을 동시에 하다 보니
예상보다 시간이 좀 더 걸렸지만,
계속 Taskmaster를 사용했어요.
그걸 계속 사용했죠.
AI와의 협업을 위해서였고요.
네, 그리고 이런 작업들을
계속 발전시켜 나가는 게 기대돼요.
제 목표는 이것을 VPS에 올리는 건데
누군가 가격에 대해 물어봤기 때문이에요.
Q&A 섹션에서 질문을 보면,
누군가 '이게 좀 과하지 않나요'라고 물었는데,
맞는 말이에요.
대략적인 비용을 공유해달라고 했죠.
GCP의 무료 티어를 사용해보면서
탐색해봤다고 하네요.
무료 티어는 약 30만 건의
서버리스 함수까지 제공되는데 꽤 많죠.
한번 볼까요. 스토리지 비용이
의외로 많이 나온다는 걸
말씀드리려고 했어요.
다른 댓글을 읽으면서 말씀드리자면
보시면, 제가 여러 사양을 입력했고
어떤 것을 원하는지 명시했어요.
한번 볼까요? GCP와
Vercel, VPS 자체 호스팅을 비교했는데
다음과 같은 사양으로 봤어요.
하루에 수천 건의 작업과
서버리스 함수들,
그리고 5-10개의 앱을
next 컨테이너, express 컨테이너,
python 컨테이너 등을 혼합해서요.
GCP가 더 우수할 것 같다고 했지만
가격 구조를 산출해달라고 했죠.
제 VPS 사양도 제시했어요.
네, 제 VPS는
8코어, 16GB RAM,
512GB SSD인데 Netcup에서 14달러에 이용 중이에요.
정말 놀라운 가격이죠. 그리고
목록을 보면 여기서부터
흥미로워져요. 컴퓨팅 수치를 보면
좀 놀랍네요. 무료 티어에서는
월 400,000 기가바이트 초를 제공하는데,
400,000 요청이 아니라는 게 웃기죠.
이게 300,000번 실행, 즉
150,000 GB 초인데, 정말 복잡하죠?
기본적으로 월 300만 실행까지는
18달러 정도 나온다고
가격이 책정되어 있어요.
이건 가격 비교표에서 나온 수치에요.
이 웹사이트를 보면... 아마도 이게 더 나을 것 같네요.
아마 덜 헷갈릴 것 같은데요.
서버리스는 솔직히 정말 복잡해요.
1초짜리 작업 300만 회는 월 18달러입니다.
1초짜리 작업이고 장기 실행이 아닌 경우에요.
하지만 제 작업 중 일부는 확실히 더 길어서,
그럴 경우 18달러 정도 나올 것 같네요.
Azure의 서버리스는 얼마일까요?
18달러네요. GCP는 25달러고요.
Azure와 AWS는 월 비용이 비슷하네요.
GB당 최저 단가로 보면,
CPU 비용 때문에 월 요금이 가장 높은 것 같아요.
알겠네요. 그렇군요.
알았습니다. 하지만 네,
제가 이해한 바로는
SSD 영구 디스크로 월 87달러를 내는 게 좀 말이 안 되죠.
올인원으로 12달러 내는 것과 비교하면요.
12.80 유로 정도인 것 같은데,
GCP가 명백히 더 비쌀 거예요.
하지만 무제한으로 확장할 수 있어서 그런 것 같아요.
그래서 어떻게 하면 비용을 줄일 수 있을지 고민했죠.
어떻게 하면 비용을 줄일 수 있을까요?
결론적으로 이렇게 말하더라고요.
"네, 확실히 더 우수하지만,
GCP에서 원하는 작업을 하려면
14달러짜리 VPS 대신 261달러가 들 거예요.
DevOps를 좀 배워야 할 것 같네요."
그래서 이걸 보고 생각했죠.
"좋아, Node.js는 모든 작업에 쓰지 않고
파이썬 함수를 쓰고,
Node.js는 필요한 곳에만 쓰자."
네, 좀 놀랍네요.
그래서 중단했어요.
Debian에서 VPS를 실행해본 적이 없고
하나의 앱으로만 VPS를 실행해봤지,
문제 발생 시를 대비한 Docker Swarm은
사용해본 적이 없거든요.
하루 10,000개의 작업을 처리할 수 있다고 하네요.
앱당 하루 3,333개의 요청을 처리할 수 있고
앱이 7개라고 했나요? 꽤 대단하네요.
네, 좀 놀랍죠.
"경험이 많지 않아서 Taras를 써봤어요."
그리고 Grok이
이런 종류의 작업에 정말 좋다는 걸 알았어요.
Grok으로 초기 설정을 하고
가능한 빨리 IDE로 전환하려고 해요.
네, 그렇습니다. 다른 질문 있나요?
계속 질문해주세요.
찾으시는 게 Whop 커뮤니티인 것 같은데,
네이티브 앱을 만들어서 내부에서 실행하고
앱을 확장할 수 있어요.
Whop 네이티브 앱이
개발자들이 앱을 판매할 수 있게 해주는지는 모르겠네요.
애플리케이션을 판매할 수 있게 해주고
웹사이트 접근 권한을 판매하는
간단하고 안전한 방법을 제공해요.
OAuth로 접근 권한을 판매하죠.
API를 확인해보세요. 소프트웨어 접근 권한도 판매할 수 있고,
Whop 앱을 만들어서 확장할 수도 있어요.
와, 이게 바로 그거네요.
앱을 만들 수 있어요. 독특한
경험 허브로 API를 연결하고
비즈니스 데이터를 작성해요. 한번 볼까요?
솔직히 꽤 멋져 보이네요.
비디오 앱이요. 좀 구리네요.
어디 보자. Neon Postgres를 만들어야 하고...
세상에, 만드는 방법 전체 가이드가 있네요.
재미있네요.
어떻게 하는지 보자... 여기 있다.
API 목록이요.
멤버십... 와. 학교에도 이런 게 있었으면 좋았을 텐데.
와우. 네, 이게 훨씬 낫네요.
플랜 목록. 체크아웃 세션 만들기.
회사 정보 검색하기.
아, 정말 대단하네요. 이건 완전한 게임 체인저예요.
학교에서는 이런 걸 전혀 가르쳐주지 않았어요.
그래서 제가 지금까지 투자한 시간이
아마도 총 10시간 정도 될 거예요.
오늘만 6시간이네요. 한번 볼까요.
모든 것들을 추가하다 보니까요.
왜 자꾸 사파리에서 열리는 거죠?
Wakatime을 보니까
AI 관련해서 약 12시간 정도
모든 준비 작업에 투자했네요.
오늘은 4시간이고... 7일 동안은 어떨까요?
14시간이네요. 믿을 수 없죠.
문제는 PRD에 너무 많은 시간을 쏟았다는 거예요.
독립적으로 하지 않으면
놓치는 것들이 많아서 문제예요.
하지만 이것도 또 다른 방법이 될 수 있죠.
웹사이트에 얼마나 많은 사람들이 있는지 봐야겠어요.
whop.com으로 가볼까요.
그전에 먼저
여기서 얼마나 많은 사람들이 개발하고 있는지 봐야겠어요.
만약 당신이 유일한 개발자이고
멋진 것들을 만든다면 좋을 것 같아요.
한번 볼까요. 이건 자바스크립트네요.
누가 개발하고 있는지 확인해봅시다.
이 GitHub 그래프를 확인해볼까요.
여기 있네요. 제로라고요?
이건... 이건 어떨까요? 아니요,
저는 이 그래프를 잘 이해하지 못하겠어요.
제로일 리가 없다고 생각하거든요.
뭔가 이상해요. 26이네요.
이 사람이 만든 건 그냥 문서 저장소네요.
이 데이터 저장소는 뭘까요?
이게 그의 도구네요. 뭔가를 출력하고,
캡처 기능이 있고, 숙제 ID를 가져오네요.
라이선스 키로 전송을 시도하고 있어요.
요청을 만들어보죠.
이건 뭘 하는 걸까요? 웹훅이네요.
이건 뭐죠? 하드웨어 ID네요.
괜찮아요. 아마도
그가 판매하는 뭔가일 거예요.
미완성인가? 이 W 제공자에 대해
뭐라고 되어있나 볼까요? 뭘 만드는 걸까요?
작동하지 않네요. 이게 뭘 하려고 한 거죠?
2년 전 스택이네요. Gratitude가 뭐죠?
아무것도 없네요. 라이선스 검증하기...
이 사람이 뭔가를 판매하는 것 같은데
이 auto FX 앱의 라이선스를 판매하나 보네요.
아니요, 그게 아니에요.
FIX를 사용한 카피 트레이딩 애플리케이션이네요.
그냥 접근 권한이에요.
멤버십이네요. 멤버십.
네, 이것들은 모두 그냥
다른 것에 대한 접근 권한을 판매하는 거예요.
SDK를 살펴볼까요?
SDK... W... 많이 있나요?
56개의 Fallout이 있네요. Discord를 볼까요.
아니, Discord... Discord는 어디 있지?
음, 오늘은 좀 두서없이 이야기했네요.
그만하는 게 좋겠어요.