72시간 전문가 패널에서 얻은 AI 에이전트 인사이트

채널 아이콘
Tina Huang 구독자 835,000명

요약

이 영상은 72시간에 걸친 전문가 패널과 워크숍에서 얻은 AI 에이전트의 핵심 인사이트를 짧게 정리합니다. 먼저 대기업의 AI 통합 현황과 함께, 성장 기회가 가장 큰 수직형(vertical) AI 에이전트 시장을 집중 조명합니다. 이어서 프롬프트 엔지니어링과 Evals 작성이 AI 에이전트 개발의 필수 스킬임을 강조하고, 에이전트 엔지니어(Agent Engineer)라는 새로운 역할의 필요성을 제시합니다. 마지막으로 업무 자동화 프레임워크와 음성 에이전트, 코딩 학습 등 미래 트렌드를 제시하여 실질적인 실행 가이드를 제공합니다.

주요 키워드

Vertical AI Agents Prompt Engineering Evals Agent Engineer Workflow Automation Claude Opus 4 Sonnet 4 Generative AI Models Voice Agents Domain Knowledge

하이라이트

  • 🔑 주요 기업들은 2025년부터 자사 제품 전반에 에이전트형 AI 기능을 통합할 계획을 발표했습니다.
  • 🚀 스타트업이 집중해야 할 기회는 특정 산업·기능에 최적화된 ‘수직형 AI 에이전트’ 시장입니다.
  • ⚡️ 프롬프트 엔지니어링은 단일 프롬프트에서 명확성·유연성을 조율해 에이전트의 자율성을 극대화하는 핵심 스킬입니다.
  • 🌟 Evals 작성으로 과제 완료, 계획 수립, 도구 사용 정확도, 견고성, 지연 시간 등 다각도로 에이전트 성능을 체계적으로 측정·개선할 수 있습니다.
  • 📌 Agent Engineer 역할은 프롬프트, 전통 엔지니어링, 제품 기획, 머신러닝 역량을 결합해 안정적인 에이전트 시스템을 구축하는 차세대 직무입니다.
  • 💡 업무 자동화는 관찰→분해→흐름 매핑→프로토타입→평가·반복 5단계를 통해 효율적으로 진행할 수 있습니다.
  • 🎯 음성 에이전트는 사용자 경험을 획기적으로 개선할 수 있는 주목할 미래 기술입니다.
  • 👩‍💻 Anthropic의 Claude Opus 4와 Sonnet 4는 장기 복합 작업에서 뛰어난 성능과 비용·속도 균형을 보여줍니다.

용어 설명

AI Agent

자율적으로 특정 목표를 위해 작업을 수행하는 인공지능 시스템

Vertical AI Agent

특정 산업과 업무 기능에 특화된 AI 에이전트로, 수직형 시장을 공략

Prompt Engineering

생성형 AI 모델에 입력 지시문을 설계·최적화하는 과정

Evals

AI 에이전트의 성능을 구조화하여 평가하는 테스트 및 지표

Agent Engineer

AI 에이전트 설계·구축·운영을 담당하며, 프롬프트·공학·제품·ML 역량을 결합한 역할

Vertical SaaS (수직형 SaaS)

특정 산업·기능에 집중한 B2B 소프트웨어 서비스 모델

Generative AI Model

텍스트·코드·이미지 등 콘텐츠를 생성할 수 있는 AI 모델

Non-determinism (비결정론)

AI 에이전트가 동일한 입력에 대해 유연하고 다양한 행동을 생성하는 특성

[00:00:00] 영상 개요 및 구조

영상은 72시간 전문가 세션의 핵심 인사이트를 기회, 스킬, 커리어, 사업 팁, 미래 트렌드로 나눠 요약합니다. 중간 퀴즈로 학습 효과를 높이도록 설계했습니다.

72시간 이상의 AI 에이전트 컨퍼런스 참석 경험을 바탕으로 핵심 인사이트를 공유하는 영상을 소개하며, 퀴즈를 통해 정보 습득을 돕겠다고 설명합니다.
영상을 컨퍼런스별이 아닌 주제별로 구성한 이유를 설명하고, AI 에이전트 기회, 필요 스킬, 커리어 조언, 실용적 팁이라는 4가지 주요 주제를 소개합니다.
[00:01:08] AI 에이전트 시장 기회

구글·대형 기업들은 2025년 에이전트형 AI 통합을 목표로 15개 이상 제품에 기능을 도입 중입니다. 모든 주요 기업이 AI 에이전트를 자사 제품에 적용하려는 움직임이 가속화되고 있습니다.

Google IO 컨퍼런스에서 얻은 주요 인사이트를 공유하며, Google을 포함한 모든 대기업들이 제품에 AI를 통합하고 에이전트 기능을 부여하는 데 집중하고 있다고 설명합니다.
큰 회사가 아닌 개인이나 스타트업을 위한 기회에 대해 질문을 제기하고, YC의 조언을 인용하여 특정 산업과 기능에 특화된 버티컬 AI 에이전트 구축을 권장합니다.
[00:01:51] 수직형 AI 에이전트 집중 전략

YC는 SaaS 3물결을 예시로 수직형 AI 에이전트(vertical AI agents)에 주목을 권장합니다. 특정 산업·기능에 특화된 에이전트가 시장 가치를 극대화할 수 있다고 전망합니다.

버티컬 AI 에이전트 개념을 SaaS 붐과 비교하여 설명하며, 첫 번째 물결인 데스크톱 소프트웨어의 온라인 버전(이메일, 캘린더, 문서 등)에 대해 언급합니다.
클라우드 소프트웨어의 세 가지 물결에 대해 설명하며, 첫 번째 물결인 기존 데스크톱 소프트웨어의 온라인 버전에서는 구글이 Microsoft Office를 온라인으로 가져온 것처럼 대기업들이 승리했다고 언급합니다.
두 번째 물결은 모바일과 클라우드 기술로 가능해진 새로운 소비자 행동들로, 우버, 에어비앤비, 인스타카트, 도어대시, 코인베이스 같은 명백하지 않고 위험한 서비스들이 등장했으며, 이 분야에서는 스타트업들이 성공하여 수백억 달러 가치의 회사들이 되었습니다.
세 번째 물결인 B2B 수직 SaaS는 가장 큰 카테고리로 3천억 달러 규모의 시장을 형성했으며, 제약업계의 베이바나 급여관리의 구스토처럼 특정 산업과 기능을 위한 전문 소프트웨어를 만드는 회사들이 성공했습니다.
각 수직 영역은 전문적이고 특수한 지식을 필요로 했기 때문에 구글이나 마이크로소프트 같은 대기업들에게는 투자 수익률이 매력적이지 않았고, 이로 인해 스타트업들이 성공할 수 있는 기회가 있었다고 설명합니다.
현재 AI 에이전트 붐을 같은 프레임워크로 분석하면서, 1차 물결의 명백한 에이전트 기능들(회의 기록, 이메일 발송, 캘린더 관리)을 하는 스타트업들은 이미 구글 같은 대기업들이 자사 소프트웨어에 AI 에이전트를 통합하면서 밀려났다고 언급합니다.
2차 물결의 명백하지 않은 소비자 애플리케이션들이 등장하기 시작하고 있으며, 3차 물결인 수직 AI 에이전트 회사들이야말로 현재 가장 비옥한 기회의 땅이라고 강조하면서, YC 투자자들이 이런 회사들이 SaaS 대응 업체들보다 10배 더 클 수 있다고 예측한다고 전합니다.
수직적 AI 에이전트의 핵심 장점은 소프트웨어뿐만 아니라 그것을 운영하는 인력까지 대체할 수 있다는 점입니다. HR 전용 AI 에이전트를 예로 들면, CEO가 1,500명의 직원과 개인적으로 의미 있는 대화를 나눌 수 있어 전체 HR 부서를 대체할 수 있습니다.
수직적 AI 에이전트 시장은 단순한 소프트웨어 교체를 넘어서, 소프트웨어 예산과 대체되는 팀의 급여까지 포함하므로 기존 SaaS보다 10배 더 큰 시장 기회를 제공합니다.
[00:05:27] 수직형 AI 에이전트 스타트업 팁

도메인 지식이 있는 틈새 산업을 선정하고, 반복·관리 업무를 파악해 자동화합니다. 24/7 가용성, 저비용, 개인화라는 AI 에이전트 장점을 최대한 활용해야 합니다.

수직적 AI 에이전트 회사를 시작하는 팁으로는 첫째, 자신이 도메인 지식을 갖고 있는 분야를 선택하고, 둘째, 반복적이고 지루한 작업을 찾아 AI 에이전트로 자동화하는 방법을 고민해야 합니다.
AI 에이전트의 장점인 24시간 가용성, 저렴한 비용, 개인화 기능을 활용하는 것이 중요합니다. Sweet Spot의 예시처럼 하루 종일 정부 웹사이트를 새로고침하는 단순 반복 업무를 AI 에이전트로 대체할 수 있습니다.
AI 에이전트 구축에는 많은 기술이 필요하지만, 여러 전문가 워크숍에서 가장 자주 언급된 핵심 기술은 프롬프트 엔지니어링과 평가(evals) 작성입니다.
[00:06:37] 핵심 스킬: 프롬프트 엔지니어링

프롬프트 엔지니어링은 단일 프롬프트 내 명확성·유연성 균형이 필수입니다. 역할·과제·입력·출력·제약·기능 6요소 프레임워크로 설계하고, 반복 테스트로 고도화합니다.

프롬프트 엔지니어링은 생성형 AI 모델과의 상호작용을 위한 입력 지시사항을 설계하고 개선하는 과정으로, 모든 스킬 중에서 투자 대비 수익률이 가장 높은 기술이라고 할 수 있습니다.
AI 에이전트 구축에서 프롬프트 엔지니어링이 특히 중요한 이유는 두 가지입니다. 첫째, 모든 지시사항이 하나의 프롬프트에 담겨야 하므로 매우 명확하고 정확해야 하며, 둘째, 명확한 지시와 유연성 사이의 균형을 맞춰야 합니다.
AI 에이전트의 본질적 목적은 자율적 작업 수행이므로, 다양한 행동을 가능하게 하는 충분한 지시사항을 제공하되 자율성을 억제하지 않는 미묘한 균형이 필요합니다.
Anthropic의 가이드라인은 짧은 프롬프트로 시작해서 즉시 다양한 사용 사례를 실험하고 테스트하라는 것입니다. 사용자가 입력할 수 있는 모든 예상치 못한 상황들을 테스트하여 프롬프트를 개선해야 합니다.
개인적으로 사용하는 6가지 구성 요소 프레임워크는 역할, 작업, 입력, 출력, 제약 조건, 기능과 알림을 하나의 프롬프트에 정의하는 것입니다. AI 뉴스 요약 연구 어시스턴트 에이전트가 실제 사용 예시입니다.
[00:08:35] 프롬프트 사례 및 Anthropic 모델

연구 보조 에이전트와 Parhelp 실제 프롬프트 예시를 소개합니다. Anthropic의 Claude Opus 4와 Sonnet 4는 장기 복합 작업 성능과 비용·속도 균형에서 뛰어난 결과를 보입니다.

YC 투자 회사 Parhelp이 공개한 실제 프로덕션 프롬프트는 단계별 추론, 마크다운, XML 태그 등을 활용해 더욱 복잡하고 명확하게 구조화되어 있습니다.
고급 프롬프팅 기법에 대한 간략한 소개와 함께 YC 영상을 통해 에이전트 전용 프롬프트 엔지니어링 기법을 학습할 것을 권장합니다.
샌프란시스코 Code with Cloud 컨퍼런스에서 Anthropic이 공개한 Claude Opus 4와 Sonnet 4 모델의 놀라운 성능을 직접 목격했으며, 특히 Claude Code와의 실시간 코드 편집 데모가 인상적이었습니다.
Opus 4는 Sweetbench 72.5%, Terminal Bench 43.2%라는 업계 최고 벤치마크를 달성한 세계 최고의 코딩 모델이며, Sonnet 4는 속도, 지능, 비용의 완벽한 균형을 제공하는 대폭 업그레이드된 모델입니다.
[00:10:35] 핵심 스킬: Evals 작성

Evals는 에이전트 성능 측정의 기반으로, 과제완료·계획·도구 사용·견고성·지연 등 항목별 평가를 구조화해 다양한 시나리오에서 안정성을 확보합니다.

컨퍼런스에서 두 번째로 중요하게 다뤄진 기술인 평가(eval) 작성에 대해 설명하며, AI 에이전트의 성능을 다양한 작업과 시나리오에서 구조화된 방식으로 측정하는 방법입니다.
프롬프트 엔지니어링과 평가 작성은 밀접한 관련이 있으며, 개인적 사용과 달리 많은 사용자와 다양한 시나리오를 고려한 AI 에이전트 구축 시에는 철저한 테스트가 필수적입니다.
일반적인 평가 카테고리로는 작업 완료 여부, 계획과 추론의 품질, 도구 사용 정확성, 그리고 입력 오류나 처리 오류 발생 시의 견고성이 포함됩니다.
AI 에이전트 평가의 핵심 요소들을 설명합니다. 처리 오류, 지연 시간, 효율성 등을 평가하기 위해 다양한 테스트 시나리오가 필요하며, OpenAI의 평가 도구 같은 것들이 도움을 줍니다.
기업들이 평가 데이터를 지적재산처럼 소중히 여기는 이유를 설명합니다. Parhelp 사례를 통해 프롬프트는 공유해도 평가 데이터는 절대 공유하지 않는다는 점을 강조합니다.
평가가 중요한 이유를 심도 있게 다룹니다. 평가는 사용자 워크플로우의 성공과 실패를 직접적으로 나타내며, 도메인에 대한 깊은 이해가 있어야만 좋은 평가를 만들 수 있다고 설명합니다.
평가에 대해 더 자세한 내용을 다른 영상에서 확인할 것을 권하며, AI 에이전트 부트캠프 재시작 소식을 전합니다. 실습 중심으로 4개 이상의 에이전트 시스템을 구축하고 배포하는 과정입니다.
부트캠프의 인기를 보여주는 사례를 들며, 대기자 명단 등록의 중요성을 강조합니다. 지난번에는 40시간 만에 매진되었고, 공개 발표도 하지 않았다고 설명합니다.
[00:13:11] 커리어 조언: 에이전트 엔지니어

Agent Engineer는 프롬프트, 전통 엔지니어링(시스템·데이터 파이프라인), 제품 기획, ML 역량을 결합한 역할입니다. AI 에이전트 실무 적용을 위해 4가지 스킬이 필수입니다.

커리어 조언 섹션으로 넘어가며, Lang Chain의 CEO 해리슨 체이스가 '에이전트 엔지니어'라는 새로운 역할을 공식 출시했다고 소개합니다.
AI 에이전트의 잠재력과 현실 사이의 격차를 설명합니다. 인상적인 데모를 만드는 것과 실제 운영 환경에서 안정적으로 작동시키는 것은 완전히 다른 문제라고 강조합니다.
에이전트 엔지니어가 갖춰야 할 4가지 핵심 기술을 소개하기 시작합니다. 첫 번째는 프롬프팅, 두 번째는 전통적인 엔지니어링 기술, 세 번째는 제품 관련 기술이라고 설명합니다.
AI 에이전트 개발에 필요한 네 번째 핵심 역량인 도메인 지식과 머신러닝에 대해 설명합니다. 도메인 지식은 사용자 워크플로우를 이해하고 자동화하는 데 필요하며, 머신러닝은 좋은 평가 통계와 비결정성 처리를 위해 필요합니다.
화자가 개인적인 경험을 공유하며, 소프트웨어 엔지니어링에서 시작해 메타에서 데이터 사이언티스트로 일했던 경험을 통해 에이전트 엔지니어라는 새로운 역할의 등장을 감회 깊게 바라봅니다.
해리슨 체이스의 의견에 동의하며, AI 에이전트 구축에 필요한 스킬들과 증가하는 수요에 대해 언급하고, 이 분야에 관심 있는 사람들에게 관련 도메인과 스킬셋을 깊이 공부할 것을 권합니다.
IBM과 협력한 AI 시대 커리어 준비 무료 강연을 홍보합니다. 6월 25일 동부시간 오후 1시에 진행되며, 참가자들은 IBM 스킬빌드 디지털 자격증과 30만 개의 무료 그래나이트 토큰을 받을 수 있습니다.
마지막 섹션인 '인사이트의 핵심들'을 소개하며, 비즈니스 워크플로우를 AI 에이전트로 자동화하기 위한 실용적인 5단계 프레임워크를 제시합니다: 관찰, 분해, 흐름 매핑, 프로토타입, 평가 및 반복.
[00:15:40] 업무 자동화와 미래 트렌드

관찰·분해·흐름 매핑·프로토타입·평가·개선 5단계 워크플로우 자동화 프레임워크를 제시합니다. 미래에는 프롬프트·Evals 고도화, 음성 에이전트, 코딩 역량이 중요해집니다.

AI 에이전트 개발에서 프롬프트 수정, 모델 교체, 도구 변경 등을 통한 반복적 개선 방법론을 설명합니다.
Andrew Ng이 Langchain 컨퍼런스에서 제시한 AI 개발의 3가지 핵심 영역을 소개합니다: 프롬프트 엔지니어링 평가, 음성 에이전트, 코딩 능력.
음성 에이전트가 현재 과소평가되고 있지만 AI 에이전트의 사용자 경험을 극적으로 향상시킬 수 있는 기술이라고 강조합니다.
Andrew Ng의 '모든 사람이 코딩을 배워야 한다'는 주장을 소개하며, AI 코딩 도구로 인해 코딩이 더욱 접근하기 쉬워졌다는 점을 언급합니다.
화자의 개인적 견해로, AI 에이전트 구축에는 코딩이 필요하지만 모든 사람이 코딩을 배울 필요는 없다고 주장합니다. 비즈니스 지식과 도메인 전문성을 가진 사람들이 노코드 도구로 프로토타입을 만들고 엔지니어를 고용하는 것도 합리적인 접근법이라고 설명합니다.
지금은 컨퍼런스 시즌이고, 저는 AI 에이전트에 관한
72시간 이상의 강연과 워크샵에 참석했습니다.
그래서 이 영상에서는 여러분들에게
제가 AI 에이전트에 대해 배운
모든 것의 핵심 요약 버전을 공유하고 싶습니다.
하지만 평소와 같이, 단순히 제 말만 듣는 것으로는
충분하지 않습니다. 그래서 이 영상 전체에
작은 퀴즈들을 배치해서 여러분이
이 모든 정보를 잘 기억할 수 있도록
도울 예정입니다. 자, 더 이상 지체하지 말고
시작해보겠습니다. 이 영상의 일부는
Anthropic의 후원으로 제작되었습니다.
제가 이 영상을 구성하는 방식은
컨퍼런스별이 아닌 주제별로
대략적으로 그룹화하는 것입니다.
이렇게 하는 이유는
겹치는 내용이 많기 때문입니다.
첫 번째 주제는 AI 에이전트의 기회가 무엇인가 입니다.
즉, 어떤 에이전트가 구축할 가치가 있는지
식별하는 방법을 말하는데, 자신만의 회사를
시작하거나 기존 회사와 워크플로우 내에서
활용하려는 경우 말입니다.
두 번째 주제는 AI 에이전트 구축을 위해
배워야 할 기술들입니다. 다음은
커리어 조언인데, Lang Ching CEO가 말하는
에이전트 엔지니어가 되고 싶다면
어떻게 해야 하는지 포함합니다.
그는 이것이 AI 에이전트의
시작에 불과하며, 이런 AI 엔지니어
역할이 정말 정말 수요가 많아질 것이라고
확신하고 있습니다. 그리고 마지막으로
통찰의 핵심들로 마무리합니다.
여기서는 실용적인 팁들과
비즈니스 인사이트, 그리고
미래에 집중해야 할 것들에 대해
논의할 예정입니다. 좋습니다,
AI 에이전트의 기회가 무엇인지부터
시작해보겠습니다. Google IO 컨퍼런스에
참석해서 얻은 주요 깨달음은
Google이 모든 다양한 제품에
AI를 통합하고 에이전트 기능을
부여하는 데 완전히 집중하고 있다는 것입니다.
그들은 말 그대로 15개 이상의 제품을 나열하고
모든 제품에 AI가 어떻게 들어가 있는지
이야기했습니다. 하지만 Google만이 아닙니다.
기본적으로 모든 대기업들이
자신들의 제품에 AI를 통합하는 방법과
에이전트 기능을 가진 새로운 제품을
구축하는 방법을 알아내고 있습니다.
2025년은 정말로 에이전트 AI 제품의
시작을 알리는 해입니다. 자, 그러면
만약 제가 그렇게 큰 회사가 아니라면 어떨까요?
저만의 AI 에이전트 스타트업을 구축하거나
기존 비즈니스에 AI 에이전트를
통합하려고 한다면 어디에 기회가 있을까요?
다행히도 여러분을 위해
이 질문에 정확히 답해주는
YC의 훌륭한 라운드테이블 토론이 있습니다.
그들의 조언은 버티컬 AI 에이전트라고
부르는 카테고리 내에서 구축하라는 것입니다.
이는 매우 특정한 산업과
기능을 위해 설계된
전문화된 AI 에이전트로 정의됩니다.
이를 설명하기 위해
SaaS 붐과 비교해보면,
수십 년 전 서비스형 소프트웨어
회사를 구축하는 사람들에게
많은 성공이 있었습니다.
SaaS 회사들에는 3개의 물결이 있었습니다.
첫 번째 물결은 그들이 명백한
소비자 애플리케이션이라고 부른 것입니다.
이들은 기본적으로 데스크톱 소프트웨어의
온라인 SaaS 버전들입니다.
이메일, 캘린더, 문서 같은 것들을
생각해보세요.
구글이 온라인으로 가져온 Microsoft Office 제품군 말이죠.
이 카테고리에서는 처음에 많은 스타트업들이
우후죽순 생겨났습니다.
하지만 결국에는
기존 대기업들이,
큰 회사들이 승리했습니다. 왜냐하면 그들은 그냥
자신들의 제품을 온라인으로 가져왔기 때문이죠.
두 번째 물결은 그들이 '명백하지 않은
소비자 애플리케이션'이라고 부르는 것입니다.
이것들은 모바일과 클라우드 기술로
가능해진 새로운 소비자 행동들이었습니다.
명백하지 않고 정말
위험한 것들이었죠. 몇 가지 예로는 우버,
에어비앤비, 인스타카트, 도어대시, 그리고
코인베이스가 있습니다. 스타트업들이 이 카테고리에서 승리한 이유는
명백하지 않았고 또한
정말 위험했기 때문입니다. 그래서 큰 회사들은
그런 위험을 감수하려고
하지 않았던 거죠. 이 카테고리에서
성공한 소수의 회사들은
수백억에서 수천억 달러
가치를 갖게 되었습니다.
그리고 마지막으로 세 번째 물결이 있었는데,
세 번째 카테고리인 B2B 수직 SaaS입니다.
이것은 지금까지 가장 큰 카테고리로,
3천억 달러 규모의 회사들을 만들어냈습니다.
이런 회사들은 특정 산업과
기능을 위한 전문 소프트웨어를 만듭니다.
제약업계를 위한 베이바나 급여관리를 위한 구스토 같은 것들로
각각 470억 달러와 95억 달러의 가치를 가지고 있습니다.
이제 이 카테고리에서 스타트업들에 의해
그렇게 많은 가치가 창출된 이유는
각 수직 영역이 온라인으로 옮겨져야 했지만
기존 대기업들은
큰 회사들은 그렇게 하지 않았기 때문입니다.
왜냐하면 그것이 그들에게는
정말 가치가 없었기 때문이죠.
각 틈새시장, 각 수직 영역은
그렇게 전문적이고 특수한
지식을 필요로 했기 때문에
단순히 500억 달러 정도의 투자 수익률은
구글이나 마이크로소프트에게는 가치가 없었습니다.
그래서 만약 당신이 그 당시 스타트업이었고
수직 SaaS 회사 구축에
집중했다면, 성공할 확률은
상대적으로
높았을 것입니다. 이제 이것을 오늘날 우리가 보고 있는
AI 에이전트 붐으로
다시 가져와 보겠습니다. 우리는 이미 1차 물결의 결과를
보고 있습니다. 회의 기록하기,
정말 명백한 에이전트 기능들을 하는
스타트업들이 많이 있었습니다.
이메일 보내기, 그리고
캘린더 관리 같은 것들 말이죠. 하지만 지금까지
이런 스타트업들 대부분은
이미 밀려났습니다. 왜냐하면
구글 같은 회사들이 단순히 AI
에이전트를 자신들의 소프트웨어에 통합하고 있기 때문입니다.
그리고 스타트업들은 그것과 경쟁할 수 없습니다.
2차 물결인 그렇게 명백하지 않은
AI 에이전트의 소비자 애플리케이션들이
지금 등장하기 시작하고 있습니다. 그리고 저는 이것들 중 일부를
곧 보게 될 것이라고 확신합니다.
하지만 3차 물결인 B2B 수직
회사들, 즉 수직 AI 에이전트
회사들. 여기가 바로
비옥한 땅입니다. 지금은 특정
수직 틈새시장을 살펴보고
그런 틈새시장에서 어떻게
AI 에이전트를 만들 수 있을지 보는 정말 좋은 기회입니다.
그리고 실제로 YC 라운드테이블 토론에서
이 투자자들은
이런 수직 AI 에이전트 회사들이
SaaS 대응 업체들보다
10배 더 클 수 있다고 예측하고 있었습니다. 왜냐하면 수직 AI 에이전트는
소프트웨어 부분만 대체할 수 있는 게 아니라
실제로 그 소프트웨어를 운영하는
사람들까지도 대체할 수 있습니다.
그들이 든 예시는 HR 전용 AI 에이전트입니다.
이런 도구를 사용하면 CEO가 직접
1,500명의 직원들에게 개인적으로 연락해서
개인화되고 의미 있는 대화를
모든 직원과 나눌 수 있다는 걸 쉽게 상상할 수 있죠.
직원들이 자신의 역할에 만족하는지 확인하고
필요한 부분에 도움을 줄 수 있습니다.
이는 말 그대로
인간 팀 전체의 필요성을 없애버립니다.
잠재적으로는 HR 부서 전체를 말이죠.
수직적 AI 에이전트 시장은
단순히 회사의 소프트웨어가 아닙니다.
회사의 소프트웨어 예산과
대체되는 전체 팀의
급여까지 포함하는 시장입니다.
그래서 간단히 말하면,
자신만의 스타트업이나 비즈니스를 구축하거나
현재 비즈니스의 역량을 확장하고 싶다면
수직적 AI 에이전트를 구축해야 합니다.
이제 화면에 수직적 AI 에이전트 분야의
YC 회사들의 예시를
영감을 위해 보여드리겠습니다.
다음 섹션으로 넘어가기 전에
수직적 AI 에이전트 회사를
시작하는 방법에 대한
몇 가지 작은 팁을 드리고 싶습니다.
첫 번째로 해야 할 일은
도메인 지식을 가지고 있는
수직적 틈새 시장을 선택하는 것입니다.
법률, 회계, 마케팅, 교육 등
어떤 분야든 상관없습니다.
그 분야를 깊이 이해할수록
정말 좋은 AI 에이전트를
만들 가능성이 높아집니다.
두 번째 단계는
반복적이고 관리적이며 지루한 작업을 찾아내는 것입니다.
그리고 자신에게 물어보세요.
AI 에이전트를 사용해서 이것들을 어떻게 자동화할까?
저는 일부 제품 팀과
일대일 대화를 나눌 수 있는
정말 놀라운 기회를 가졌습니다.
그들이 제게 준 조언은
AI 에이전트의 장점을 생각해보라는 것이었습니다.
예를 들어, 24시간 내내 이용 가능하고
저렴하며 많은 개인화가 가능합니다.
그렇다면 이러한 장점들을 어떻게 활용해서
AI 에이전트를 개선할 수 있을까요?
예를 들어, Sweet Spot의 창립자는
하루 종일 정부 웹사이트를
수동으로 새로고침하는 일을 하는
친구가 있었습니다.
그래서 이를 대신할 AI 에이전트를 만들기로 했죠.
더 저렴하고, 더 빠르며, 24시간 내내 할 수 있습니다.
이제 화면에 작은 퀴즈를 올리겠습니다.
이 질문들에 답하고
댓글에 올려서 방금 이야기한
모든 정보를 잘 기억하고 있는지
확인해 주세요.
이제 수직적 AI 에이전트 구축에 열정을 갖게 되었다면
에이전트 구축에 필요한
핵심 기술에 대한 다음 섹션으로
넘어가겠습니다.
먼저 고지사항부터 말씀드리겠습니다.
AI 에이전트를 구축하는 데 필요한 기술은 많습니다.
실제로 이러한 기술들이 무엇인지에 대해
더 자세히 다룬 동영상이 있는데
여기에 링크를 걸어두겠습니다.
하지만 여러 워크숍과 강연에서
계속해서 언급된 두 가지 기술이 있었습니다.
바로 프롬프트 엔지니어링과
평가 작성입니다.
같은 기준에서 이해하고 있는지 확인하기 위해
페이지에서 프롬프트 엔지니어링은
생성형 AI 모델과 상호작용할 때
사용되는 입력 지시사항이나 프롬프트를
설계하고 개선하는 과정으로 정의됩니다.
제 개인적인 의견으로는 프롬프트 엔지니어링은
투자 대비 수익률이 가장 높은
스킬이라고 생각합니다.
일반적으로 말이죠. 하지만
특히 에이전트를 구축할 때는
더욱 중요합니다. 그 이유는
두 가지입니다. 첫 번째는
에이전트에게 주는 모든 지시사항이
하나의 프롬프트에 담겨야 한다는 것입니다.
챗봇처럼 반복적으로 수정할 수 없어요.
그래서 매우 명확하고 세부적이며
정확해야 합니다. 두 번째 이유는
프롬프트 엔지니어링이 AI 에이전트에게
중요한 이유는 명확한 지시사항과
유연성 사이의 균형을 맞춰야 하기 때문입니다.
애초에 AI 에이전트를 사용하는 이유는
자율적으로 작업을 수행하길 원하기 때문이죠.
이는 본질적으로 에이전트가 할 모든 일을
정확히 예측할 수 없다는 뜻입니다.
따라서 에이전트가 다양한 행동을
수행할 수 있을 만큼 충분한 지시사항을 주되
자율적 능력을 억제하지 않는
미묘한 균형을 맞춰야 합니다.
그렇지 않으면 일반적인 워크플로우가
되어버리죠. 매우 섬세한 선입니다.
Anthropic의 AI 에이전트 프롬프트 워크샵에서
제시한 일반적인 가이드라인은
짧은 프롬프트로 시작한 다음
즉시 다양한 사용 사례를
실험하고 테스트하라는 것입니다.
초기 프롬프트는
'사용자 질문에 답하기 위해 웹을 검색하라'
처럼 간단할 수 있습니다.
그다음 사람들이 AI 에이전트에
입력할 수 있는 모든 이상한 것들을
생각해보기 시작해야 합니다.
그것들을 테스트해보고
AI 에이전트가 어떻게 행동하는지 보며
그 결과를 바탕으로 프롬프트를 개선해서
궁극적으로 원하는 행동을
얻어야 합니다.
저는 개인적으로 이런 고차원적인
마인드셋 조언이 매우 좋다고 생각하지만
저는 좀 더 구체적인
프레임워크를 선호합니다.
여러분 중 일부가 저와 같은 성향이라면
제가 AI 에이전트에 프롬프트를 작성할 때
보통 사용하는 6가지 구성 요소
프레임워크를 공유해드리겠습니다.
역할, 작업, 입력, 출력,
제약 조건, 그리고 기능과 알림을
모두 하나의 프롬프트에 정의하는 것입니다.
지금 화면에 AI의 최신 뉴스와 트렌드를
요약하는 것이 작업인 연구 어시스턴트 에이전트의
예시를 보여드리겠습니다.
이것은 제가 실제로 이런 영상을
만들 때 개인적으로 사용하는 것입니다.
여기 또 다른 예시가 있습니다.
다른 YC 라운드테이블에서
YC 투자 회사 중 하나인 Parhelp이
매우 관대하게 실제 프로덕션 프롬프트를
공개했는데, 당연히 더 길고
더 복잡하며, 단계별 추론과
마크다운, 그리고 XML 태그라고 불리는
것들을 사용해서 프롬프트를
더 명확하게 구조화하는 것들을
포함하고 있습니다.
저는
이러한 고급 프롬프팅 기법에 대해서는
더 자세히 다루지는 않겠지만,
정말로 추천하고 싶은 것은
여기 있는 YC 영상을 꼭 확인해보시라는 것입니다.
이 영상에는 에이전트 전용 프롬프트
엔지니어링을 개선할 수 있는 통찰력이
많이 담겨 있습니다. 그래서
앞서 말씀드렸듯이, 저는 몇 주 전
샌프란시스코에서 열린 Code with Cloud
컨퍼런스에 참석했는데, 그곳에서
Anthropic이 최신 모델인
Claude Opus 4와 Claude Sonnet 4를 공개했습니다.
특히 Claude Code라는 커맨드라인 도구와
함께 사용하는 라이브 데모를 보는 것은
정말 놀라웠습니다. 확장된 추론과
도구 사용, 그리고 실시간 코드 편집을
선보였습니다. Opus 4는
복잡한 장기 실행 작업에서 지속적인
성능을 보여주는 세계 최고의
코딩 모델로, Sweetbench에서
72.5%라는 업계 선도적인
벤치마크를 기록했고, Terminal Bench에서는
43.2%를 달성했습니다. 그리고
Sonnet 4는 Sonnet 3.7에서
대폭 업그레이드되어 속도, 지능, 비용의
훌륭한 균형을 제공합니다. 저는
실제 코딩과 연구 작업에서 이러한
모델들을 직접 테스트해봤는데,
장기 복잡 프로젝트에서의 지속적인
성능이 정말, 정말 인상적이었습니다.
아직 시도해보지 않으셨다면
cloud.ai에서 Claude Code와 함께
Claude 모델을 사용해보시거나
여러분이 선호하는 IDE나 코딩 도구에서
사용해보시기를 정말 권합니다.
링크는 여기 있고 설명란에도
있습니다. 이 영상 부분을 후원해주신
Anthropic에게 정말 감사드립니다.
이제 영상으로 돌아가서
컨퍼런스에서 모든 사람들이
이야기하고 있던 두 번째 기술인
평가 작성에 대해 알아보겠습니다.
평가라고도 알려진 eval은
AI 에이전트가 다양한 작업이나
시나리오에서의 성능을 측정하는
구조화된 방법입니다. 프롬프트
엔지니어링과 평가 작성은 함께 갑니다.
프롬프트를 작성하고 좋다고
생각할 수 있지만, 그 결과를
평가하지 않으면 실제로 좋은지
알 수 없습니다. 맞죠? 개인적으로
AI를 사용하고 챗봇과 같은 것과
상호작용하는 경우에는 보통
육안으로 결과를 확인해서
프롬프트를 변경해야 할지 여부를
평가할 수 있지만, 많은 사람들이
다양한 시나리오에서 사용할
AI 에이전트를 구축하는 경우라면
완전히 다른 이야기입니다.
AI 에이전트가 해야 할 일을
제대로 하고 있는지 확인하기 위해
AI 에이전트의 동작을 매우
철저하게 테스트해야 합니다.
특히 머릿속에서 예측하지 못했을
엣지 케이스와 같은 경우에
말입니다. 일반적인 평가 카테고리에는
작업 완료 여부, 즉 에이전트가
실제로 작업을 완료했는지, 계획과
추론 품질, 즉 에이전트가 취한
단계들이 논리적이고 효율적이었는지,
도구 사용 정확성, 즉 가지고 있는
도구들을 올바르게 사용했는지,
견고성, 즉 오류가 발생했을 때
어떻게 대처하는지, 그것이 입력
오류든 처리 오류든 말입니다.
처리 오류, 그리고 지연 시간과
효율성이 있습니다. 에이전트가 얼마나
빠르고 효율적으로 실행되는지 말이죠.
AI 에이전트를 평가하기 위해서는
다양한 테스트 시나리오를 만들어야 합니다.
다행히도 많은 회사들이
이를 도와주는 평가 도구들을 제공하고 있습니다.
OpenAI의 평가 도구들과 같은 도구들이 있습니다.
평가 플랫폼을 말이죠. 정말 흥미로운 것은
현재 많은 회사들이
자신들의 평가를 마치
보석처럼, 실제 지적재산으로 여긴다는 것입니다.
그래서 예를 들어 Parhelp는
자신들의 프롬프트는 공유해도 괜찮다고 했지만,
평가 데이터를 달라고 하면
절대로 주지 않을 거라고 확신합니다.
그 이유는
평가가 실제
사용자 워크플로우의 성공과 실패를
직접적으로 나타내기 때문입니다.
도메인에 대한 깊은 이해와
사람들이 AI 에이전트를
어떻게 사용하는지에 대한 이해가 있어야만
좋은 평가를 만들 수 있습니다.
그래야만 시간이 지나면서
AI 에이전트를 개선할 수 있습니다.
평가에 대해서도 훨씬 더
많이 이야기할 수 있고,
AI 에이전트를 구축하는 다른 모든 기술들과 마찬가지로
말할 것이 많지만, 이 영상에는
시간이 부족합니다.
그래서 제가 만든 영상을
꼭 확인해보시길 추천합니다.
훨씬 더 깊이 다루고 있거든요.
그리고 다음 몇 주 안에
다음 기수를 위한 AI 에이전트 부트캠프를
다시 시작할 예정이라는 것도 알려드리고 싶습니다.
매우 실습 중심의 부트캠프이고,
최소 4개의 서로 다른 AI 에이전트 시스템을
만들어서 실제 운영 환경에 배포하게 됩니다.
지난번에는 40시간 만에 매진되었고,
대기자 명단만으로도 말이죠.
공개적으로 발표한 적도 없었거든요.
그래서 이번에 참여하고 싶으시다면
꼭 대기자 명단에 등록해주세요.
대기자 명단에 있으면 우선권을 받습니다.
자, 이제 화면에
이 섹션에 대한 지식을 테스트하는
작은 퀴즈를 올릴 텐데요.
댓글로 답을 남겨주세요.
이제 커리어 조언으로 넘어가겠습니다.
Lang Chain Interrupt 컨퍼런스에서
CEO 해리슨 체이스가
'에이전트 엔지니어'라는 새로운 역할을
공식적으로 출시했습니다.
그는 우리가 AI 에이전트의 힘을
이제 막 경험하기 시작했다고 확신하기 때문입니다.
AI 에이전트가 가져올 수 있는 능력 중에서
극히 일부만 경험했다는 것이죠.
그는 인상적인 AI 에이전트 데모를
만들 수 있는 것과
실제 운영 환경에서
안정적으로 작동하게 만드는 것 사이에는
여전히 큰 격차가 있다고 주장합니다.
대규모 제품에 통합하려면
후자가 필요하죠. 그래서
에이전트 엔지니어는 견고한 에이전트를
만들기 위해 4가지 핵심 기술이 필요합니다.
첫 번째는 당연히 프롬프팅입니다.
LM과 효과적으로 상호작용하는 능력이죠.
두 번째는 전통적인 엔지니어링으로,
신뢰할 수 있는 시스템과
데이터 파이프라인을 구축하는 능력입니다.
이것들은 전통적으로 소프트웨어 엔지니어와
데이터 엔지니어의 기술입니다. 세 번째는 제품입니다.
이는 도메인 지식의 필요성을 나타냅니다
사용자의 워크플로우를 이해하고
AI 에이전트로 자동화하는 능력 말이죠.
네 번째는 머신러닝입니다.
전통적으로 데이터 사이언티스트와
데이터 사이언스 연구자들이 가진 스킬이죠.
그 이유는
좋은 AI 에이전트를 구축하려면
좋은 평가 통계와 비결정성이 필요하기 때문입니다.
이건 정말 저에게는
완전한 원점 회귀 같은 순간이에요.
정말 초현실적이거든요. 왜냐하면
저는 소프트웨어 엔지니어링부터 시작해서
메타에서 데이터 사이언티스트로 일했는데
그때 데이터 사이언스는
멋지고 화려한 새로운 직업이었어요.
다양한 분야를 결합한 직업이었는데
이제 에이전트 엔지니어가
데이터 사이언티스트와 소프트웨어 엔지니어링
그리고 프로덕트의 스킬셋을
결합하고 있으니까요.
네, 새로운 직업이 생겼네요.
세상이 발전하고 있는 것 같아요.
어쨌든, 이 특정한 직책이
정식 직함이 될지는 모르겠지만
해리슨 체이스의 의견에 확실히 동의해요.
이런 스킬들이 좋은 AI 에이전트를
구축하는 데 필요한 것들이고
AI 에이전트에 대한 수요도
확실히 증가하고 있거든요.
그래서 이 분야에 관심 있는 분들은
이런 도메인과 스킬셋을 깊이 파보세요.
안녕하세요 친구들,
IBM과 협력해서
AI 시대의 커리어 준비에 대한
무료 강연을 진행한다는 걸 말씀드리고 싶어요.
6월 25일 동부시간 오후 1시에 있을 예정입니다.
스포트라이트 활동 중 하나라도 완료하시면
링크드인 프로필에 올릴 수 있는
공식 IBM 스킬빌드 디지털 자격증도 받으실 수 있어요.
IBM 스킬빌드에서는
30만 개의 무료 그래나이트 토큰도
나눠드릴 예정입니다.
ibm.biz/tina에
방문해서 오늘 등록하세요.
자리가 한정되어 있거든요.
6월 25일에 뵙겠습니다.
이제 영상으로 돌아가서,
간단한 평가를 해보겠습니다.
댓글에 답변을 달아주세요.
마지막 섹션은 인사이트의 핵심들입니다.
먼저 비즈니스 워크플로우를
AI 에이전트로 자동화하기 위해
분해하는 매우 실용적인
단계별 프레임워크를 공유하고 싶어요.
첫 번째 단계는 관찰입니다.
비즈니스 프로세스에서 사람들이
무엇을 하고 있는지 살펴보세요.
두 번째 단계는 분해입니다.
워크플로우를 더 작고 관리 가능한 작업들로
나누는 거예요.
세 번째 단계는 흐름을 매핑하는 것입니다.
워크플로우를 파악하고
이런 작업들이 서로 어떻게 연관되어 있는지
파악하고 모든 다른 분기와
상호작용을 그려보려고 노력하세요.
네 번째 단계는 프로토타입입니다.
방금 매핑한 워크플로우의
초기 간단한 버전을 에이전틱한 방식으로
구축하세요. 그게 무슨 뜻인지
모르신다면 이 영상에서
더 자세히 설명하고 있어요.
다섯 번째 단계는 평가와 반복입니다.
이메일을 작성하고 평가를 사용해서
에이전트가 예상대로 작동하지 않는
부분을 파악한 다음
프롬프트를 수정하고, 다른 모델로 교체하고,
다양한 도구를 제공하는 등의 방법이 있습니다. 그리고
마지막으로 미래를 전망해 보겠습니다. 저는
Andrew Ng의 이 강연을 정말 좋아합니다.
Langchain Interrupt 컨퍼런스에서 한 강연입니다.
기본적으로 사람들이 집중해야 할
세 가지가 무엇인지 물어봤는데,
첫 번째는 프롬프트 엔지니어링
평가입니다. 놀랍지 않죠.
두 번째는 음성 에이전트였습니다. 그는
현재 매우 과소평가되고 있다고
생각한다고 했습니다. 음성 에이전트는
AI 에이전트의 사용자 경험을
훨씬 더 향상시킬 수 있기 때문입니다. 그래서
음성 에이전트를 살펴보세요. 네, AI 음성 에이전트는 정말 멋집니다.
그리고 세 번째는 코딩입니다. Andrew Ng은
모든 사람이 코딩을 배워야 한다고
매우 강조했습니다. 그는 심지어
자신의 접수원도 코딩을 할 줄 안다고 했고,
코딩이 이제는
AI 코딩 도구로 인해 더욱 쉬워졌기 때문에
더 많은 사람들이 코딩을 배워야 한다고 생각합니다.
자, 이제 그의 의견을 공유했으니
제 의견도 조금 나누고 싶습니다.
어떻게 받아들이시든 괜찮습니다만,
제 의견으로는 에이전트 부트캠프와
컨설팅을 통해 많은 사람들과
함께 일한 경험을 바탕으로 말씀드리면,
AI 에이전트를 구축하려면 코딩 구현이
필요하다는 것은 사실입니다.
하지만 모든 사람이 코딩을 배울
필요는 없다고 생각합니다. 왜냐하면
매우 훌륭한 비즈니스 지식과
정말 뛰어난 도메인 지식을 가진 사람들이 많고,
이들은 AI 에이전트의 기본을
이해하고 노코드 도구를
사용해서 데모 버전이나
프로토타입 버전을 만들 수 있기 때문입니다.
이런 분들이 실제 코딩된 버전을
자신의 비즈니스에 구현할 수 있는
엔지니어를 고용하는 것은
충분히 합리적입니다.
네, 이것이 제 개인적인 의견입니다.
자, 오늘 여러분께 드릴 말씀은
여기까지입니다. 이 섹션의 지식을
테스트할 마지막 작은
평가를 준비했습니다.
댓글에 답변을 남겨주세요. 그리고
이 영상을 끝까지 시청해주셔서
정말 감사합니다.
도움이 되었기를 바랍니다. 그리고
다음 영상이나 라이브 스트림에서
다시 만나요.