[00:00]
여러분을 위해 AI 에이전트 구축 방법을 연구했습니다
[00:02]
수백 시간을 AI 에이전트 개발에 투자했고
[00:04]
Lonely Octopus라는 프로그램을 운영하고 있는데
[00:06]
이곳에서 사람들에게 AI 기술을 가르치고
[00:08]
기업을 위한 AI 에이전트를
[00:09]
개발할 기회를 제공합니다
[00:11]
이 영상에서는 제가 배운 모든 것을
[00:13]
정리하여 전달하고자 합니다
[00:14]
프레임워크와 다양한 도구들을 포함한
[00:16]
포괄적인 가이드를 제공할 예정입니다
[00:18]
코딩을 모르는 분들을 위한
[00:20]
노코드 도구부터 시작해서
[00:22]
다음 AI 스타트업을 준비하는
[00:24]
숙련된 소프트웨어 엔지니어를 위한
[00:25]
도구까지 모두 다룰 예정입니다
[00:27]
또한 다양한 도구를 사용하여 만든
[00:29]
실제 AI 에이전트 예시도
[00:30]
함께 살펴볼 것입니다
[00:32]
항상 그렇듯이 이 영상에는
[00:34]
작은 평가들이 포함되어 있어서
[00:35]
내용을 더 잘 이해하고 기억하는 데
[00:37]
도움이 될 것입니다
[00:39]
이제 시작하겠습니다. 이 영상의 일부는
[00:41]
HubSpot의 후원을 받았습니다
[00:42]
영상의 구성은 다음과 같습니다
[00:44]
먼저 AI 에이전트를 구성하는
[00:45]
핵심 요소들을 소개하고
[00:48]
각 카테고리별 도구들과
[00:49]
도구 선택 방법을 설명하겠습니다
[00:51]
다음으로 세부사항으로 들어가서
[00:53]
현재 사용되고 있는
[00:55]
일반적인 에이전트 워크플로우에 대해
[00:56]
이야기하겠습니다
[00:58]
또한 에이전트를 위한
[01:00]
프롬프트 엔지니어링 속성 강좌도
[01:02]
포함될 예정입니다. 프롬프트는
[01:04]
에이전트의 성패를 좌우하는
[01:05]
핵심 요소이기 때문입니다
[01:07]
그 다음 노코드 도구와
[01:09]
코드 기반 도구를 모두 사용한
[01:11]
AI 에이전트의 전체 예시를 보여드리겠습니다
[01:13]
하지만 목적 없는 AI 에이전트를
[01:15]
만드는 것이 무슨 의미가 있을까요?
[01:17]
그래서 어떤 종류의 AI 에이전트와
[01:19]
AI 스타트업 또는 비즈니스를
[01:21]
구축해야 하는지도 다룰 예정입니다
[01:22]
기술 기반의 구체적인 제안과 함께
[01:24]
무엇을 만들어야 할지 설명하겠습니다
[01:26]
음성, 비디오, 이미지 에이전트 분야의
[01:28]
발전으로 정말 멋진 활용 사례들이
[01:31]
가능해졌습니다. 에이전트의 시대가 오고 있습니다
[01:34]
여러분, 안녕하세요
[01:36]
먼저 AI 에이전트가 무엇인지 정의해보겠습니다
[01:38]
AI 에이전트는 환경을 인식하고
[01:41]
정보를 처리하며
[01:43]
특정 목표를 달성하기 위해
[01:45]
자율적으로 행동하는 시스템입니다
[01:47]
더 인간적인 관점에서 보면
[01:50]
우리는 보통 AI 에이전트를
[01:52]
인간의 역할이나 작업을 대체하는
[01:54]
AI 버전으로 생각합니다
[01:56]
그래서 자주 듣게 되는 것이
[01:58]
Cursor나 WindSurf같은 코딩 AI 에이전트입니다
[02:01]
이들은 AI 기반 코드 에디터로
[02:03]
에이전트 모드를 통해 코딩 작업을
[02:05]
자동으로 수행할 수 있으며
[02:08]
Claude Sonnet 3.7이나 Gemini 2.5 Pro를 사용합니다
[02:11]
또 다른 일반적인 AI 에이전트 사용 사례는
[02:14]
고객 서비스 챗봇입니다
[02:16]
많은 기업들이 현재
[02:18]
고객 서비스 에이전트를 실험하고 있는데
[02:19]
이들은 문의 처리
[02:21]
고객과의 소통, 불만 접수
[02:23]
또는 특정 문제 해결과 같은
[02:24]
작업을 수행할 수 있습니다
[02:26]
이것이 AI 에이전트의 정의이자 경험입니다
[02:28]
하지만 AI 에이전트를 구현할 때
[02:29]
실제로는 다양한 방식으로
[02:31]
구현할 수 있으며
[02:32]
많은 세부적인 차이가 있습니다. 제가
[02:34]
이것에 대해 간단히 미리 설명해
[02:35]
드리겠습니다. 나중에 더 자세히
[02:37]
다양한 에이전트의 정확한
[02:38]
구현 방법에 대해 다룰 예정이지만
[02:40]
지금은 한 가지만 알아두셨으면 합니다
[02:42]
AI 에이전트라고 할 때, 단순히
[02:43]
혼자서 AI 에이전트 일을
[02:45]
하는 것만을 의미하는 게 아닙니다
[02:47]
대개는 특정 작업을 수행하는
[02:49]
여러 하위 에이전트들이 있고
[02:51]
이들이 멀티 에이전트 시스템으로
[02:53]
통합되어 우리가 인식하는
[02:55]
완전한 에이전트를 형성합니다. 예를 들어
[02:58]
전형적인 고객 서비스 에이전트는
[03:00]
보통 먼저 고객 문의를 처리하는
[03:02]
하위 에이전트로 나뉘는데, 이는
[03:04]
고객과 상호작용하면서 문제가
[03:06]
무엇인지 파악하고 이를 태그로 분류해
[03:08]
더 전문적인 하위 에이전트에게 전달합니다
[03:10]
예를 들어 최근 제 휴대폰 요금 결제
[03:13]
문제는 '청구 및 결제' 문제로
[03:15]
태그가 지정되어
[03:17]
청구와 결제를 전문적으로
[03:19]
처리하는 다른 하위 에이전트에게
[03:22]
전달됩니다
[03:23]
또한 IT나 영업, 그리고
[03:25]
통신사 고객 서비스의 다른 업무를 전문으로 하는
[03:26]
하위 에이전트들도 있습니다
[03:29]
참고로 이런 에이전트 워크플로우를
[03:31]
라우팅이라고 하는데
[03:33]
이러한 유형의 문제 해결에
[03:35]
매우 효과적인 것으로 입증되었습니다
[03:36]
나중에 라우팅과 다른 유형의
[03:38]
에이전트 워크플로우에 대해
[03:40]
더 자세히 설명하겠지만, 지금까지의 설명이
[03:42]
에이전트가 실제로 어떻게 작동하는지
[03:43]
이해하는 데 도움이 되었길 바랍니다
[03:45]
이는 에이전트를 구축할 때 매우 중요합니다
[03:48]
또한 여러분이 가질 수 있는
[03:50]
이런 의문에 답해드리고 싶습니다
[03:51]
왜 이런 멀티 에이전트 시스템과
[03:53]
다양한 구현 방식이 필요할까요?
[03:55]
그 이유는 에이전트를
[03:56]
기업의 인력과 비교하면
[03:58]
매우 직관적으로 이해할 수 있습니다
[03:59]
기업에서도 사람들은 각자 다른 역할을 맡습니다
[04:01]
한 사람이 모든 일을
[04:03]
동시에 처리하려고 하면
[04:04]
매우 혼란스러워지고
[04:06]
우선순위를 정하기 어려워지며
[04:08]
어떤 특정 업무도
[04:10]
제대로 수행하지 못하게 됩니다
[04:11]
에이전트도 마찬가지입니다
[04:13]
각각 다른 분야를 전문으로 하는
[04:15]
여러 에이전트들이 있을 때
[04:16]
모두가 협력하여 나오는 결과는
[04:17]
단일 AI 에이전트가 모든 것을
[04:19]
처리하려고 할 때보다
[04:21]
훨씬 더 좋은 성과를 낼 수 있습니다
[04:23]
자, 이제 한 걸음 물러서서
[04:24]
AI 에이전트의 구성 요소를 이해하기 위한
[04:26]
프레임워크를 설명해드리겠습니다
[04:29]
마치 햄버거를 만드는 것처럼
[04:31]
햄버거는 여러 구성 요소로 이루어져 있죠
[04:32]
빵, 패티, 채소, 소스가 있습니다
[04:34]
빵의 종류, 채소의 종류,
[04:36]
패티의 종류, 소스의 종류를
[04:38]
바꿀 수는 있지만
[04:40]
햄버거가 제대로 기능하기 위해서는
[04:42]
이 모든 구성 요소가 필요합니다
[04:46]
이상한 샌드위치나 핫도그가 아닌 진정한 햄버거처럼
[04:49]
에이전트도 마찬가지입니다. 여러 가지
[04:50]
다양한 구성 요소들이 있고 이들을
[04:51]
서로 바꿔가며 사용할 수 있지만
[04:52]
결국에는 에이전트가 되기 위해서는
[04:54]
이러한 필수 구성 요소들이 모두 필요합니다
[04:56]
하지만 오랫동안 정립되어 온 햄버거의
[04:58]
구성 요소들과는 달리
[05:00]
AI 에이전트를 구성하는 요소들은
[05:02]
아직 비교적 새로운 개념이라 사람들마다
[05:04]
서로 다른 정의를
[05:06]
사용하고 있습니다. 하지만 가장 포괄적이고
[05:08]
잘 정의된 것은 OpenAI에서 나온 것입니다
[05:10]
OpenAI는 에이전트 구축에 대해 설명하면서
[05:12]
모델, 도구, 지식과 메모리,
[05:14]
오디오와 음성, 가드레일,
[05:16]
오케스트레이션과 같은 여러 영역의
[05:18]
구성 요소들을 조합해야 한다고 하며, OpenAI는
[05:20]
각 영역에 대한 기본 요소들을 제공합니다
[05:22]
물론 OpenAI가 자사의 제품을
[05:24]
우선적으로 나열했지만
[05:26]
각각의 구성 요소들에 대해
[05:27]
실제로 다른 많은 도구들이
[05:28]
사용 가능합니다. 여러분이 만들고자 하는
[05:30]
에이전트의 유형에 따라
[05:31]
어떤 것이 더 나은지 달라지며, 이에 대해
[05:33]
각 구성 요소들을 더 자세히
[05:35]
설명하겠습니다. 하지만 먼저
[05:36]
매일같이 새로운 도구와
[05:38]
기술이 나오는 상황에서
[05:39]
압도감을 느끼실 수 있는데
[05:41]
당황하지 마시고 침착하세요
[05:43]
걱정하실 필요 없습니다. 왜냐하면
[05:45]
이러한 새로운 혁신이나
[05:47]
AI 에이전트를 혁신한다는 도구들도
[05:50]
결국에는 이 프레임워크의
[05:51]
한 부분이 될 뿐이기 때문입니다
[05:53]
마치 햄버거 소스 카테고리에
[05:55]
새로운 종류의 소스가 추가되는 것처럼
[05:57]
조금 더 매운맛이 추가되는 것과 같습니다
[06:00]
이해가 되셨길 바랍니다
[06:01]
이제 실제로 이러한
[06:03]
각각의 구성 요소들에 대해 알아보겠습니다
[06:05]
OpenAI는 이를 잘 정리한 표를 제공하는데
[06:07]
먼저 모델 구성 요소를 보면
[06:09]
AI 모델, 즉 대규모 언어 모델이 있습니다
[06:11]
이것이 핵심 지능으로서
[06:13]
추론하고 결정을 내리며
[06:15]
다양한 형태의 데이터를
[06:16]
처리할 수 있는 능력을 가지고 있죠
[06:18]
OpenAI가 제시하는 예시로는
[06:20]
GPT-3, GPT-3.5, GPT-4 등이 있습니다
[06:24]
여러분이 만들고자 하는
[06:26]
특정 유형의 에이전트에 따라
[06:27]
OpenAI 생태계 내에서 다른 모델을
[06:29]
선택할 수 있습니다. GPT-4는
[06:32]
대표 모델로서 사고하는 모델이며
[06:34]
추론과 다단계 문제 해결
[06:35]
복잡한 의사결정에 탁월하고
[06:37]
대부분의 질문에 잘 대답합니다
[06:39]
더 집중적인 작업이 필요한 경우
[06:40]
속도가 느리고 비용이 더
[06:42]
많이 든다는 단점이 있지만
[06:43]
GPT-4.5가 있는데, 이는 글쓰기와
[06:46]
새로운 아이디어 탐구에 적합합니다. 또한
[06:48]
GPT-3는 고급 추론 기능을 가지고 있으면서도
[06:50]
더 빠르며, GPT-3 Mini High는
[06:52]
특히 코딩과 논리에 강점이 있습니다. OpenAI
[06:54]
생태계 외에도 Claude 3.7 Sonnet은 보통
[06:56]
코딩과 추론, STEM 관련 작업을
[06:58]
많이 하는 사람들이 주로 선택하는
[07:01]
모델입니다. 현재는 Gemini 2.5 Pro가
[07:02]
이에 도전하고 있는 상황이지만
[07:05]
솔직히 말씀드리면
[07:07]
한 달 뒤나 이 영상을 보실 때쯤이면
[07:09]
아마도 순위가 모두
[07:10]
바뀌어 있을 겁니다만,
[07:12]
전반적으로 비용이 가장 중요하다면
[07:14]
오픈소스 모델을 선택하고
[07:15]
직접 호스팅하는 것이 좋습니다.
[07:17]
그리고 속도를 중시한다면
[07:18]
작은 규모의 모델을 선택하는 것이 좋고
[07:20]
현재 기준으로 대부분의 구글 모델들은
[07:22]
더 긴 컨텍스트 윈도우를 제공합니다.
[07:24]
만약 긴 컨텍스트 윈도우 유지가
[07:27]
중요하다면 이 점을 고려하세요.
[07:28]
참고로 다양한 웹사이트에서
[07:30]
이러한 모델들의 성능을 순위로 매기고 있습니다.
[07:31]
예를 들어 Vem(빔)이라는 사이트가 있는데
[07:33]
정확한 발음은 잘 모르겠네요.
[07:35]
여러분의 사용 목적에 따라
[07:36]
이러한 순위를 확인하고
[07:38]
필요에 가장 적합한 모델을
[07:40]
선택하실 수 있습니다.
[07:41]
다음은 도구 카테고리입니다.
[07:44]
도구의 중요성을 절대 과소평가하지 마세요.
[07:46]
여러분의 모델은 단순한 기본 모델일 뿐이며,
[07:48]
진정한 모델의 힘은
[07:50]
도구 사용 능력과 같은 다양한 기능을
[07:52]
추가할 때 발휘됩니다.
[07:54]
도구는 AI 에이전트가 웹 검색과 같은
[07:57]
실제 세계와 상호작용할 수 있게 해주죠.
[07:59]
여러분이 보는 모든 애플리케이션들은
[08:01]
잠재적으로 AI의 도구가 될 수 있습니다.
[08:03]
예를 들어 구글 제품들에 대한
[08:05]
접근 권한을 부여할 수 있죠.
[08:07]
Gmail이나 캘린더 같은 것들,
[08:09]
하드 드라이브에 있는 파일들,
[08:10]
화면에서 일어나는 일들,
[08:12]
그리고 Slack이나 Discord,
[08:14]
YouTube, Salesforce와 같은
[08:16]
여러분이 즐겨 사용하는 앱들에 대한 접근 권한도
[08:18]
제공할 수 있습니다. Zapier 등도 포함되죠.
[08:21]
또한 AI 에이전트에게 제공할
[08:22]
자체 커스텀 도구를 만들 수도 있습니다.
[08:24]
OpenAI의 에이전트 SDK를 사용한다면,
[08:26]
코딩 능력이 필요합니다.
[08:29]
이를 통해 자체 도구를 정의하고
[08:30]
웹 검색, 파일 검색,
[08:32]
컴퓨터 사용과 같은 내장 도구들도 사용할 수 있죠.
[08:34]
최근 주목받고 있는 MCP에 대해
[08:36]
들어보셨을 수도 있는데,
[08:38]
이는 Anthropic이 개발한 것으로
[08:40]
Model Context Protocol의 약자입니다.
[08:42]
이는 대규모 언어 모델에
[08:45]
도구를 제공하는 방식을
[08:47]
표준화하는 프로토콜입니다.
[08:48]
이는 큰 진전인데, 이전에는 개발자들이
[08:50]
에이전트에 다양한 도구를 제공하는 것이
[08:52]
매우 어려웠기 때문입니다.
[08:53]
각각의 소프트웨어가 서비스를
[08:55]
다르게 구성했기 때문에
[08:56]
개발자들은 이를 일일이 파악하고
[08:58]
조합해야 했습니다.
[09:00]
하지만 MCP는 이 과정을
[09:01]
훨씬 쉽게 만들어 주었죠.
[09:03]
코딩을 모르시더라도 걱정하지 마세요.
[09:05]
노코드나 로우코드 도구들도 많이 있어서
[09:07]
모델에 도구를 제공하는 기능이
[09:09]
내장되어 있습니다.
[09:11]
나중에 보여드릴 N8N같은 예시들은
[09:13]
드래그 앤 드롭으로 쉽게
[09:15]
다양한 도구를 연결할 수 있고
[09:17]
대규모 언어 모델과 쉽게 연동됩니다.
[09:19]
예를 들어, 시장 조사 에이전트를
[09:20]
만들려고 한다면
[09:24]
인터넷을 검색할 수 있는 도구가 필요하고
[09:25]
수집한 데이터를 분석할 수 있는 도구와
[09:27]
이메일 보고서를 보내고 싶다면
[09:29]
이메일에 접근할 수 있는
[09:30]
도구도 필요할 것입니다
[09:32]
이제 지식과 메모리로 넘어가보겠습니다
[09:34]
두 가지 유형이 있는데
[09:36]
첫 번째는
[09:38]
지식 베이스 또는 정적 메모리라고 합니다
[09:39]
이를 통해 AI 모델에 정적인 사실, 정책, 문서
[09:41]
즉, 참조하고 접근할 수 있는
[09:44]
정보를 제공할 수 있습니다
[09:45]
이는 시간이 지나도 비교적
[09:47]
변하지 않는 정보입니다
[09:48]
예를 들어 법률 업무를 처리하는
[09:50]
AI 에이전트를 만든다면
[09:52]
특정 사례나 회사에 대한
[09:55]
구체적인 법률 문서와
[09:57]
해당 회사와 관련된
[09:58]
특정 정책들이
[10:00]
필요할 것입니다. 다른 유형의 메모리는
[10:02]
영구 메모리입니다. 이는 AI 에이전트가
[10:03]
단일 세션을 넘어서
[10:05]
대화 기록이나 사용자 상호작용을
[10:07]
추적할 수 있게 해주는 메모리입니다
[10:09]
이는 많은 챗봇 사용 사례에서
[10:11]
매우 중요합니다. 예를 들어
[10:13]
AI 개인 비서가 있다면
[10:15]
그 개인 비서가
[10:16]
어제 일어난 일을
[10:18]
기억하게 하고 싶을 것입니다. OpenAI는
[10:20]
벡터 저장소, 파일 검색, 임베딩과 같은
[10:22]
자체 호스팅 서비스를 제공하며
[10:23]
오픈소스 버전도 있어서
[10:25]
자체 데이터베이스를 호스팅하고
[10:27]
RAG(검색 증강 생성)를
[10:29]
다양한 방식으로 수행할 수 있습니다
[10:30]
너무 자세한 내용은 다루지 않겠지만
[10:32]
사람들이 많이 사용하는
[10:33]
솔루션으로는 Pine Cone이 있는데
[10:35]
클라우드 네이티브이며 벡터 검색에
[10:37]
최적화되어 있고, 오픈소스인
[10:39]
Weaviate도 있습니다
[10:40]
노코드 솔루션을 선호한다면
[10:42]
이런 것들을 걱정할 필요가 없는데
[10:43]
보통 해당 솔루션에서 이미 처리되어 있기 때문입니다
[10:45]
예를 들어 N의 경우
[10:47]
복잡한 코딩 없이도
[10:50]
이러한 기능들을
[10:51]
사용할 수 있습니다. 다음은 오디오와
[10:53]
음성인데, 흥미로운 점은
[10:54]
OpenAI가 이것을 별도의 카테고리로
[10:57]
분류했다는 것입니다. 다른 프레임워크들은
[10:59]
이를 특별히 구분하지 않는데
[11:01]
제가 생각하기에 이렇게 구분한 이유는
[11:02]
최근 오디오 포맷에서
[11:04]
혁신적인 발전이 있었기 때문입니다
[11:06]
기본적으로 에이전트에 오디오와
[11:09]
음성 기능을 추가하면
[11:11]
자연어로 상호작용할 수 있게 됩니다
[11:12]
이는 챗봇 AI 에이전트에서
[11:14]
매우 중요한데, 자연어를 통한
[11:16]
직접적인 의사소통이
[11:17]
더 나은 사용자 경험을 제공할 수 있기 때문입니다
[11:20]
OpenAI 생태계 내에서는
[11:21]
자체적인 구현 방식이 있고
[11:23]
생태계 외부에서는
[11:25]
현재 사람들이 많이 사용하는 것이
[11:27]
11 Labs인데, 이는
[11:29]
음성 복제와 생성에
[11:31]
사용됩니다. 그리고 오디오
[11:32]
텍스트 변환의 경우에는
[11:34]
OpenAI의 Whisper 모델을
[11:36]
많이 사용합니다. 앞서 말씀드렸듯이
[11:38]
이러한 것들은 빠르게 변화하고 있어서
[11:39]
여러분이 이해해야 할 중요한 것은
[11:41]
특정 도구보다는 일반적인 카테고리와
[11:43]
구성 요소에 대한 이해입니다
[11:44]
다음 구성 요소는 가드레일입니다
[11:46]
가드레일은 매우 중요한데
[11:49]
부적절하거나 해로운, 또는
[11:51]
원하지 않는 동작을 방지하기 위해서죠
[11:53]
에이전트를 만들고 나면
[11:54]
실제로 의도한 대로
[11:56]
작동하는지, 다른 일을
[11:57]
하고 있지는 않은지 확인해야 합니다
[11:59]
고객 서비스 에이전트가 있다면
[12:00]
실제로 고객 서비스 관련
[12:02]
내용을 다루고 있는지 확인하고
[12:04]
갑자기 하이쿠를 읊지 않도록 해야 합니다
[12:06]
OpenAI 생태계 외에도
[12:08]
현재 Guardrails AI와 LangChain
[12:10]
가드레일이 인기가 있습니다
[12:12]
사실 이 카테고리에는 많은 옵션이 있는데
[12:14]
노코드 도구를 사용하시는 분들은
[12:16]
이 카테고리를 이해하는 것이
[12:17]
중요하지만, 대부분의 노코드 도구들은
[12:19]
이미 플랫폼 내에
[12:21]
솔루션이 내장되어 있습니다
[12:22]
마지막으로 오케스트레이션이 있는데
[12:24]
이것은 많이 간과되는 부분입니다
[12:26]
앞서 이야기했던 것처럼
[12:27]
서브 에이전트들을 어떻게
[12:28]
연결하여 최종 결과를
[12:30]
도출하는지에 대한 것입니다
[12:31]
여기에는 배포도 포함되는데
[12:33]
프로덕션 환경에서 작동하고
[12:35]
모니터링하며 에이전트를
[12:37]
개선하는 것을 포함합니다
[12:39]
에이전트를 배포하고 나서
[12:41]
그냥 방치해서는 안 됩니다
[12:43]
시간이 지나면서 모델도 계속 변하고
[12:44]
많은 기술과 사고방식이 변화하며
[12:46]
데이터도 계속 변화하기 때문에
[12:48]
지속적으로 모니터링하고
[12:49]
에이전트가 의도한 대로
[12:51]
작동하는지 확인해야 합니다
[12:52]
이 카테고리에도 많은
[12:54]
도구들이 있는데, 대부분
[12:55]
프레임워크가 있고
[12:57]
오케스트레이션 부분이
[12:59]
프레임워크에 내장되어 있습니다
[13:01]
OpenAI는 자체 시스템이 있고
[13:03]
Crew AI는 또 다른
[13:04]
멀티 에이전트 시스템 프레임워크로
[13:06]
자체적인 시스템을
[13:08]
오케스트레이션하고 배포합니다
[13:09]
LangChain도 매우 인기가 있는데
[13:11]
다양한 에이전트 상호작용을 관리하고
[13:12]
배포하는데 사용되며, Llama Index는
[13:15]
특히 문서와 관련된
[13:17]
AI 에이전트를 만들 때
[13:18]
정적 메모리와 지식 베이스가
[13:20]
많이 필요한 경우에 유용합니다
[13:23]
여기 AI 에이전트를 구성하는
[13:24]
다양한 구성 요소들을 기억하기 쉽게
[13:27]
도와줄 니모닉이 있는데
[13:29]
이것은 바로 지금부터 할
[13:31]
첫 번째 평가에 유용할 것입니다
[13:33]
화면에 몇 가지 질문을
[13:34]
보여드릴 텐데, 답변을 댓글로 달아서
[13:36]
지금까지 배운 내용을
[13:38]
잘 이해했는지 확인해보세요
[13:39]
이것이 AI 에이전트를 구축하는
[13:41]
매우 실용적인 가이드입니다. HubSpot은
[13:44]
비즈니스 관점에서 AI 에이전트 구축에 대한
[13:46]
매우 실용적인 무료 가이드를 제공하는데
[13:48]
이 무료 리소스는 오늘 우리가
[13:49]
다룬 모든 내용을 보완하는
[13:50]
아주 좋은 자료입니다
[13:52]
이제 이러한 AI 에이전트를 활용하여
[13:54]
최대의 비즈니스 성과를 창출하는 방법에 대해
[13:55]
플레이북에서 설명합니다
[13:57]
AI 에이전트가 현재 비즈니스에서
[13:58]
실제 사례와 함께 어떻게 활용되고 있는지
[14:00]
일반적인 함정들과
[14:02]
미래의 업무 환경에 대해 논의합니다
[14:04]
조직이 AI 에이전트를 구현하는 각 단계를
[14:05]
검토할 수 있는 체크리스트를 포함하고 있으며
[14:07]
최고의 투자 수익 기회 발굴부터
[14:09]
성공 지표 정의,
[14:11]
통합 및 확장에 이르기까지
[14:13]
자세히 다룹니다. 저는 이 자료를
[14:15]
이 링크에서 확인해보시기를
[14:16]
강력히 추천드립니다. 설명란에도
[14:17]
링크가 있습니다. HubSpot에
[14:19]
이런 실용적인 무료 자료를
[14:20]
만들어주시고 이 영상의 일부를
[14:22]
후원해주셔서 감사합니다. 이제 다시
[14:24]
영상으로 돌아가겠습니다. 자, 이제 AI 에이전트를
[14:26]
구성하는 요소들을 알았으니
[14:28]
구현 방법으로 넘어가보겠습니다
[14:31]
앞서 말씀드렸듯이
[14:32]
AI 에이전트는 대부분 단일 개체가 아니라
[14:34]
실제로는 서로 상호작용하는
[14:36]
여러 하위 에이전트로 나뉩니다
[14:38]
이러한 일반적인 에이전트 워크플로우와
[14:40]
에이전트 시스템을 다루는 제가 가장 좋아하는 자료는
[14:41]
Anthropic의 '효과적인 에이전트 구축'
[14:43]
가이드입니다. 함께 살펴보겠습니다
[14:45]
먼저 에이전트 시스템의 기본
[14:47]
구성 요소를 보겠습니다. 이것이
[14:49]
Anthropic이 말하는 강화된
[14:51]
LLM입니다. 이 이미지를 보면 입력,
[14:53]
LLM, 그리고 출력이 있음을 알 수 있습니다
[14:55]
LLM은 자체적으로 검색 쿼리를 생성하고
[14:57]
적절한 도구를 선택하며
[14:59]
메모리를 통해 어떤 정보를
[15:01]
유지할 필요가 있는지 결정할 수 있습니다
[15:03]
앞서 주의 깊게 보셨다면
[15:04]
이 강화된 LLM의 구성 요소와
[15:05]
OpenAI의 구성 요소 사이에
[15:07]
겹치는 부분이 있다는 것을 보셨을 겁니다
[15:09]
이 버전은 조금 더 기본적입니다
[15:11]
가드레일이나 오케스트레이션 같은 것들은
[15:13]
다루지 않지만
[15:14]
분명히 겹치는 부분이 있습니다
[15:16]
테스트와 배포에 관해서는
[15:18]
괜찮습니다. 이러한 특정 사항에 대해서는
[15:19]
OpenAI 구성 요소를 기억하시면 됩니다
[15:21]
참고로 이러한 강화된 LLM 구성 요소들은
[15:23]
하위 에이전트라고도 불립니다
[15:25]
이제 이러한 구성 요소들, 즉 하위
[15:28]
에이전트들이 어떻게 서로 맞물려
[15:30]
더 큰 AI 에이전트를 형성하기 위해
[15:31]
함께 작동하는지 살펴보겠습니다
[15:33]
가장 단순한 에이전트 워크플로우부터
[15:35]
시작해서
[15:36]
더 복잡하고 진정으로
[15:38]
자율적인 것들까지 살펴볼 것입니다
[15:39]
가장 단순한 일반적인 에이전트 워크플로우는
[15:41]
프롬프트 체이닝이라고 합니다
[15:43]
프롬프트 체이닝은 작업을 여러 단계로 분해하여
[15:45]
각 하위 에이전트가 이전 에이전트의
[15:48]
출력을 처리하는 방식입니다
[15:50]
가장 단순한 형태에서는
[15:52]
일종의 조립 라인과 같지만
[15:53]
다른 작업으로 분기할 수 있는
[15:55]
게이트를 추가할 수도 있습니다
[15:56]
하지만 기본 로직은 동일합니다. 입력이 있고
[15:58]
하위 에이전트가 그 입력을 처리한 다음
[15:59]
다른 하위 에이전트에게 전달하고
[16:01]
그 에이전트가 다른 작업을 수행하며
[16:02]
최종 출력을 얻을 때까지 이 과정이 계속됩니다
[16:04]
최종 출력을 얻을 때까지 이런 식의 구현이
[16:06]
가장 이상적인 상황은
[16:08]
작업을 쉽게 하위 작업으로 나눌 수 있고
[16:11]
분해할 수 있을 때입니다. 예를 들어
[16:13]
프롬프트 체이닝이 유용한 경우는
[16:15]
AI 에이전트가
[16:16]
보고서를 생성해야 할 때입니다. 입력은
[16:18]
사용자가 원하는 내용에 대한 설명이 될 수 있고
[16:20]
그러면 하위 에이전트가 그것을 받아
[16:22]
개요를 생성하고 이를 전달하여
[16:23]
다른 하위 에이전트가 특정 기준에 맞게
[16:25]
개요를 검토한 다음
[16:27]
작성자 하위 에이전트에게 전달하여
[16:29]
실제로 보고서를 작성하고
[16:30]
편집자 하위 에이전트가
[16:32]
보고서를 편집하면
[16:34]
최종 출력은 지정된 기준을
[16:35]
충족하는 보고서가 됩니다
[16:37]
라우팅은 또 다른 유형의 워크플로우로
[16:39]
입력이 들어오면
[16:40]
하위 에이전트가
[16:42]
특정 입력을 특정 후속 작업으로
[16:44]
지시하는 역할을 담당하고
[16:46]
각 작업은 해당 작업에 특화된
[16:48]
하위 에이전트가 관리합니다
[16:50]
처리가 끝나면 최종 출력을 얻게 됩니다
[16:52]
라우팅은 복잡한 작업에서 잘 작동하는데
[16:54]
특히 별도로 처리하는 것이
[16:55]
더 나은 distinct한 카테고리가 있을 때
[16:57]
유용합니다. 고전적인 예로
[16:58]
라우팅이 유용한 경우는
[17:00]
고객 서비스 봇이 있을 때입니다
[17:02]
고객 서비스 봇은
[17:04]
다양한 종류의 문의를 받게 되는데
[17:05]
일반적인 질문, 환불 요청
[17:07]
기술 지원 등 고객 서비스에
[17:09]
문의하는 모든 종류의 질문들이 있습니다
[17:11]
문의의 성격에 따라 첫 번째 하위 에이전트는
[17:12]
가장 관련성 높은 작업을
[17:14]
해당 작업에 특화된 하위 에이전트에게
[17:16]
전달할 수 있어야 합니다. 예를 들어
[17:18]
환불 요청이라면
[17:20]
환불 전문 하위 에이전트에게 전달되고
[17:22]
기술 지원 문의라면
[17:24]
기술 지원 처리를 전문으로 하는
[17:26]
AI 하위 에이전트에게 전달됩니다
[17:28]
또 다른 일반적인 사용 사례는
[17:30]
서로 다른 유형의 질문을
[17:32]
다른 모델에 라우팅하는 것입니다
[17:34]
일부 모델은 특정 작업에서
[17:36]
다른 모델보다 더 뛰어납니다. 예를 들어
[17:38]
어려운 STEM 관련 질문이라면
[17:39]
Claude Sonnet 3.7로 라우팅할 수 있고
[17:42]
쉬운 질문이고
[17:43]
속도가 중요하다면 Gemini Flash로
[17:45]
라우팅할 수 있습니다. 다음 워크플로우는
[17:47]
병렬화입니다. 병렬...아
[17:49]
이 특정 에이전트 워크플로우는
[17:51]
주로 두 가지 주요 변형이 있습니다
[17:54]
하위 에이전트들이
[17:56]
동시에 작업을 수행하고
[17:58]
모든 출력을 취합하는 방식입니다
[18:00]
첫 번째는 섹셔닝으로
[18:02]
작업을 독립적인 하위 작업으로 나누어
[18:04]
병렬로 실행하는 것이고
[18:05]
또는 투표 방식으로, 서로 다른
[18:07]
하위 에이전트들을 사용하여 동일한 작업을
[18:09]
여러 번 실행하여 다양한 출력을
[18:11]
취합하는 방식입니다. 섹셔닝의
[18:13]
예시로는 새로운 모델의
[18:15]
성능이 얼마나 좋은지
[18:16]
주어진 프롬프트에 대해 평가할 때
[18:19]
각 하위 에이전트가
[18:21]
모델 성능의 각기 다른 측면을
[18:22]
평가할 수 있습니다. 예를 들어
[18:24]
하나는 속도를 평가하고
[18:25]
다른 하나는 정확도를 평가하는 식입니다.
[18:28]
투표의 예시로는 코드의
[18:30]
취약점을 검토하는 것이 있는데,
[18:32]
여러 서브 에이전트들이
[18:33]
코드를 평가한 후
[18:35]
투표를 통해 실제 취약점인지
[18:37]
최종 결정을 내립니다.
[18:38]
다음으로 더욱 복잡한
[18:40]
오케스트레이터 워커 워크플로우입니다.
[18:42]
이는 병렬화와 비슷해 보이지만
[18:44]
중요한 차이점이 있습니다.
[18:46]
바로 수행할 하위 작업들이
[18:48]
미리 정해져 있지 않다는 점입니다.
[18:50]
이는 특히 정확히 어떤
[18:52]
하위 작업이 필요한지 예측할 수 없는
[18:54]
더 복잡한 문제에
[18:56]
매우 유용합니다.
[18:58]
예를 들어 코딩 에이전트를
[19:00]
만들 때
[19:01]
정확히 몇 개의 파일을
[19:03]
수정해야 하는지, 어떤 방식으로
[19:05]
변경해야 하는지 미리
[19:07]
알 수 없기 때문에
[19:09]
여러 파일을 동적으로
[19:11]
수정해야 합니다. 다른 예로
[19:13]
검색 작업이 있는데,
[19:14]
리서치 어시스턴트 에이전트는
[19:16]
다양한 출처에서 많은
[19:18]
다른 종류의 정보를 수집하고
[19:20]
분석해야 하므로 미리 정할 수 없습니다.
[19:21]
더욱 복잡한 것은
[19:23]
평가자-최적화자 워크플로우입니다.
[19:26]
이는 더욱 자율적인 상황에
[19:27]
가까워지는 것으로,
[19:29]
서브 에이전트에게 더 많은
[19:31]
자율성과 자유를 주어
[19:33]
무엇을 해야 할지 결정하게 합니다.
[19:35]
입력이 주어지면 첫 번째
[19:36]
서브 에이전트가 해결책을 생성하고
[19:38]
이를 평가자 서브 에이전트에게
[19:40]
전달합니다. 평가자 서브 에이전트는
[19:42]
이를 평가하여 승인하면
[19:44]
출력으로 내보내고,
[19:45]
충분히 좋지 않다고 판단하면
[19:47]
첫 번째 서브 에이전트에게
[19:48]
거절 의견과 함께
[19:50]
개선 피드백을 보냅니다.
[19:52]
이는 평가자 서브 에이전트가
[19:53]
해결책이 충분히 좋다고 판단할 때까지
[19:55]
계속되는 순환 루프입니다.
[19:57]
이 워크플로우는 특히
[19:59]
명확한 평가 기준이 있고
[20:01]
반복적인 개선이 가능할 때
[20:03]
유용합니다.
[20:04]
이 워크플로우의 좋은 예시는
[20:06]
문학 작품을 번역할 때입니다.
[20:08]
번역가 서브 에이전트가
[20:10]
처음에는 모든 뉘앑스를
[20:12]
잡아내지 못할 수 있으므로,
[20:14]
평가자 서브 에이전트가 피드백을 주고
[20:17]
첫 번째 에이전트는 이를 반영해
[20:19]
계속해서 개선합니다.
[20:21]
언어의 모든 뉘앑스를
[20:22]
잘 살릴 때까지 이 과정이 계속됩니다.
[20:24]
다른 예시로는
[20:26]
최종 보고서로 통합해야 하는
[20:28]
복잡한 검색 작업이 있습니다.
[20:29]
연구를 진행하면서 평가자 에이전트가
[20:32]
계속 검토하며
[20:33]
충분하지 않다고 판단하면
[20:35]
충분히 깊이 있는 연구가 아니라고 판단되면
[20:36]
계속 연구를 진행하고, 또 진행하면서
[20:38]
필요한 모든 정보를 수집할 수 있을 때까지
[20:40]
진행합니다. 이는 복잡한
[20:42]
보고서를 완벽하게 작성할 수 있을 때까지
[20:44]
계속되어야 합니다. 마지막으로
[20:46]
진정한 자율 에이전트 구현에 대해 살펴보겠습니다.
[20:49]
이것은 까다로운 부분인데, 구현 방식은
[20:52]
가장 단순하지만
[20:54]
매우 다양하고 잠재적으로
[20:56]
복잡한 해결책을 도출할 수 있기 때문입니다.
[20:58]
에이전트는 먼저 사람과 상호작용하여
[21:00]
작업을 시작하고, 일단 작업이
[21:02]
명확해지면 에이전트는 완전히 독립적으로
[21:05]
작동하게 됩니다. 에이전트는
[21:07]
어떤 형태의 행동을 수행하며
[21:09]
이는 환경에 영향을 미치게 됩니다.
[21:12]
에이전트는 환경으로부터
[21:13]
스스로 판단하여
[21:15]
자신의 행동 결과가 어떤 의미를 갖는지
[21:18]
파악해야 합니다. 예를 들어
[21:19]
도구를 사용하기로 결정하거나
[21:21]
코드를 실행하기로 결정했다면
[21:23]
스스로 판단하여 최종 목표를
[21:25]
향해 진전을 이루고 있는지
[21:28]
확인해야 합니다. 그리고
[21:29]
계속해서 환경으로부터 피드백을 받고
[21:31]
진행 상황을 판단하면서
[21:32]
최종적으로 자신에게 주어진
[21:34]
작업이 완료되었다고 느낄 때까지
[21:36]
계속합니다. 이러한 구현 방식,
[21:38]
즉 매우 자율적이고 자유로운 형태의
[21:40]
에이전트 구현은 주로
[21:42]
매우 열린 문제에 사용됩니다. 이는
[21:44]
필요한 단계의 수나
[21:46]
최종 결과에 도달하기 위한 정확한 경로를
[21:48]
예측하기 매우 어려운 경우입니다.
[21:50]
기본적으로 에이전트에게
[21:52]
'이것을 해결하라'고 지시하면
[21:54]
에이전트가 스스로 방법을 찾아내야 합니다.
[21:56]
어떤 작업이 필요한지,
[21:57]
목표를 향해 진전이 있는지,
[21:59]
그리고 언제 작업이
[22:01]
완료되었는지를 판단해야 합니다.
[22:03]
이런 방식으로 정말 놀라운
[22:05]
결과를 얻을 수 있지만
[22:07]
때로는, 아니 자주
[22:09]
매우 예측할 수 없는 결과가
[22:11]
나올 수 있습니다. Anthropic 문서의
[22:12]
예시를 보면 코딩 에이전트가
[22:15]
다양한 소프트웨어 엔지니어링
[22:16]
벤치마크 작업을 해결할 수 있는데
[22:18]
여기에는 여러 파일을
[22:20]
편집하는 작업이 포함됩니다. 또한
[22:22]
컴퓨터 사용 구현에서는 Claude가
[22:24]
컴퓨터를 사용하여
[22:25]
복잡한 컴퓨터 시스템의
[22:27]
모든 기능에 접근하여
[22:29]
특정 작업을 수행했습니다.
[22:31]
여기 코딩 AI 에이전트가
[22:33]
작업을 완료하기 위해 거친
[22:34]
경로를 보여주는 다이어그램이 있습니다.
[22:36]
많은 상호작용과
[22:37]
환경과의 피드백, 개선 과정을
[22:39]
거치면서 최종적으로
[22:40]
사람에게 결과를 보고하는 것을 볼 수 있습니다.
[22:42]
문서에서 제안하듯이
[22:44]
이런 완전 자율 구현은
[22:46]
일반적으로 권장되지 않습니다.
[22:48]
대부분의 경우
[22:49]
미리 정해진 에이전트 워크플로우를 사용하면
[22:51]
더 예측 가능한 결과를 얻을 수 있고
[22:53]
예측 가능한 결과를 얻을 수 있고 비용도 훨씬 저렴합니다.
[22:55]
이 글에서 계속 강조하는 것은
[22:57]
항상 가능한 한 가장 단순한 구현 방식을
[23:00]
선택해야 한다는 것입니다.
[23:02]
만약 AI 에이전트의 목표를
[23:04]
프롬프트 체이닝이나 라우팅으로 달성할 수 있다면
[23:05]
더 복잡한 방법을 사용하지 마세요.
[23:07]
이것은 AI 에이전트를 만들 때의
[23:09]
기본적인 원칙이며
[23:10]
실제로 엔지니어링이나
[23:12]
개발 전반에 해당됩니다.
[23:14]
과도한 엔지니어링은 피하세요.
[23:15]
자, 이제 다양한 워크플로우를 살펴봤으니
[23:18]
AI 에이전트를 위한 프롬프트 엔지니어링에 대해
[23:20]
실용적인 관점에서 빠르게 알아보겠습니다.
[23:22]
이러한 AI 에이전트에서
[23:23]
프롬프트 엔지니어링과 프롬프트는
[23:25]
매우 중요합니다. 모든 것을 연결하는
[23:27]
핵심이기 때문입니다. 에이전트가 있고
[23:29]
여러 도구들이 있으며
[23:30]
멋진 기능들에 접근할 수 있더라도
[23:32]
좋은 프롬프트가 없다면
[23:33]
이 모든 것을 하나로 묶을 수 없습니다.
[23:34]
그래서 이 부분을
[23:36]
강조하려고 합니다.
[23:37]
AI 에이전트를 위한 프롬프트를 작성할 때는
[23:39]
전체 프롬프트가 한번에 모두 필요합니다.
[23:41]
과정 중에 대화식으로
[23:43]
수정하거나 정보를 추가할 수 없기 때문입니다.
[23:45]
AI 에이전트 프롬프트에는
[23:46]
여섯 가지 구성 요소를
[23:48]
고려해야 합니다.
[23:50]
첫 번째는 역할 지정입니다.
[23:52]
여기서는 AI 연구 보조원이라고 알려주지만
[23:53]
어조와 행동 방식도
[23:55]
포함해야 합니다.
[23:57]
예를 들어, '당신은
[23:58]
AI 연구 보조원이며 최신 인공지능 뉴스를
[24:00]
요약하는 것이 임무입니다.
[24:01]
인공지능 관련
[24:03]
당신의 스타일은 간결하고
[24:05]
직접적이며 핵심 정보에
[24:06]
집중합니다'라고 쓸 수 있습니다.
[24:08]
다음은 작업입니다. 'AI 뉴스와 관련된
[24:10]
검색어가 주어지면 핵심 포인트를 간단히 요약하세요'
[24:12]
라고 쓸 수 있습니다. 그 다음은 입력입니다.
[24:14]
여기서는 AI 연구 보조원이
[24:16]
받게 될 것을
[24:18]
명시합니다. 이 경우에는
[24:19]
사용자가 제공하는 AI 관련 검색어가
[24:21]
입력이 된다고 쓸 수 있습니다.
[24:23]
하지만 다른 입력도
[24:24]
있을 수 있죠. AI 연구 보조원이
[24:25]
받을 수 있는
[24:27]
그래프나 다른 문서들처럼요.
[24:29]
AI 보조원이
[24:30]
정확히 무엇을 받게 될지
[24:32]
명시해야 합니다. 네 번째는 출력입니다.
[24:35]
여기서는 AI 연구 보조원이
[24:36]
무엇을 만들어내야 하는지
[24:38]
자세히 설명해야 합니다.
[24:40]
최종 결과물이 어떤 모습이어야 하는지
[24:41]
최종 산출물은 무엇인지,
[24:43]
이 경우에는 '오직 간결하고
[24:45]
정보가 풍부한 요약만 제공하되
[24:47]
검색어와 관련된 최신 AI 뉴스의
[24:49]
핵심을 담아내야 합니다'라고 쓸 수 있습니다.
[24:52]
요약은 간결해야 하며
[24:53]
2-3개의 짧은 단락으로
[24:55]
총 300단어를 넘지 않아야 합니다.'
[24:57]
이렇게 하면 정확히
[24:58]
무엇을 출력해야 하는지 알 수 있습니다.
[25:00]
프레임워크의 다섯 번째 단계는 제약 조건입니다.
[25:02]
이것은 정말 정말 중요한 부분입니다.
[25:04]
프롬프트에 포함해야 할 중요한 사항은
[25:06]
해야 할 일뿐만 아니라
[25:08]
하지 말아야 할 일도 포함해야 합니다
[25:09]
예를 들어 '핵심 포인트를 간단히 포착하되
[25:11]
완벽한 문장과 문법은 필요하지 않습니다.
[25:13]
불필요한 배경 정보와 설명은 무시하고
[25:15]
개인적인 분석이나 의견은 포함하지 마세요.
[25:17]
AI 에이전트에 대해서는 신경 쓰지 말고
[25:19]
사실에만 집중하세요'라고 작성할 수 있습니다
[25:21]
마지막으로 기능과 리마인더가 있는데
[25:23]
이는 AI가 사용할 수 있는 도구와
[25:25]
특정 기능들을 알려주는 부분입니다
[25:27]
예를 들어 웹 검색과 같은 도구나
[25:29]
AI가 반드시 기억해야 할
[25:31]
중요한 사항들을 상기시켜주는
[25:33]
정말 중요한 내용들을
[25:34]
계속 상기시켜주는 것이 필요합니다
[25:36]
이 예시에서는 AI 에이전트에
[25:39]
웹 검색 기능을 부여했으므로
[25:41]
'웹 검색 도구에 접근할 수 있으며
[25:43]
검색어와 관련된 최신 뉴스 기사를
[25:44]
찾아서 가져올 수 있습니다'라고 알려줍니다
[25:46]
또한 현재 날짜를 잘 인식하도록
[25:48]
상기시켜주어야 합니다
[25:51]
많은 LLM이 가지고 있는 일반적인 문제는
[25:53]
현재 날짜나 시간을
[25:56]
정확히 인식하지 못한다는 것입니다
[25:58]
현재 관련된 정보만 검색하려면
[26:00]
시간을 정확히 인식하고
[26:02]
검색 기간을 설정해야 하므로
[26:04]
이렇게 작성할 수 있습니다:
[26:06]
'현재 날짜를 정확히 인식하여
[26:07]
뉴스의 관련성을 확인하고
[26:09]
최근 7일 이내에 발행된 정보만
[26:11]
요약해야 합니다' 일반적인 팁으로
[26:14]
중요한 내용일수록
[26:16]
프롬프트의 아래쪽에
[26:18]
배치하는 것이 좋습니다
[26:20]
이는 AI가 정보를 처리하는 방식과
[26:22]
관련이 있는데
[26:24]
가장 최근의 정보를 우선 처리하는
[26:25]
편향성이 있기 때문입니다. 이것으로 AI 에이전트
[26:29]
프롬프트 엔지니어링 속성 강좌를 마칩니다
[26:30]
여러분이 기초부터 배우게 한 것에 대해
[26:32]
화내지 않으셨으면 좋겠습니다
[26:34]
요즘 많은 사람들이
[26:35]
바이브 코딩을 하면서
[26:37]
기초를 모르는 채로 진행하다가
[26:39]
결국 여러분이 만든 것이
[26:40]
그다지 좋지 않은
[26:42]
결과물이 되거나
[26:44]
약간의 수정이 필요할 때
[26:45]
기초가 부족해서
[26:47]
실수를 많이 하게 됩니다
[26:48]
이제 여러분은 기초 지식을 갖추었으니
[26:50]
실제로 무언가를 만들 수 있는
[26:52]
지식과 자신감을 가지고
[26:54]
최선의 구현방법으로
[26:56]
진행할 수 있게 되었습니다
[26:58]
이제 화면에 퀴즈를 보여드리겠습니다
[27:00]
댓글 섹션에 답변을 남겨주세요
[27:02]
제가 설명한 내용을
[27:04]
잘 이해하고 있는지
[27:05]
확인하기 위해서입니다
[27:07]
다음 섹션에서는
[27:09]
AI 에이전트의 실제 구현을 보여드리겠습니다
[27:11]
노코드와 로우코드 예제들과
[27:14]
완전한 코딩 예제도 포함되어 있어서
[27:16]
모든 수준의 사람들이
[27:18]
참고할 수 있을 것입니다
[27:21]
여기 고객 지원 AI 에이전트가 있는데
[27:24]
이것은 N8N을 사용해서 구현했습니다
[27:27]
N8N은 노코드 플랫폼입니다
[27:29]
코드나 로우 코드 플랫폼으로
[27:31]
매우 사용하기 쉽고
[27:32]
다양한 AI 에이전트를 만들 수 있습니다.
[27:34]
이번에는 AI 에이전트를
[27:36]
멀티 에이전트 시스템으로 구현했는데
[27:38]
앞서 설명한 라우팅 에이전트 패턴을 따릅니다.
[27:40]
작동 방식을 보면, 고객이
[27:42]
이메일 문의를 보내면
[27:44]
텍스트 분류기가 있어서
[27:46]
OpenAI 모델을 기반으로
[27:48]
문의 내용을 분류합니다.
[27:50]
기술 지원, 결제, 일반 문의로
[27:52]
구분하고 각각의 카테고리마다
[27:54]
특별한 워크플로우가 있습니다. 직접 보여드리죠.
[27:56]
실제로 어떻게 작동하는지 제
[27:58]
이메일로 가보겠습니다. 고객 지원팀에
[28:00]
이메일을 작성해볼 건데
[28:03]
보낼 주소는
[28:06]
화가 난 상태로 환불을 요청해보겠습니다. '안녕하세요, 환불 원합니다.'
[28:10]
보내기를 누르면, 보시다시피
[28:13]
이메일이 도착했고 결제 관련 사항으로 분류되었습니다.
[28:15]
AI 에이전트가 작동하기 시작하고
[28:18]
AI 에이전트는 이메일을 분석해서
[28:21]
문의에 대한 답변을 보내주는데
[28:23]
이메일을 다시 확인해보면
[28:25]
에이전트가 답장을 보냈네요. '안녕하세요,
[28:27]
환불 요청과 관련하여 연락주셔서 감사합니다.
[28:28]
효과적인 도움을 드리기 위해
[28:30]
블라블라' 이런 식으로
[28:31]
정보를 제공하고
[28:33]
에이전트에게 그 정보를 보내서
[28:35]
환불 처리를 진행할 수 있습니다.
[28:37]
기술 지원으로 분류된 경우에도
[28:39]
워크플로우가 있어서, 만약
[28:40]
문서를 통해 기술 지원 질문에
[28:42]
직접 답변할 수 있다고 판단되면
[28:44]
바로 이메일로 답변을 보내줍니다.
[28:46]
하지만 여기에는 또 다른 옵션이 있는데
[28:48]
만약 기술 지원 관점에서
[28:50]
어떻게 도와줘야 할지 모르겠다면
[28:51]
실제로 에스컬레이션이 발생하여
[28:53]
디스코드로 이렇게 전달됩니다.
[28:55]
'팀원 여러분, 고객이 도움이 필요합니다.
[28:57]
자세한 조사가 필요합니다. 이메일 ID는
[28:59]
이 ID입니다.' 이렇게 해서 실제 상담원이
[29:01]
개입하여 고객 지원을 시작할 수 있습니다.
[29:03]
이 부분이 정말 중요한데
[29:05]
왜냐하면 AI 에이전트에는
[29:06]
항상 실제 사람에게
[29:08]
에스컬레이션할 수 있는
[29:09]
방법이 있어야 하기 때문입니다.
[29:10]
물론 일반 문의인 경우에는
[29:12]
이쪽 분기로 라우팅되어
[29:14]
추가 정보를 요청하는 일반적인 이메일을 보냅니다.
[29:18]
이것은 또 다른 AI 에이전트인데,
[29:20]
AI 뉴스 취합 에이전트입니다. 작동 방식은
[29:23]
매일 아침 7시에 스케줄이 실행되어
[29:25]
뉴스레터와 레딧에서
[29:27]
정보와 뉴스를 수집하고
[29:29]
다양한 뉴스레터와 레딧으로부터
[29:32]
모든 정보를 취합한 다음
[29:33]
최종적으로 요약본을 만들어
[29:35]
WhatsApp으로 보내줍니다.
[29:37]
이것은 병렬화 워크플로우
[29:39]
패턴의 예시입니다.
[29:41]
지금은 아침 7시가 아니지만,
[29:43]
워크플로우를 직접 실행해서
[29:45]
작동하는 것을 보여드리겠습니다.
[29:47]
지금 모든 것이
[29:49]
실행되고 있는데,
[29:50]
한 가지 주목할 점은
[29:52]
병렬화 워크플로우임에도
[29:53]
NATO의 한계점은 실제로
[29:56]
순차적으로 실행된다는 것입니다. 만약
[29:57]
OpenAI의 에이전트 SDK와 같은 코딩 도구로 구현한다면
[30:00]
곧 예시를 보여드리겠지만
[30:01]
병렬로 실행될 수 있습니다.
[30:03]
하지만 실제로는
[30:05]
알려드리고 싶은 점은, 기술적으로는
[30:06]
병렬화가 가능하지만
[30:08]
플랫폼의 한계로 인해
[30:10]
그렇게 할 수 없다는 것입니다.
[30:12]
실행 후에는 WhatsApp으로
[30:14]
모든 뉴스 소스에서 수집된
[30:16]
종합 정보를 알림으로 받게 됩니다.
[30:18]
예를 들어 OpenAI의 GPT-5 알파 출시,
[30:20]
구글의 AI 윤리, 규제 발전 등
[30:23]
이런 다양한 소식들이
[30:24]
모두 포함되어 있죠.
[30:26]
프롬프트에서 소스를
[30:27]
인용하도록 지정했기 때문에
[30:29]
각각의 뉴스에 대해
[30:30]
더 자세히 알고 싶다면
[30:33]
클릭해서
[30:35]
원본 소스를 직접 확인할 수 있습니다.
[30:36]
이것은 정말 유용한 AI 에이전트인데
[30:39]
이 프롬프트에서 보시다시피
[30:41]
제가 관심 있는 분야를 정확히 지정할 수 있습니다.
[30:43]
예를 들어, 뉴스레터에서 제공하는
[30:45]
AI 관련 검색어처럼
[30:47]
원하는 내용과
[30:49]
요약 방식, 정보 취합 방식을
[30:51]
모두 원하는 대로 설정할 수 있어요.
[30:52]
모든 것을 원하는 방식으로
[30:54]
종합할 수 있어서
[30:56]
정말 편리한 도구입니다.
[30:58]
여러분에게도 유용할 것 같은데
[31:00]
특히 매일 많은 정보를
[31:02]
처리해야 하는 분들에게 좋을 것 같네요.
[31:05]
마지막 NATO 예제는 다중 입력 일일 지출 추적
[31:08]
AI 에이전트입니다. 이름이 좀 길죠.
[31:11]
작동 방식을 설명하자면,
[31:13]
WhatsApp으로 상호작용하며
[31:14]
영수증 사진을 보낼 수도 있고
[31:16]
지출한 내역을
[31:18]
텍스트로도 보낼 수 있습니다.
[31:20]
예를 들어 10달러를 썼다면
[31:21]
그냥 10달러 썼다고 메시지를 보내면 되고
[31:23]
이 모든 정보를 취합해서
[31:25]
최종적으로 모든 내용을 종합하여
[31:27]
매일 지출 추적 보고서를 만들어 줍니다.
[31:29]
또한 구글 시트에 모든 내용을 저장하고
[31:31]
보고서를 만들어
[31:33]
WhatsApp으로도 보내줍니다.
[31:35]
그리고 매일 밤 9시에
[31:36]
WhatsApp으로
[31:39]
하루 동안 얼마나 지출했는지
[31:41]
요약해서 보내줍니다. 예를 들어
[31:43]
제가 감자에 10달러를 썼다고 했는데
[31:45]
왜 감자에 10달러나 썼는지 모르겠네요.
[31:48]
감자 10달러는 정말 비싸죠.
[31:50]
이게 지출 추적기에 기록되어서
[31:52]
감자 구매가 여기 표시됩니다.
[31:55]
감자 10달러, 그리고
[31:56]
제가 구매한 다른 물건들도 모두 있네요.
[31:58]
요즘 제가 많이 구매했더군요.
[32:00]
그리고 밤에는 제 소비가
[32:04]
생활비에 집중되어 있다고 알려주는데,
[32:05]
특히 감자 구매에 10달러를 썼다고 하네요.
[32:07]
이는 단순하고 필수적인 지출 패턴을 보여주며
[32:09]
그날은 다른 지출이
[32:11]
기록되지 않았다고 합니다.
[32:12]
이전 며칠 동안은
[32:14]
감자 하나보다 더 많이 구매했을 때는
[32:16]
이렇게 나와 있네요.
[32:18]
2025년 4월 7일의 지출 내역을 보면
[32:20]
식비가 상당히 큰 비중을 차지했는데
[32:22]
스테이크와 초콜릿 같은 대규모 구매로
[32:23]
총 4,000달러가 소비되어 식비가 가장 큰 카테고리였고
[32:26]
생활비 항목에서는 소소한 지출이
[32:28]
있었는데 땅콩 구매가
[32:30]
기록되어 있네요. 이건 정확하지 않은데
[32:32]
보시다시피 프롬프트를
[32:33]
좀 더 수정해야 할 것 같습니다
[32:35]
음... 하지만 이건
[32:36]
제가 설명한 방식을 기반으로
[32:39]
지출을 추적하는 방법의 예시입니다
[32:41]
이 일일 지출 추적 AI 에이전트가
[32:44]
어떤 유전적 워크플로우
[32:46]
디자인 패턴으로 구현되었을지
[32:48]
댓글로 달아주세요
[32:51]
자
[32:54]
이제 코드로 구현된 예시를 보여드리겠습니다
[32:56]
특히 이것은
[32:58]
OpenAI의 에이전트 SDK를 사용해서
[33:00]
파이썬으로 구현되었고
[33:03]
금융 리서치 어시스턴트로
[33:05]
질문을 받아서 인터넷을 검색하고
[33:07]
정보를 수집하여 종합할 수 있으며
[33:09]
음성 기능과
[33:10]
언어 및 번역 기능도
[33:12]
포함되어 있습니다
[33:14]
이는 라우팅 에이전트
[33:16]
디자인 워크플로우 패턴을 따르는데
[33:18]
메인 매니저가 있고, 사실 제가
[33:20]
코드를 보여주면서 설명하는 대신
[33:22]
커서를 사용해서
[33:23]
AI 에이전트가 어떻게
[33:25]
작동하는지 보여드리고 실행도 해보겠습니다
[33:27]
이건 제 바이브 코딩 영상의
[33:29]
미리보기인데, 약 2주 후에
[33:31]
공개될 예정이니 기대해 주세요
[33:33]
자, 이제 금융 리서치
[33:35]
어시스턴트 에이전트가 어떻게
[33:37]
작동하는지 설명해 보겠습니다
[33:41]
메인 오케스트레이터로 금융 리서치 매니저가 있고
[33:45]
핵심 워크플로우 단계는
[33:47]
계획, 검색 수행, 보고서 작성
[33:50]
보고서 검증으로 이루어집니다
[33:52]
매니저가 프로그램을 시작하면
[33:54]
플래너 에이전트에게 전달되는데
[33:56]
플래너 에이전트는
[33:58]
사용자의 질의를
[34:00]
특정 검색어로 분해합니다
[34:02]
각 검색어에는 질의와
[34:04]
검색 이유가 포함되어 있고
[34:05]
여러 검색 항목이 포함된
[34:07]
금융 검색 계획을 반환합니다
[34:09]
그런 다음 검색어를
[34:11]
검색 에이전트에 전달하여
[34:13]
각각의 검색을 수행하고
[34:15]
모든 검색 결과를
[34:16]
수집하고 종합합니다
[34:18]
그 다음 분석 단계로 넘어가는데
[34:20]
여러 전문 에이전트들이 각각의
[34:21]
역할을 수행합니다
[34:23]
여기서는 두 개의 에이전트가 있는데
[34:25]
먼저 금융 에이전트가
[34:26]
주요 재무 지표를 분석하고
[34:28]
리스크 에이전트는
[34:30]
잠재적 위험 신호를 식별합니다
[34:32]
두 에이전트 모두 분석 요약을 제공하고
[34:34]
이 분석 요약들은
[34:36]
보고서 작성 단계로 전달되어
[34:38]
작성 에이전트가
[34:40]
모든 정보를 종합하여
[34:42]
검색어와 금융 및 리스크 분석을
[34:43]
하나로 통합합니다
[34:45]
그리고 마크다운을 사용하여 구조화된 보고서를 생성합니다
[34:47]
요약본과 후속 질문도 포함되어 있죠
[34:49]
그 다음에는 검증 에이전트가 있어서
[34:51]
보고서의 정확성과 완성도를
[34:52]
검토합니다. 우리는 또한
[34:54]
음성 상호작용 기능도
[34:56]
포함시켰는데, 이를 통해
[34:57]
생성된 보고서를 바탕으로
[34:58]
음성으로 질문하고 소통할 수 있습니다
[35:01]
마지막으로 금융 보고서에 대한
[35:02]
결과물을 얻게 됩니다
[35:04]
보시다시피 이것은 프롬프트 체이닝 에이전트
[35:06]
워크플로우를 기반으로 구현되었는데
[35:08]
메인 오케스트레이터 매니저가
[35:10]
쿼리를 시작하고 이를
[35:12]
플래너 에이전트와 검색 에이전트,
[35:14]
그리고 다른 여러 에이전트들에게 전달하여
[35:16]
최종적으로 금융 보고서를
[35:19]
텍스트 파일로 받게 됩니다
[35:21]
모든 결과가 금융 보고서 텍스트 파일에
[35:23]
포함되어 있습니다. 이제 실제로 실행해 보겠습니다
[35:26]
금융 리서치 에이전트를 실행해 보죠
[35:29]
철자가 틀려도 괜찮아요
[35:31]
참고로 AI 코딩 에이전트 코딩 에디터를
[35:34]
처음 보시는 분들을 위해 말씀드리면
[35:36]
실제로 이런 식으로 작동합니다
[35:37]
제가 Cursor나 Windsurfer를 사용하기 시작한 이후
[35:39]
그리고 AI 코딩 에이전트들을
[35:41]
전반적으로 사용하면서 정말 혁신적인 변화를 경험했습니다
[35:44]
사람들이 코드를 작성하고 실행하는 방식에 있어서요
[35:46]
좋습니다. 이제 작동하도록 두겠습니다
[35:48]
먼저 금융 리서치 에이전트 실행을 도와준다고 하네요
[35:50]
필요한 모든 것이 있는지
[35:51]
작업 공간을 먼저 확인하고
[35:52]
필요한 것들을 체크한다고 합니다
[35:54]
자, 그렇게 하도록 두죠
[35:56]
몇 가지 설치가 필요하다고 하니
[35:58]
설치를 진행하겠습니다
[35:59]
의존성 패키지들을 설치하는 중에 오류가 발생했네요
[36:03]
추가 작업을 더 실행해보죠
[36:05]
5분 후... 모든 의존성 패키지를
[36:08]
실행한 후에 서버가
[36:11]
실행 중이라고 하네요. 이제
[36:13]
금융 리서치 에이전트를 실행해보겠습니다
[36:15]
테슬라의 주요 재무 지표가 무엇인지
[36:18]
입력해보겠습니다
[36:21]
실행해볼게요... 아, 작동하지 않네요
[36:25]
사실 대부분의 라이브 코딩은
[36:27]
실행하고 설치하고
[36:29]
문제를 스스로 해결하도록 두는 과정입니다
[36:31]
그래서 우리는 잠시
[36:33]
기다려보겠습니다
[36:34]
좋아요, 금융 리서치 쿼리를 입력하라고 하네요
[36:36]
아, OpenAI 키가 없는 것 같네요
[36:39]
제가 키를 입력하겠습니다
[36:41]
테슬라의 주요 지표에 대해 입력했고
[36:45]
금융 리서치를 시작하고 있습니다
[36:47]
7개의 검색을 수행할 예정이고
[36:49]
검색, 계획, 보고서 구조화를 진행 중입니다
[36:51]
자, 이제 보고서가 나왔네요
[36:55]
좋습니다. 금융 에이전트가
[36:56]
포괄적인 보고서를 성공적으로
[36:59]
생성했고, 여기서
[37:00]
보고서를 확인할 수 있습니다
[37:03]
모든 내용을 직접 읽는 대신
[37:06]
구현된 음성 기능을
[37:08]
사용해보도록 하겠습니다
[37:10]
음성 기능을 실행하고
[37:13]
보고서의 주요 지표에 대해 설명해달라고 해보죠
[37:15]
네, 보고서에서 언급된 주요 재무 지표는 다음과 같습니다
[37:17]
첫째, 수익입니다. 테슬라는
[37:19]
249억 3천만 달러의 매출을 기록했습니다
[37:22]
이 상당한 매출 수치는 주로
[37:25]
성공적인 판매 실적에
[37:27]
기인했는데요
[37:29]
Model 3와 Model Y 차량의 판매 성과와
[37:33]
베를린과 텍사스 공장의 전략적 확장으로 인한 것입니다.
[37:35]
따라서 음성으로 직접 소통할 수 있으며,
[37:38]
마지막으로 여러분께 보여드리고 싶은 것은
[37:40]
보고서를 스페인어로 번역하는 방법입니다.
[37:42]
이것은 MCP를 사용하는데, 이를 통해
[37:46]
보고서를 스페인어로 번역할 수 있는
[37:48]
도구에 접근할 수 있게 됩니다.
[37:51]
여기 보시는 것처럼 번역이 완료되었습니다.
[37:54]
이것이 코드 구현의 예시이며,
[37:56]
코드를 확인하고 싶으시다면
[37:58]
설명란에 링크를 달아두었으니
[38:00]
직접 확인하고 실험해보실 수 있습니다.
[38:01]
기억하셔야 할 점은
[38:02]
AI 에이전트를 구현하는 방법이
[38:04]
매우 다양하다는 것입니다.
[38:05]
여러분이 만들고자 하는 AI 에이전트와
[38:07]
본인의 기술 수준에 맞는
[38:08]
방법을 선택하시면 됩니다.
[38:10]
그리고 AI 에이전트와
[38:12]
그 개발 방법에 대해
[38:13]
더 자세히 알고 싶으시다면,
[38:15]
앞으로 몇 주 안에
[38:16]
AI 에이전트 부트캠프를 시작할 예정입니다.
[38:18]
4주 과정으로 진행되며,
[38:19]
매우 실용적인 프로그램입니다.
[38:21]
이 영상에서 보신 것과 같은
[38:22]
AI 에이전트를 직접 만들어보고,
[38:24]
더 나아가 더 고급스럽고
[38:25]
특정 사용 사례에 맞춘
[38:26]
커스텀 에이전트도 만들어볼 수 있습니다.
[38:29]
관심 있으시다면 여기 링크를
[38:30]
확인해주세요. 설명란에도 있습니다.
[38:32]
영상을 그냥 여기서 끝내고
[38:34]
"자 이제 가서 AI 에이전트를 만드세요"라고
[38:35]
하는 대신, 마지막 섹션에서
[38:37]
여러분과 공유하고 싶은 것이 있습니다.
[38:38]
바로 어떤 종류의 AI 에이전트를
[38:40]
만들어야 할지에 대해
[38:42]
어떻게 생각해야 하는지입니다.
[38:44]
왜냐하면 결국 우리는
[38:45]
단순히 재미로 AI 에이전트를
[38:46]
만드는 것이 아니기 때문입니다.
[38:49]
물론 그럴 수도 있겠죠.
[38:50]
그것도 좋습니다만, 대부분의 경우
[38:52]
우리는 AI 에이전트를 만들어서
[38:54]
우리에게, 비즈니스에, 기업에
[38:56]
도움이 되게 하려고 하죠.
[38:58]
어쩌면 여러분 중에는
[38:59]
AI 에이전트 비즈니스나
[39:01]
스타트업을 시작하고 싶은 분도 계실 텐데,
[39:02]
아직 보지 않으셨다면
[39:04]
Y Combinator YouTube 채널을 꼭 확인해보세요.
[39:06]
저는 거기서 정말 많이 배웠습니다.
[39:08]
어떤 AI 에이전트를 만들어야 하는지,
[39:09]
어떤 스타트업을 해야 하는지,
[39:11]
AI 분야에서 주의해야 할 점들에 대해
[39:13]
그들의 영상은 정말 가치가 있습니다.
[39:15]
지금부터 제가 그 영상에서 얻은
[39:17]
주요 인사이트를 공유하겠습니다.
[39:18]
바로 AI 스타트업 아이디어를
[39:19]
찾는 방법입니다.
[39:21]
유용한 AI 에이전트를 만드는
[39:23]
가장 쉬운 방법은 자신으로부터 시작하는 것입니다.
[39:26]
현재 여러분이 하고 있는 일 중에서
[39:28]
AI 에이전트에게 맡길 수 있다면
[39:30]
삶이 훨씬 더 편해질 만한 것이 무엇일까요?
[39:32]
지금 당장은 어떤 도구나
[39:33]
프레임워크, 기술 스택을
[39:34]
사용할지 걱정하지 마세요.
[39:36]
그저 생각해보세요.
[39:38]
무엇을 자동화하면 삶이
[39:40]
훨씬 더 편해질 수 있을지를요.
[39:42]
예를 들어, 저는 훌륭한 팀 및 에이전시와 일하고 있는데
[39:44]
우리 팀이 제 스폰서십을 관리해주고 있는데
[39:46]
팀원 중 한 명이
[39:48]
슬랙으로 메시지를 보내왔어요.
[39:49]
AI 에이전트를 만들어서
[39:51]
이메일에 접근하여
[39:54]
좋은 리드와 나쁜 리드를 구분하고
[39:55]
좋은 리드로 판단되는 이메일에만
[39:57]
응답하고 싶다고 했죠.
[39:59]
저는 이게 정말 좋은 아이디어라고 생각했고
[40:01]
"정말 좋은 생각이에요.
[40:02]
꼭 해보세요"라고 했죠. 게다가
[40:03]
노코드로도 충분히 만들 수 있어요.
[40:05]
제가 앞서 공유한 프롬프트를 사용해서
[40:06]
이 상황에 가장 적합한
[40:08]
에이전트 워크플로우를 파악하고
[40:10]
노코드 도구로 구현할 수 있죠.
[40:12]
하지만 만약 여러분이
[40:13]
현재 일을 하면서 매일 문제를 해결하는
[40:15]
입장이 아니라면 어떨까요?
[40:16]
예를 들어 막 졸업했거나
[40:18]
아직 학생인 경우처럼 말이에요.
[40:19]
걱정하지 마세요. YC에서도 이런 경우에 대한
[40:22]
좋은 조언이 있어요.
[40:23]
이런 경우에는
[40:25]
잠입(?) 전략을 사용하세요. 본인이 직접
[40:27]
자동화할 수 있는 것이 무엇인지 경험이 없다면
[40:29]
그냥 머리로 생각하는 대신
[40:30]
최선의 방법은
[40:32]
실제로 일을 하고 있는 사람을 만나보는 거예요.
[40:34]
자신의 사업을 하고 있거나
[40:36]
직장인이거나
[40:37]
그런 사람들을 만나서
[40:39]
그들의 일을 관찰하면서
[40:40]
어떤 문제가 있는지 파악하세요.
[40:42]
재미있는 점은 그들 스스로도
[40:44]
자신들의 문제를 모를 수 있다는 거예요.
[40:46]
매일 반복되는 업무에 너무 깊이 빠져있어서
[40:48]
일상적으로 하는 일들을
[40:50]
AI를 활용하면
[40:51]
훨씬 더 쉽고 효율적으로
[40:53]
할 수 있다는 것을 인식하지 못하는 거죠.
[40:55]
하지만 여러분은 새로운 시각으로 볼 수 있어요.
[40:57]
그들의 업무를 관찰하면서
[40:58]
AI 에이전트를 어디에 적용할 수 있을지
[41:00]
파악하고, 어떤 작업을
[41:03]
자동화할 수 있을지 찾아보세요.
[41:05]
그들의 업무를 자동화하여
[41:06]
목표를 더 잘 달성할 수 있도록
[41:08]
도와줄 방법을 찾는 거죠.
[41:09]
이렇게 시작하다 보면
[41:11]
개발을 하면서 종종
[41:12]
여러분이나 다른 사람이 겪었던
[41:14]
문제가 사실은
[41:15]
많은 사람들이 공통적으로 겪는
[41:17]
문제라는 걸 알게 될 거예요. 바로 이렇게
[41:19]
비즈니스나 스타트업으로
[41:21]
발전할 수 있는 아이디어를
[41:22]
발견하게 되는 거죠. 마지막으로
[41:24]
전반적인 방향성에 대해 말씀드리면
[41:26]
YC 영상에서 얻은 핵심적인 통찰은
[41:28]
현존하는 모든 SaaS 기업들,
[41:30]
즉, 서비스형 소프트웨어 기업들에 대해
[41:32]
그에 상응하는
[41:34]
AI 에이전트 버전이 나올 것이라는 거예요.
[41:36]
말 그대로 모든 SaaS 유니콘 기업에 대해
[41:38]
수직적 AI 유니콘 기업이
[41:40]
등장할 것이라는 예측이에요.
[41:43]
자, 이것이 바로
[41:45]
아주 명확한 전체적인 방향성이죠.
[41:47]
현재 있는 모든 SaaS 기업들을 보고
[41:49]
각각에 대응되는 AI 에이전트 버전이
[41:51]
무엇일지 고민해보고 만들어보세요.
[41:54]
이것이 핵심입니다.
[41:56]
마지막으로 지금 바로 시작할 수 있는
[41:59]
특정 기술 기반의 혁신들에 대해
[42:01]
이야기해보고 싶습니다.
[42:02]
AI 산업은 항상 너무나 빠르게 움직이고 있고
[42:05]
매일같이 수많은 새로운
[42:06]
기술들이 개발되고 있습니다.
[42:07]
하지만 현재 우리가 볼 수 있는
[42:10]
주요 근본적인 발전은
[42:11]
2025년 현재 음성과 오디오 분야에서
[42:13]
엄청난 도약이 이루어지고 있다는 것입니다.
[42:15]
오디오 생성 기술은 정말 믿을 수 없을 정도입니다.
[42:18]
지금 제가 보여드릴 것은
[42:20]
Sesame의 한 예시인데,
[42:22]
친구가 보여줬을 때
[42:23]
정말 깜짝 놀랐습니다.
[42:25]
'취미로 사람들을 만나는 방법은
[42:29]
클럽이나 온라인 커뮤니티에 가입하면
[42:31]
특히 게임이나 공예에 관심이 있다면
[42:33]
정말 재미있을 거예요. 봉사활동도
[42:35]
같은 관심사를 가진 멋진
[42:37]
사람들과 연결될 수 있는
[42:39]
좋은 방법이에요. 그리고 이 영상을 보고 계신다면
[42:40]
더 많은 멋진 팁을 위해
[42:42]
티나의 채널을 구독해주세요'
[42:44]
이것이 바로 OpenAI와 그들의 SDK가
[42:46]
음성 에이전트 전용 카테고리를 가지고 있는 이유입니다.
[42:49]
이를 통해 가능한 활용 사례가
[42:50]
너무나 많기 때문이죠. 또한
[42:52]
이미지 모델에서도 큰 발전이 있었습니다.
[42:54]
Rev Gemini Flash 이미지 생성이나
[42:56]
GPT-4의 이미지 생성 기능,
[42:58]
그리고 Sora와 같은 비디오 모델도 있죠.
[43:00]
이미지와 비디오 관련된 모든 것들이
[43:02]
현재 혁신을 앞두고 있는
[43:05]
분야입니다.
[43:06]
이 영상을 마무리하며 마지막 조언을 드리자면,
[43:09]
이 산업에는 항상 너무나 많은 일들이 일어나고 있어서
[43:12]
가끔 압도될 수 있습니다.
[43:13]
그럴 때는
[43:15]
진정하고 차분히
[43:17]
오늘 제가 설명한 이러한 프레임워크와
[43:20]
구성요소들을 다시 생각해보세요.
[43:21]
제가 단순히 튜토리얼이나
[43:24]
새로운 것들에 대해서만
[43:26]
보여주는 것이 아니라
[43:27]
사람들이 만들고 있는
[43:29]
새로운 것들과
[43:30]
에이전트들에 대해
[43:31]
이야기하는 이유는
[43:33]
이 모든 일이 일어나는 와중에
[43:35]
기본적인 구성 요소들과
[43:37]
기본적인 프레임워크,
[43:39]
기본 기술들을 이해하는 데만 집중하면
[43:41]
그 위에 올라오는 모든 것들을
[43:42]
여러분의 마음속에서
[43:44]
배워야 할 것과 아닌 것으로
[43:46]
분류할 수 있기 때문입니다.
[43:47]
이 분야의 실제 큰 혁신들,
[43:49]
실제 모델 혁신과 같은 것들을
[43:51]
계속 주시하세요. 최근에 나온 Gemini 2.5 Pro나
[43:53]
더 나은 도구 사용을 가능하게 하는 MCP 같은 것들이요.
[43:56]
다른 많은 것들에는
[43:58]
그렇게 많은 관심을
[44:00]
기울일 필요가 없습니다. 계속 배우고
[44:01]
자신만의 프로젝트를 진행하며
[44:03]
AI 에이전트를 만들어보세요.
[44:05]
그리고 때가 되면, 기회가 왔을 때
[44:07]
여러분의 기술과 관심사가
[44:08]
세상의 수요와 일치하게 될 것이고
[44:11]
그때 여러분은
[44:12]
성공적인 AI 에이전트 비즈니스나
[44:14]
스타트업, 혹은 사이드 프로젝트나
[44:17]
재미있는 프로젝트를 만들 수 있을 겁니다.
[44:19]
인내심을 가지세요. 자, 약속드린 대로
[44:21]
마지막 평가가 있습니다.
[44:23]
댓글로 여러분의 답변을 적어주세요.
[44:25]
긴 시간 집중해서 시청해주셔서
[44:26]
정말 감사드립니다.
[44:28]
이 영상이 도움이 되었기를
[44:30]
진심으로 바랍니다. 다음 영상이나
[44:32]
라이브 스트림에서 만나요.