[00:00]
만약 여러분이 저처럼 메나스(Manus)의
[00:02]
초대를 기다리고 계시다면,
[00:04]
여러분을 위한 새로운 대안이 있습니다.
[00:07]
아마도 메나스보다 더 나은 젠스파크(Gens Spark)입니다.
[00:09]
다시 한 번 이것을 살펴보겠습니다.
[00:15]
슈퍼 에이전트에게 4월 중순
[00:18]
샌디에고 5일 여행 계획을 요청했습니다.
[00:21]
여행 데이터셋에 접근하기 위해
[00:24]
여행 도구를 사용하는 것으로 시작하여
[00:26]
딥 리서치 도구로
[00:28]
대중교통 옵션을 찾았습니다.
[00:31]
그다음 지도 도구를 사용하여
[00:33]
관광지 간 거리를 계산했습니다.
[00:35]
최종 여행 일정이 몇 분 만에 완성되었고,
[00:37]
제가 요청한 모든 사항을
[00:39]
대중교통, 도보 거리,
[00:41]
식당 선호도까지 반영했습니다.
[00:45]
이제 AI에게
[00:47]
이 여행의 모든 레스토랑을 예약하도록 했습니다.
[00:50]
슈퍼 에이전트는 'Call for me' 도구를 제공하는데,
[00:52]
AI가 실제로 사람의 목소리로
[00:54]
레스토랑에 전화를 겁니다.
[01:00]
"안녕하세요, 줄리안입니다. 저녁 식사
[01:03]
예약을 하고 싶은데요." "네, 며칠로 하시겠어요?"
[01:06]
"4월 26일이요. 한 분은 조개류 알레르기가 있고
[01:10]
다른 한 분은 채식주의자입니다."
[01:12]
"자리 선호도는 어떻게 되시나요?
[01:13]
부스, 창가, 또는 야외 자리 중에서요?"
[01:15]
"가능하다면 창가 자리로 부탁드립니다."
[01:17]
"알겠습니다. 4월 26일 토요일로
[01:20]
예약 완료되었습니다."
[01:22]
AI가 엔비디아 5090 칩을 구매하기 위해
[01:24]
100통의 전화를 한다고 상상해보세요.
[01:27]
얼마나 편리하겠습니까?
[01:30]
여러분의 관심사에 맞는
[01:32]
맞춤형 비디오를 AI가 만드는 것은 어떨까요?
[01:34]
예를 들어, 파마산과 피스타치오를
[01:37]
입힌 대구 요리 영상을
[01:39]
보고 싶다고 한다면, 슈퍼 에이전트는
[01:42]
먼저 레시피를 조사한 다음
[01:45]
비디오 생성 도구를 사용해
[01:47]
각 단계별 비디오 클립을 만들고
[01:50]
오디오 생성 도구로
[01:53]
각 클립의 사운드 효과를 생성합니다.
[01:55]
최종 결과물이 이렇습니다.
[01:58]
정말 멋지지 않나요?
[02:00]
누구나 비디오 편집 소프트웨어를
[02:02]
전혀 모르더라도
[02:04]
자신만의 영상을 만들 수 있습니다.
[02:06]
지난주 뉴스를 바탕으로
[02:08]
사우스 파크 스타일의 에피소드를 만들어볼까요?
[02:12]
AI는 화제가 된 시그널 게이트
[02:14]
논란을 선택했고,
[02:16]
완성된
[02:18]
스크립트를 작성한 다음,
[02:21]
비디오 생성 도구로
[02:23]
각 장면의
[02:25]
영상 클립을 제작했습니다.
[02:28]
그리고 음성 합성 모델로 음성을 생성했습니다.
[02:31]
완성된 에피소드는 1분 30초 정도인데,
[02:32]
제가 좋아하는 부분만
[02:34]
보여드리겠습니다.
[02:36]
"야 너희들 그 국방부 직원이
[02:38]
전쟁 계획을 기자한테 문자로
[02:40]
보냈다는 뉴스 봤어?"
[02:41]
"정부가 일부러 자신들이 바보처럼 보이게 해서
[02:43]
적들이 과소평가하게 만드는 것 같아."
[02:45]
그들은 80개 이상의 신뢰할 수 있는
[02:47]
자체 개발 도구를 보유하고 있으며,
[02:50]
멀티 에이전트 시스템 학습을 위한
[02:53]
고품질 데이터셋에 집중하고 있습니다.
[02:56]
그들이 공개한 벤치마크 결과는
[02:59]
스스로를 증명합니다.
[03:01]
이것이 GIA 벤치마크인데,
[03:04]
다양한 복잡성 수준에서
[03:07]
젠스파크 에이전트 시스템이
[03:10]
빙과 메나스 AI를 포함한
[03:12]
모든 에이전트 시스템을 능가하는 것을 볼 수 있습니다.
[03:16]
OpenAI의 딥 리서치와 마찬가지로
[03:19]
Gen Spark 슈퍼 에이전트의 가장 좋은 점은
[03:22]
직접 사용해볼 수 있다는 것입니다
[03:25]
대기자 명단을 기다릴 필요 없이
[03:27]
웹사이트에서 바로 가입하고
[03:29]
시도해볼 수 있죠. 예를 들어
[03:32]
미국의 지진 위치와
[03:34]
공식 출처의 규모 데이터를 요청하면
[03:36]
여기서 보시는 것처럼 다양한 출처를 검색하고
[03:39]
어떤 도구를 사용하는지
[03:41]
실시간으로 확인할 수 있습니다
[03:45]
예를 들어 여기서는
[03:48]
검색 도구를 사용한 다음
[03:50]
특정 웹사이트를 읽고 있고
[03:53]
전체 과정을 볼 수 있습니다. 가끔
[03:55]
이런 문제가 발생하기도 하지만
[03:57]
문제를 스스로 해결하고
[04:00]
그래프도 생성할 수 있습니다
[04:02]
이 예시에서 최종 결과를 보면
[04:06]
우리가 요청한 내용을 바탕으로
[04:08]
모든 시각화가 포함된 상세한
[04:11]
최종 결과물을 생성했습니다
[04:13]
웹사이트에서 가입하면
[04:16]
무료 크레딧도 제공되어
[04:18]
유료 버전으로 전환하기 전에 최소한 한 번은
[04:21]
시도해볼 수 있습니다
[04:23]
이제 제가 생각하기에
[04:25]
가장 흥미로운 데모를 보여드리겠습니다
[04:27]
사용자의 입력을 바탕으로
[04:30]
Gemini 2.0을 사용해 요리 레시피
[04:34]
동영상을 생성하는데
[04:37]
정말 놀랍습니다. 이 에이전트 시스템의
[04:39]
아름다움과 강점은
[04:43]
보유한 도구의 다양성과
[04:46]
작업에 필요한 도구를 선택하고 적절히 활용하는 능력입니다
[04:50]
이는 정말 놀라운 점이며
[04:53]
이를 통해 알 수 있는 것은
[04:55]
대부분의 혁신이
[04:57]
애플리케이션 레이어에서
[05:00]
일어날 것이라는 점입니다
[05:01]
저는 무료 200 크레딧을 사용해서
[05:06]
미국에서 a6700 카메라를
[05:10]
최저가로 구매할 수 있는 곳을 찾아보았습니다
[05:14]
연구 계획을 수립했는데
[05:16]
OpenAI의 딥 리서치와 매우 유사합니다
[05:18]
몇 가지 답변을 제공했더니
[05:21]
연구 프로세스를 시작했습니다
[05:23]
보시다시피 이것은
[05:26]
다단계 연구 또는 다단계 프로세스입니다
[05:29]
이러한 사고 과정을 거쳐
[05:32]
연구 시작을 클릭하자
[05:35]
여러 웹사이트를
[05:37]
살펴보기 시작했고
[05:39]
수행한 연구는
[05:42]
매우 철저했습니다. 중간중간
[05:45]
현재 연구를 바탕으로
[05:48]
중간 분석을 수행하고
[05:50]
이를 바탕으로 계속해서
[05:52]
연구와 검색 기준을 개선하여
[05:55]
더 많은 결과를 보여주는데
[05:58]
정말 훌륭합니다. 이는
[05:59]
Anthropic의 연구 방식을
[06:02]
떠올리게 합니다. 전체 과정은
[06:05]
약 20분 정도
[06:07]
소요되었고, 다음과 같은 결과물이 나왔습니다
[06:10]
'미국에서 소니
[06:12]
a6700 카메라 구매를 위한
[06:14]
2025년 종합 가이드'라는 보고서를 만들었고
[06:19]
구매 옵션도 제시해주었습니다
[06:22]
여기 표에서 볼 수 있듯이
[06:25]
아마존을 비롯한
[06:28]
여러 옵션의 가격을 나열했고
[06:31]
관련 유튜브 영상도
[06:34]
함께 제시했습니다
[06:37]
이것은 좋은 시작점이 될 것 같습니다
[06:39]
이것을 시작점으로 삼고
[06:41]
이 페이지들을 살펴보면서
[06:44]
정확히 어떤 가격이 가장 좋은지 알아보겠습니다
[06:47]
그럼 이 시스템은 어떻게 작동할까요?
[06:48]
가입하면 보게 될 페이지가
[06:51]
클릭했을 때 이렇게 나타납니다
[06:53]
기본적으로 블로그 포스트로 연결되는데
[06:55]
흥미롭게도 메인 페이지에
[06:58]
뉴스 기사들이 있습니다
[07:00]
처음에 이 회사는
[07:02]
Perplexity와 Google Research의 경쟁자가 되려 했지만
[07:05]
지금은 에이전트 시스템으로
[07:07]
방향을 전환했기 때문이라고 생각합니다
[07:11]
하지만 여전히 이것은
[07:13]
에이전트 시스템의 랜딩 페이지에
[07:16]
뉴스 기사가 있다는 게 매우 이상해 보입니다
[07:19]
자, 작동 방식을 보면 네 개의
[07:23]
다른 탭이 있습니다
[07:25]
여기서 보시면 에이전트들의 조합이나
[07:28]
원하는 경우 개별 LLM을
[07:32]
사용할 수 있습니다. 최신 LLM들에
[07:35]
모두 접근 가능하며, 에이전트 조합을 선택하면
[07:38]
이것은 기본적으로 자동화된 시스템으로
[07:41]
주어진 작업에 가장 적합한 모델을
[07:44]
결정하고 선택합니다
[07:47]
이미지 스튜디오도 있어서
[07:49]
이미지 생성과 비디오
[07:51]
생성 모델이 있습니다
[07:53]
이미지 생성의 경우에도
[07:56]
다양한 텍스트-이미지 모델 목록이
[07:58]
있고 에이전트 조합을 선택하면
[08:01]
이 모든 것을 사용하거나
[08:03]
조합하여 이미지를
[08:06]
생성합니다. 그리고
[08:08]
에이전트들이 있는데, 슈퍼 에이전트는
[08:11]
최근에 발표된 것이고
[08:13]
에이전트 심층 연구도 있어서
[08:16]
예시를 봤습니다. 슈퍼 에이전트는
[08:18]
다양한 도구들에 접근할 수 있어서
[08:20]
LLM들에 접근할 수 있고
[08:23]
텍스트 처리, 통화 기능, 웹 검색
[08:26]
등 모든 것을 사용할 수 있으며
[08:29]
슈퍼 에이전트가 어떤 도구를
[08:32]
언제 사용할지 결정합니다
[08:34]
예를 들어 샌디에이고 여행
[08:37]
계획을 다시 살펴보면
[08:39]
어떤 일이 일어나는지 알 수 있습니다
[08:43]
웹 검색 도구를 사용하고
[08:46]
이미지 검색 도구로 이미지도 찾아보고
[08:49]
두 가지를 조합해서
[08:51]
관광명소를 찾아내고
[08:55]
그것을 기반으로
[08:59]
목록과 일정을 만듭니다
[09:02]
그리고 사용자가
[09:04]
저녁 식사를 원하고 음식 선호도를
[09:07]
지정하면 레스토랑을 검색할 수 있고
[09:10]
레스토랑에 전화하라고 요청하면
[09:12]
레스토랑에 전화를 걸 수 있으며
[09:15]
통화 도구를 사용해
[09:17]
레스토랑에 전화를 겁니다
[09:20]
한 가지 분명해지는 점은
[09:23]
가장 흥미로운 발전이
[09:24]
모델 수준이 아니라
[09:26]
시스템 수준에서 일어나고 있다는 것입니다
[09:28]
사람들이 이러한 모델들과 도구들을
[09:31]
결합하여 에이전트 시스템을 만드는 방식에서요
[09:34]
이 시스템은 얼마나 좋을까요?
[09:36]
벤치마크에서 보면
[09:38]
Manus와 Open Presearch보다 더 나은 성능을 보입니다
[09:41]
무료로 시도해볼 수 있어서
[09:44]
최소한 몇 가지 쿼리는 실행해볼 수 있고
[09:46]
유용하다고 생각되면
[09:49]
월 20달러 옵션도 가치가 있다고 생각합니다
[09:53]
많은 다양한 도구와
[09:55]
모델에 접근할 수 있기 때문입니다
[09:58]
실제로는 월별 결제시 25달러입니다
[10:01]
이것은 중국에서 나온 또 다른
[10:04]
에이전트 시스템인데
[10:06]
이러한 에이전트 시스템을
[10:08]
만드는 데 정말 뛰어난 것 같습니다
[10:11]
OpenAI와 Anthropic의 최고
[10:13]
시스템들보다 더 나은 성능을 보이고 있죠
[10:16]
여러분의 생각이 궁금합니다
[10:18]
매우 흥미로운 발전이고
[10:20]
앞으로 몇 주, 몇 달 안에
[10:22]
이런 시스템들을 더 많이
[10:25]
보게 될 것 같습니다
[10:27]
이 영상이 도움이 되었길 바랍니다
[10:29]
시청해주셔서 감사하고
[10:32]
다음 영상에서 뵙겠습니다