[00:00]
OpenAI가 방금 Deep Research를 발표했는데요
[00:02]
이것은 Operator에 이은 두 번째 에이전트입니다
[00:04]
O3 추론 모델과 다양한 도구들을 결합한
[00:07]
강력한 기능을 가진 시스템이죠
[00:10]
가장 중요한 것은 웹 검색 기능입니다
[00:13]
Deep Research는 주어진 주제에 대해
[00:16]
심도 있는 연구를 수행하고
[00:19]
웹을 탐색한 후 돌아와서
[00:21]
PhD 연구원이 작성한 것과 유사한
[00:24]
완벽한 인용이 포함된 연구 논문을 제공합니다
[00:27]
단, 이 모든 게 몇 분 만에 이루어진다는 점이 다르죠
[00:29]
하지만 이게 다가 아닙니다
[00:31]
샘 알트만이 방금 언급했는데요
[00:33]
Deep Research가 이미 한 자릿수 퍼센트의
[00:35]
경제적 가치가 있는 작업을 수행할 수 있다고 합니다
[00:38]
비율이 작아 보일 수 있지만
[00:41]
실제로는 수조 달러의 가치에 해당합니다
[00:44]
그리고 '경제적 가치가 있는 작업'이라는 용어가
[00:46]
익숙하게 들린다면
[00:48]
그것은 OpenAI가 정의한
[00:50]
AGI의 정의이기 때문입니다
[00:53]
너무 앞서가기 전에
[00:55]
Deep Research에 대해 자세히 설명해드리겠습니다
[00:58]
발표 영상의 한 부분을 보시죠
[01:00]
OpenAI의 연구 책임자인 마크 첸이
[01:02]
에이전트에 대한 그들의 궁극적인 비전을
[01:04]
새로운 지식을 발견하는 것이라고 선언했습니다
[01:08]
영상을 보시죠
[01:10]
우리는 모델이 자율적으로 더 오랜 시간 동안
[01:13]
비지도 방식으로 작업을 수행하는 것이 중요하다고 생각합니다
[01:15]
이는 우리의 AGI 로드맵의 핵심이기도 합니다
[01:17]
우리의 궁극적인 목표는
[01:20]
스스로 새로운 지식을 발견하고 밝혀낼 수 있는
[01:23]
모델을 만드는 것이며
[01:25]
첫 단계는 웹에서
[01:27]
정보를 종합하고 이해할 수 있는 모델입니다
[01:30]
죄송합니다, 웹상의 정보를 말이죠
[01:32]
레오폴드 아센브레너의
[01:34]
상황 인식 논문을 기억하시나요?
[01:36]
그는 '지능 폭발'이라고 부르는 개념을 설명했습니다
[01:39]
이는 우리가 AGI에 도달하는 시점으로
[01:41]
AI가 새로운 지식을 발견하고
[01:44]
그 지식을 자신에게 적용할 수 있게 되는 때입니다
[01:46]
이것을 '재귀적 자기 개선'이라고도 하며
[01:49]
이것이 일어나면
[01:52]
곧 인공 초지능에 도달하게 됩니다
[01:55]
왜냐하면 AI가 스스로를 개선하는 방법을 발견하고
[01:57]
수십, 수백, 수천
[02:00]
수백만 개의 에이전트를
[02:02]
동시에 실행할 수 있다면
[02:05]
얼마나 빠르게, 얼마나 기하급수적으로
[02:07]
발전할 수 있는지 상상해보세요
[02:10]
이것이 공상과학처럼 들리거나
[02:13]
먼 미래의 이야기처럼 들린다면
[02:15]
그렇지 않습니다
[02:17]
이미 현실이 되었죠
[02:19]
실제로 며칠 전에 제가 트윗을 올렸는데
[02:22]
Deep Seek가 스스로
[02:25]
자신의 성능을 2배 향상시키는 방법을
[02:27]
발견했다는 내용이었습니다
[02:30]
참고로
[02:32]
X에서 저를 팔로우하지 않으셨다면 해주세요
[02:34]
매튜 버만, 사이먼 윌리슨이 게시한 내용인데
[02:37]
Deep Seek에 단순히 프롬프트를 주어
[02:40]
자신의 성능을 2배 향상시키는 방법을 찾도록 했고
[02:42]
실제로 성공했다는 내용입니다. 정말 놀랍죠
[02:45]
자, 이제 Deep Research로 돌아와서
[02:47]
실제 작동하는 모습을 보여드리겠습니다
[02:50]
Deep Research는 ChatGPT 시작 부분의
[02:51]
버튼을 통해 접근할 수 있으며
[02:54]
여기서 바로 원하는 질문을 입력하면
[02:56]
Deep Research로 전송됩니다
[02:57]
iOS와 Android 채택률,
[02:59]
새로운 언어를 배우고 싶어하는 사람들의 비율과
[03:01]
모바일 보급률 변화에 대해 알아보겠습니다
[03:03]
몇 년간의 모바일 보급률의 변화와
[03:04]
선진국과 개발도상국 간의
[03:06]
차이점을 파악하고
[03:08]
개발도상국의 데이터도 필요해요.
[03:10]
그리고 이 정보를
[03:12]
표와 함께 체계적으로 정리된 보고서로
[03:15]
ChatGPT에 대한 최고의
[03:17]
잠재적 기회에 대한 명확한 추천도 포함해주세요.
[03:20]
이런 정보를 수집하려면 몇 시간이 걸렸을 텐데
[03:22]
딥 리서치를 사용하면
[03:24]
바로 시작할 수 있죠.
[03:25]
먼저 보시다시피
[03:27]
딥 리서치는 몇 가지
[03:29]
명확한 질문들을 던집니다.
[03:31]
이는 매우 중요한데, 딥 리서치가
[03:33]
5-30분 정도 작업할 때
[03:35]
요구사항을 정확히 파악해야 하기 때문이죠.
[03:37]
지금 몇 가지 질문들을
[03:39]
하고 있는데, 이것들은
[03:41]
분석가가 복잡한 요청을 받았을 때
[03:42]
물어볼 법한 아주 좋은 질문들입니다.
[03:43]
따라서 이런 질문들을
[03:46]
미리 파악하는 것이
[03:47]
매우 중요합니다.
[03:48]
모델은 때때로 명시된 정보와
[03:51]
좀 더 개방적인 정보를
[03:52]
받아들여 처리하는 것에
[03:54]
매우 능숙하며, 이를 바탕으로
[03:56]
필요한 모든 정보를 수집합니다.
[03:58]
지금 보시는 것처럼 딥 리서치는
[04:00]
모든 정보를 종합하고
[04:02]
자체적인 연구 프로세스를
[04:03]
시작했습니다. 여기서 보시면
[04:05]
딥 리서치가 작은 사이드바를 열어
[04:08]
진행 중인 모든 추론 과정을
[04:09]
보여주고 있습니다. 지금 보시는 것처럼
[04:12]
주요 국가들을 식별하고
[04:14]
정보를 수집하면서
[04:16]
다양한 정보를 검색하는
[04:17]
프로세스를 시작하고 있습니다.
[04:20]
여기를 자세히 보시면, 딥 리서치가
[04:23]
정보를 검색하고
[04:24]
페이지를 열어 분석하며
[04:26]
내용을 이해하고 있습니다.
[04:28]
실제로 이면에서는
[04:30]
모델이 실제로 검색을 수행하고
[04:32]
페이지들을 열어보면서
[04:34]
이미지, 표, PDF 등
[04:36]
모든 구성요소를 검토하고 있습니다.
[04:39]
이 모든 정보를 추출하여
[04:40]
다음 단계를 결정하는 데
[04:42]
활용하고 있죠. 마치 PhD 이상의
[04:45]
연구원을 웹에 보내서
[04:47]
당신을 위해 심층 연구를 수행하게 하는 것과 같습니다.
[04:50]
몇 분에서 길게는 30분 정도 후에
[04:52]
완전한 인용이 포함된 연구 논문을
[04:54]
가져다 주는 것이죠.
[04:56]
방금 우리가 본 것이 바로 그것입니다.
[04:58]
이 영상의 스폰서인
[05:00]
Chatbase를 소개해드립니다.
[05:03]
Chatbase는 비즈니스를 위한 지능형
[05:05]
AI 에이전트를 만들고 관리하는
[05:07]
최고의 플랫폼입니다. 고객 지원을
[05:09]
효율화하고 리드를 생성하며
[05:10]
웹사이트, 소셜 플랫폼 및
[05:13]
기타 디지털 도구와의 통합을 통해
[05:15]
비즈니스 운영을 향상시키도록 설계되었습니다.
[05:17]
Chatbase는 기업들이 빠르고 일관되며
[05:19]
응답성 높은 개인화된 상호작용을
[05:22]
대규모로 제공할 수 있게 해주며
[05:25]
OpenAI, Anthropic 등의 고급 AI 모델을
[05:28]
기반으로 합니다. 이러한 에이전트들을
[05:30]
자신만의 고유한 데이터로
[05:31]
훈련시켜 비즈니스에 맞게 커스터마이즈하고
[05:33]
적절한 시기에 올바른 답변을 제공할 수 있습니다.
[05:35]
AI 액션이라는 완전히 새로운 기능을 출시했습니다
[05:38]
이 채널을 계속 보셨다면 아시겠지만
[05:40]
저는 에이전트가 작업을 수행하는 것이 미래라고 생각합니다
[05:42]
이제 Chatbase를 통해 이러한 에이전트들이
[05:45]
고객의 질문에 응답할 뿐만 아니라
[05:47]
실제로 고객이 찾는 것에 기반하여
[05:49]
실시간으로 작업을 수행할 수 있습니다
[05:51]
수행 가능한 작업에는
[05:53]
계정에서 실시간 데이터를 가져오거나
[05:55]
에이전트와의 대화를 기반으로
[05:57]
계정 정보를 업데이트하는 것도
[06:00]
포함되어 있습니다
[06:01]
지금 바로 Chatbase를
[06:03]
확인해보세요
[06:05]
이 영상을 후원해 주신
[06:06]
Chatbase에 다시 한 번 감사드립니다
[06:08]
이제 영상으로 돌아가겠습니다. 조금 건너뛰어야 할 것 같은데
[06:10]
딥 리서치 에이전트를 실행한 후
[06:12]
약 15분 정도의 지연이 있었고
[06:14]
마침내 결과가 나왔습니다
[06:15]
지금도 작업이 계속 진행되는 것처럼 보이지만
[06:18]
그동안 우리가 실행한 동안
[06:20]
이미 29개의 다른 출처를 살펴보고
[06:21]
많은 정보를 분석했습니다
[06:23]
와우, 완벽해요
[06:24]
정말 놀라운 타이밍이네요
[06:26]
딥 리서치가 방금 전체 분석을 완료했습니다
[06:29]
11분이 걸렸고
[06:32]
그 과정에서 29개의 다른 사이트를
[06:34]
심도 있게 분석했습니다
[06:36]
실시간 스트리밍에서 보시는 것처럼
[06:38]
완벽하게 포맷된 보고서를 제공했습니다
[06:41]
좋은 서론과 함께 다양한
[06:43]
도입 트렌드가 모두 정리되어 있고
[06:45]
훌륭한 보고서 스타일로 구성되어 있어
[06:47]
시간에 따른 모바일 보급률과
[06:50]
다양한 데이터를 볼 수 있습니다
[06:52]
아래로 내려가면 정보뿐만 아니라
[06:54]
다양한 표 형식과
[06:56]
데이터 표현 방식이 있어
[06:59]
음...
[07:00]
매우 이해하기 쉽게
[07:01]
데이터를 표현했습니다
[07:03]
정말
[07:05]
이 모델의 또 다른 멋진 점은
[07:07]
클릭을 통해 모든 다른
[07:09]
출처를 확인할 수 있다는 것입니다
[07:11]
여기서 모델이 참고한
[07:12]
모든 인용을 볼 수 있고
[07:15]
또한 최종 출력에는
[07:17]
포함되지 않았지만
[07:18]
발견한 다른 사이트들도
[07:20]
알려주고 싶어합니다
[07:21]
이미 영상에서 언급했지만
[07:23]
가장 놀라운 부분은 따로 있습니다
[07:26]
딥 리서치는 이미 사람들의 삶을
[07:28]
더 나은 방향으로 변화시키고 있습니다
[07:30]
이분은 Felipe Millan이며
[07:33]
OpenAI의 정부 시장 담당자입니다
[07:36]
그는 자신의 아내가 암 진단을 받은 후
[07:38]
딥 리서치를 활용해
[07:42]
그녀의 특정 암에 대한
[07:44]
최적의 화학요법을 찾아낸 이야기를 들려줍니다
[07:46]
아내의 나이, 건강 상태 등
[07:50]
구체적인 정보를 바탕으로
[07:53]
놀라운 결과를 얻었습니다
[07:55]
오늘 우리 OpenAI는 딥 리서치를 출시했고
[07:58]
저는 이 도구가 얼마나 놀라운지
[07:59]
매우 개인적인 이야기를 나누고 싶습니다
[08:01]
이것이 어떻게 세상을 변화시킬지에 대해
[08:02]
(암 관련 내용 주의)
[08:05]
10월 말, 제 아내는
[08:07]
양측성 유방암 진단을 받았고
[08:09]
하룻밤 사이에 우리의 삶이 완전히 바뀌었습니다
[08:11]
우리의 삶이 완전히 뒤바뀌었죠.
[08:13]
그녀는 12월 초에 양쪽 유방 절제술을 받았고,
[08:15]
그달 말에 항암치료를 시작했습니다.
[08:18]
최근 우리가 직면한 과제는
[08:19]
그녀의 경우 항암치료 후 방사선 치료가 가능한지였는데,
[08:22]
이는 완전히 회색 지대에 있는 사례였습니다.
[08:24]
자문을 구한 전문의들조차
[08:26]
서로 다른 의견을 제시했고 명확한 답이 없어
[08:28]
우리는 막막한 상황에 처했습니다. 상상해보세요.
[08:31]
세계 최고의 의사들이
[08:33]
서로 다른 의견을 제시하고,
[08:35]
암 전문가도 아닌 당신이
[08:38]
그 결정을 내려야 하는 상황을요.
[08:41]
얼마나 벅차고 스트레스를 받았겠습니까.
[08:43]
하지만 이때 Deep Research가 도움이 되었습니다.
[08:46]
제가 Deep Research의 사전 접근 권한이 있었기에
[08:48]
한번 시도해보기로 했습니다.
[08:50]
수술 병리 보고서를 업로드하고
[08:51]
방사선 치료가 도움이 될지에 대해
[08:54]
조언을 구했습니다.
[08:55]
그 다음 일어난 일은 정말 놀라웠습니다.
[08:57]
단순히 종양 전문의의 의견을 확인하는 것을 넘어
[08:59]
더 깊이 들어가 분석했죠.
[09:02]
제가 전혀 몰랐던 연구들을 인용했고,
[09:04]
나이와 유전적 요인 같은 세부사항을 추가하자
[09:06]
그에 맞게 분석을 조정했습니다. 우리가 각 연구를 확인해보니
[09:09]
모두 정확했습니다. 이런 기능이
[09:12]
월 200달러의 가치가 없다면,
[09:14]
현재는 Pro 플랜에서만 이용 가능하지만,
[09:16]
월 200달러의 가치가 없다면
[09:19]
무엇이 가치가 있을까요. 그리고 그는
[09:21]
사용할 정확한 프롬프트를 나열했는데,
[09:23]
겨우 몇 문장밖에 되지 않았습니다. 저는 여전히
[09:25]
Deep Research가 제공한 보고서에 감탄하고 있습니다.
[09:27]
곧 다른 전문의와 상담할 예정이지만,
[09:28]
우리는 이미 결정에 대해
[09:30]
더 자신감을 느끼고 있습니다. 이것은 단순한 기술
[09:33]
시연이 아니었습니다. 가장 필요한 순간에
[09:35]
마음의 평화를 주었죠. 우리는 종종
[09:37]
OpenAI 내부에서 AGI를 체감하는
[09:39]
순간들에 대해 이야기하는데,
[09:42]
이것이 바로 그런 순간이었습니다. 이것은 세상을
[09:44]
변화시킬 것입니다. 저는 Felipe와
[09:47]
그의 가족, 그의 아내에게 최선을 빕니다. 이것은
[09:50]
AI가 이미 삶을 어떻게 변화시키고 있는지 보여주는
[09:53]
놀라운 이야기입니다. 만약 여러분이
[09:56]
AI가 현재 얼마나 빠르게 세상을
[09:59]
변화시키고 있는지 아직 확신하지 못하고 계시다면,
[10:02]
이 사례가 도움이 되길 바랍니다. 이제
[10:04]
자세한 내용을 조금 살펴보겠습니다.
[10:05]
Deep Research의 벤치마크에 대해
[10:07]
말씀드리겠습니다. 이것 자체도
[10:09]
꽤나 놀랍습니다. 실제로 어떻게 작동하는지
[10:11]
보시죠. Deep Research는 아직 출시되지 않은
[10:14]
O3 모델입니다. 현재 O3 미니는 있지만
[10:16]
이것은 아직 출시되지 않은 O3 모델입니다.
[10:18]
O3 미니는 있지만, 이것은
[10:20]
웹 검색을 포함한 도구들을 사용할 수 있는
[10:22]
O3 모델입니다. 이 모델은
[10:25]
엔드투엔드 강화학습을 통해 훈련되었으며,
[10:27]
어려운 브라우징과 추론 작업에서
[10:29]
다양한 영역에 걸쳐 훈련되었습니다.
[10:31]
필요한 데이터를 찾기 위해 다단계 경로를
[10:34]
계획하고 실행하는 방법을 학습했으며,
[10:36]
필요할 때 되돌아가서 실시간 정보에
[10:38]
대응할 수 있습니다. 이 모델은 또한
[10:40]
사용자가 업로드한 파일을 검토하고,
[10:43]
파이썬 도구를 사용해 그래프를 그리고 수정하며,
[10:45]
생성된 그래프와 웹사이트의 이미지를
[10:48]
응답에 포함시킬 수 있고,
[10:50]
출처에서 특정 문장이나 구절을
[10:52]
인용할 수 있습니다.
[10:55]
이러한 훈련 덕분에
[10:58]
여러 공개 평가에서
[11:00]
놀라운 성과를 달성했습니다. 한번
[11:02]
살펴보죠. 먼저 'Humanity's Last Exam'이라는
[11:04]
시험이 있는데, 이름이 꽤나
[11:07]
암울하긴 하지만, 이게 바로 벤치마크입니다.
[11:10]
'Humanity's Last Exam'은
[11:12]
AI를 광범위한 주제에 걸쳐
[11:15]
전문가 수준의 문제로 평가하는 시험입니다.
[11:17]
3,000개 이상의 객관식과
[11:19]
주관식 문제로 구성되어 있으며
[11:21]
100개 이상의 과목을 다룹니다.
[11:23]
언어학부터 로켓 공학까지,
[11:25]
고전학부터 생태학까지 포함됩니다. GPT 4.0은
[11:29]
3.3%의 점수를 받았습니다. 즉, 3.3%의 정답률을
[11:33]
기록했죠. Claude 3.5 Sonnet으로 올라가면
[11:36]
4.3%로 꽤 좋은 성적이고, OpenAI O1은
[11:41]
9.1%로 정말 좋은 성적, DeepCar One도
[11:46]
매우 좋은 9.4%를 기록했습니다.
[11:48]
그 다음 O3 Mini Medium과 O3 Mini High가
[11:50]
10.5%와 13%를 기록했는데,
[11:54]
여기서 큰 도약이 있습니다. OpenAI Deep Research가 26.6%로
[11:59]
정말 놀라운 성과를 보여줬죠. 이는 O3
[12:02]
Mini High의 두 배에 달하는 성과입니다.
[12:05]
이는 웹 검색 능력이
[12:07]
있기 때문입니다. 이것이 바로
[12:09]
에이전트가 강력한 이유죠. 도구와
[12:12]
모델의 순수한 지능, 그리고
[12:15]
이러한 모델들의 추론 능력은
[12:18]
훌륭하지만, 실시간으로
[12:21]
정보를 찾아보고
[12:22]
그것을 추론할 수 있을 때 진정으로 강력해집니다.
[12:25]
자, 여기 가장 놀라운
[12:28]
차트가 있습니다. 이는 추정 경제적 가치에 따른
[12:31]
전문가 수준 태스크의 통과율입니다.
[12:35]
OpenAI에 따르면 이것이 AGI를
[12:38]
측정하는 기준이라고 합니다. 여기 통과율을 보면
[12:41]
낮은 추정 경제적 가치에서는
[12:43]
20% 미만인 19%를 기록했고, 중간 정도의
[12:47]
경제적 가치에서는 17.7%, 높은 경제적 가치에서는
[12:50]
15%, 매우 높은 가치에서는 9.1%를 기록했습니다.
[12:54]
매우 높은 경제적 가치를 지닌 작업에서
[12:57]
9.1%의 통과율을
[12:59]
보였는데, 네, 여전히 낮은 수치이지만
[13:02]
이는 매우 중요한 지표이며, 9%도
[13:05]
놀라울 정도로 좋은 성과입니다. 자, 누가 사용할 수 있을까요?
[13:08]
먼저 Pro 사용자들입니다. 월 200달러이고
[13:11]
여기 명시된 대로 매우
[13:13]
컴퓨팅 집약적입니다. 이는
[13:15]
그들이 지금까지 만든 것 중
[13:17]
가장 큰 모델과 추론을 결합했기 때문인데,
[13:20]
이는 많은 토큰을 사용하고,
[13:23]
모든 정보를 어딘가에
[13:24]
저장해야 하기 때문에 매우 컴퓨팅 집약적입니다.
[13:26]
Pro 사용자는 월 100회 쿼리로 제한되며,
[13:30]
Team 사용자가 그 다음으로
[13:32]
접근 권한을 받고, 그 다음이 Enterprise입니다.
[13:35]
정말 흥미진진한 시대입니다. Deep
[13:37]
Research는 너무나 멋지고, 이것이
[13:40]
바로 DeepSeek 효과라고 생각합니다. DeepSeek이
[13:43]
무언가를 발표하면 갑자기 Sam
[13:45]
Altman이 자극을 받아서 이제는
[13:48]
미친 듯이 릴리즈를 하고 있죠.
[13:50]
O3 Mini를 출시하고 며칠 후에
[13:52]
Deep Research를 출시했는데,
[13:54]
재미있는 건 이게 Sam Altman이 말한
[13:56]
'One More Thing'도 아니라는 겁니다.
[13:59]
곧 그것도 보게 될 것 같네요. 이 영상이
[14:01]
마음에 드셨다면 좋아요와
[14:03]
구독 부탁드립니다.
[14:04]
다음 영상에서 만나요.