최강 AI 툴 10배 강화와 더 많은 활용 사례

채널 아이콘
The AI Advantage 구독자 356,000명

요약

이번 영상은 OpenAI의 GPT-3.5 Pro와 구글 Gemini 2.5 Pro 출시 소식을 중심으로 두 모델의 성능을 벤치마크하고, 실제 비즈니스 기획과 아이디어 생성, 코딩 활용에 어떤 차이가 있는지 분석합니다. 이어서 ChatGPT의 프로젝트·음성 모드·Canvas 업데이트와 11 Labs 및 OpenAI 음성 어시스턴트 개선 사항을 다루며, GenSpark AI Browser를 활용한 통합 리서치 워크플로우 데모를 시연합니다. 마지막으로 HubSpot 스폰서 섹션에서는 AI 에이전트 도입 전략 가이드와 체크리스트를 소개하고, Mistlei 모델부터 Anthropic, Apple WWDC, Runway AI 영상 활용 사례까지 빠르게 훑어드립니다.

주요 키워드

GPT-3.5 Pro Gemini 2.5 Pro AI agent MCP tool hallucination Projects 기능 voice mode GenSpark Browser AGI Canvas

하이라이트

  • 🔑 GPT-3.5 Pro는 기존 3.5 모델과 동일 아키텍처지만 연산량을 대폭 확대해 복잡한 비즈니스·조직 과제에서 한층 높은 정확도와 신뢰도를 제공합니다.
  • ⚡️ 벤치마크 결과 조직·전략 기획 관련 프롬프트에서 GPT-3.5 Pro는 5점 만점 일관성으로 최강자를 입증했으며, 오리지널 3.5 대비 환각(Hallucination) 발생률이 현저히 감소했습니다.
  • 🌟 Gemini 2.5 Pro는 코드 생성과 아이디어 브레인스토밍 과제에서 GPT-3.5 Pro를 능가해 개발자나 크리에이티브 팀에 최적의 선택지로 떠올랐습니다.
  • 📌 ChatGPT 프로젝트 기능에 음성 모드, 심층 리서치, 개선된 메모리가 도입돼 복합 업무 워크플로우를 자연스럽게 이어갈 수 있습니다.
  • 🚀 OpenAI의 새로운 음성 어시스턴트는 11 Labs보다 인터럽트 처리와 다국어 전환이 매끄러워 실제 대화형 통번역 활용이 가능해졌습니다.
  • 🎯 GenSpark Browser는 AI 에이전트를 Chrome에 내장해 Reddit·Hacker News·Twitter를 자동 탐색하고 종합 리서치 보고서를 단 한 번의 프롬프트로 생성합니다.
  • 💡 HubSpot의 ‘AI Agents Unleashed’ 가이드는 2025년 AI 에이전트 도입 성공 사례와 의사결정 트리를 제공해 예산 낭비 없이 전략을 수립할 수 있도록 돕습니다.
  • 📈 빠른 뉴스 섹션에서는 Mistlei의 초고속 추론 모델, Anthropic Cloud 프로젝트 용량 10배 확대, Apple WWDC의 AI 미공개 소식, Runway AI 비디오 활용 사례 모음을 전합니다.

용어 설명

GPT-3.5 Pro

OpenAI가 발표한 3.5 모델의 상위 버전으로, 더 긴 컴퓨팅 시간을 투자해 복잡한 추론과 팩트 체크 정확도를 높인 상태 최첨단 언어 모델입니다.

Gemini 2.5 Pro

구글의 차세대 AI 모델로, 아이디어 생성과 코드 작성에 강점을 보여 OpenAI 모델의 주요 경쟁자로 여겨집니다.

AI agent

사용자의 지시를 받아 자동으로 여러 툴과 웹사이트를 오가며 작업을 수행하는 자율형 AI 프로그램을 지칭합니다.

MCP tool

GenSpark Browser와 같은 AI 에이전트 환경에서 외부 서비스(예: Reddit, Hacker News, Twitter 등)와 연동해 데이터를 자동 수집·처리하도록 해주는 플러그인 도구입니다.

Hallucination

AI 모델이 실제 사실과 다른 정보를 사실인 양 생성하는 오류 현상으로, 사실 검증과 신뢰도 확보를 위한 주요 이슈입니다.

Projects 기능

ChatGPT에서 주제별 대화 스레드를 모아 워크플로우를 체계적으로 관리하고, 메모리·음성·리서치 기능과 연계해 효율을 높이는 기능입니다.

Voice mode

ChatGPT에 음성으로 입력하고 출력을 음성으로 받을 수 있게 해주는 기능으로, 인터럽트 처리와 감정 톤 조정이 핵심 개선 포인트입니다.

Canvas

ChatGPT 내에서 표나 차트, 코드 스니펫을 시각적으로 구성하고, PDF나 Markdown으로 다운로드해 다른 프로젝트에 활용할 수 있도록 돕는 기능입니다.

[00:00:00] 이번 주 Generative AI 주요 업데이트

호스트가 주간 AI 뉴스의 전체 흐름을 소개하며 GPT-3.5 Pro, Gemini 2.5 Pro, ChatGPT 업데이트, AI 에이전트 브라우저, 빠른 뉴스 세그먼트를 예고합니다. 건강 상태에도 불구하고 꾸준히 업로드한 이력을 강조합니다.

이번 주 생성형 AI는 구글과 OpenAI가 최신 최첨단 모델을 출시하며 매우 중요한 한 주가 되었습니다. 새로운 o3 Pro와 업데이트된 Gemini 2.5 Pro를 자세히 살펴보고, Claude의 다양한 업데이트들도 다룰 예정입니다.
o3 Pro가 마침내 출시되었습니다. 이는 기존 o3 모델보다 훨씬 많은 컴퓨팅 파워를 가진 최첨단 모델로, 처리 시간이 기존 대비 10배에서 최대 50배까지 길어질 수 있지만 더 나은 추론 능력을 제공합니다.
[00:00:58] GPT-3.5 Pro 출시 및 성능

OpenAI가 신규 모델 GPT-3.5 Pro를 공개했습니다. 기존 3.5와 같은 아키텍처지만 연산 시간을 최대 50배까지 늘려 탐구·추론 정확도를 높였습니다. 개인 Pro($20) 요금제 제외, 팀 요금제($60+) 사용자와 API에서 사용 가능합니다.

성능 평가 결과 o3에서 o3 Pro로의 개선은 대부분 몇 퍼센트 수준으로 극적인 차이는 아닙니다. 현재 200달러 Pro 플랜과 팀 플랜 사용자들이 이용 가능하며, API로도 접근할 수 있지만 가격이 매우 비쌉니다.
실제 모델 성능을 구글의 최고 모델인 Gemini 2.5 Pro와 비교해보겠습니다. 6월 5일에 새 버전으로 업데이트된 Gemini 2.5 Pro는 OpenAI 모델들의 주요 경쟁자로 여겨집니다.
[00:02:08] Gemini 2.5 Pro 업데이트

구글의 최상위 모델인 Gemini 2.5 Pro가 6월 5일자로 출시됐습니다. OpenAI와 Claude와 경쟁 구도에서 주목되며, 코드 작성과 아이디어 생성에서 탁월한 성능을 보입니다. 사용법과 요금제 현황을 설명합니다.

Anthropic의 Claude 4와 OpenAI O3 Pro 사용법을 설명하며, Pro 플랜에서 O3 Pro를 선택할 수 있고 이것이 기존 O1 Pro를 대체했음을 소개합니다.
간단한 질문('딸기에 몇 시간이 있는지')을 통해 O3 Pro는 4분의 긴 처리 시간을 가지지만 정확한 답(3개)을 제공한다고 설명합니다.
O3와 O3 Pro의 차이점을 설명하며, 가속화된 O3는 빠르지만 때때로 오답을 제공할 수 있다는 점을 실제 테스트 사례로 보여줍니다.
실제 사용 사례 분석을 위해 개발한 데이터셋을 소개하며, Anthropic 연구를 바탕으로 치료적 사용, 학습 향상, 아이디어 생성 등의 주요 AI 사용 사례들을 매핑했다고 설명합니다.
실제 세계의 프롬프트를 사용해 O3, O3 Pro, 새로운 Gemini의 성능을 관련성과 프롬프트 준수도 기준으로 수동 평가한 연구 방법론을 설명합니다.
[00:03:57] 모델 비교: 3.5 vs 3.5 Pro vs Gemini

실제 비즈니스·학습·아이디어·조직 과제를 대상으로 벤치마크를 진행했습니다. GPT-3.5 Pro는 기획·계획 업무에서 확실한 우위를 보이는 반면, Gemini 2.5 Pro와 Claude는 코딩과 브레인스토밍에 강점을 드러냈습니다.

O3와 O3 Pro 비교 결과를 발표하며, 40-50%의 경우 같은 결과를 제공하지만 O3 Pro는 13분, O3는 1분의 처리 시간 차이가 있다고 설명합니다.
나머지 경우에서는 명확한 품질 차이가 있으며, O3 Pro가 더 신뢰할 수 있고, 팩트체크를 더 잘하며, 환각을 덜 일으킨다는 테스트 결과를 공유합니다.
O3 Pro는 비즈니스와 계획 관련 업무에서 이미 최고 수준이었던 분야를 더욱 발전시켰으며, 일부는 이를 AGI 수준이라고 평가할 정도로 인간보다 뛰어난 성능을 보여줍니다.
[00:05:07] 추천 모델과 구독 전략

비즈니스·전략 기획 과제엔 GPT-3.5 Pro를, 아이디어 발상과 코딩엔 Gemini 2.5 Pro 또는 Claude Opus를 추천합니다. 팀 요금제 가치를 따져보고 최소 2인 플랜 활용을 권장하며, 구독 당 예산 낭비 없이 효율을 높일 방법을 설명합니다.

O3 Pro와 Gemini 비교에서 코딩 분야는 Gemini 2.5 Pro와 Claude가 우세하지만, 아이디어 생성에서는 Gemini 2.5 Pro와 Claude Opus가 O3보다 일관되게 더 나은 성능을 보입니다.
조직 관리, 비즈니스 전략, 일정 계획 등 비즈니스 중심의 모든 업무에서 O3 Pro가 절대적 우위를 차지하며, 실제 테스트에서도 모든 조직적 프롬프트에서 만점을 기록했습니다.
주간 일정 설계 같은 계획 관련 업무에서 O3 Pro의 품질과 사려 깊음이 O3 대비 현저한 차이를 보이며, 다른 모든 모델과 비교해서도 최고 수준의 결과를 제공합니다.
O3 Pro를 세계 최고의 기획 모델로 추천하며, 팀 플랜 월 60달러의 가치를 강조하고 있습니다. 비즈니스 문제가 생겼을 때 직접 테스트해볼 것을 권장합니다.
O3는 이미 놀라웠지만 더 발전했고, Gemini 2.5 Pro도 코딩과 아이디어 생성에 뛰어나다고 평가합니다. 하나만 선택해야 한다면 O3 Pro와 Claude Opus 사이에서 고민하지만, O3 Pro의 확신성을 높이 평가합니다.
O3 Pro가 딸기의 R 개수 같은 기본적인 실수를 하지 않는다는 점에서 비용 대비 가치가 있다고 판단합니다. 모델 비교에 대한 별도 영상 제작도 고려 중입니다.
AI 에이전트라는 용어가 AI 분야에서 가장 혼란스러운 개념이라고 설명하며, 정의가 다양한 이유를 언급합니다. HubSpot과 협력하여 'Master AI agents in 2025'라는 플레이북을 소개합니다.
[00:08:09] AI 에이전트 도입 플레이북 (HubSpot 스폰서)

HubSpot과 협업한 'AI Agents Unleashed'와 'How to Use AI Agents' 가이드 두 편을 소개합니다. 실제 구현 사례, 흔한 실수 회피법, 의사결정 트리와 실행 체크리스트를 통해 2025년 전략적 도입 로드맵을 제공합니다.

첫 번째 가이드 'AI agents unleashed playbook'은 HubSpot의 실제 AI 에이전트 구현 사례를 담고 있으며, 2025년 AI 에이전트의 실제 가치와 일반적인 실수들을 다룹니다.
'이게 AI 에이전트 작업인가?'라는 의사결정 트리를 통해 작업을 에이전트로 자동화할지 인간이 담당할지 빠르게 판단할 수 있도록 도와줍니다.
두 번째 가이드 'how to use AI agents in 2025'는 첫 번째 가이드의 인사이트를 실제 행동으로 옮기는 단계별 체크리스트를 제공합니다.
화자가 HubSpot에서 제공하는 AI 에이전트 관련 무료 가이드를 소개하며, 설명란의 링크를 통해 다운로드할 것을 권하고 HubSpot의 후원에 감사를 표했습니다.
ChatGPT의 o3 Pro 출시 외에 프로젝트 기능에 대한 여러 업데이트를 소개합니다. 프로젝트 내에서 딥 리서치 실행, 음성 모드 지원, 향상된 메모리 기능, 모바일 개선 등이 포함되었습니다.
[00:09:47] ChatGPT 기능 대폭 강화

프로젝트 기능에 음성 모드, 심층 리서치, 개선된 메모리가 적용됐으며, 모바일 최적화도 이뤄졌습니다. Canvas 업데이트로 생성 결과를 PDF·Markdown·코드 형태로 즉시 다운로드할 수 있게 돼 협업과 재활용이 쉬워졌습니다.

Canvas 기능에도 업데이트가 있었으며, 이제 결과를 PDF나 마크다운 파일로 다운로드할 수 있고 코드 생성 시 네이티브 형식으로 받을 수 있게 되었습니다.
잠깐 배달 주문을 처리한 후, 음성 어시스턴트에 대한 이야기를 시작합니다. 음성 입력이 타이핑보다 빠르고 사고 속도를 따라갈 수 있다고 설명했습니다.
[00:11:01] 음성 어시스턴트 비교: OpenAI vs 11 Labs

11 Labs의 고품질 음성 모델 출시 직후 OpenAI도 음성 모드를 개선했습니다. 음성 인식·인터럽트 처리·다국어 전환 성능을 테스트하며, 실제 대화 및 통번역 활용 가능성을 살펴봅니다.

11 Labs가 출시한 혁신적인 음성 기술에 이어 OpenAI도 48시간 만에 업데이트된 음성 어시스턴트를 출시했다고 소개하며, 실제로 테스트해보는 시연을 진행했습니다.
ChatGPT의 고급 음성 모드가 대화 중 방해받는 상황에 더 자연스럽게 반응하도록 개선되었고, 재미있고 쉬운 대화를 위한 기능이 향상되었다고 설명합니다.
지난주에 실시했던 다국어 테스트를 다시 진행하기로 하며, 영어에서 다른 언어로 동적으로 전환할 때의 반응을 테스트해보겠다고 합니다.
독일어 테스트를 실행했는데 독일어가 완벽하지는 않지만 작동한다고 평가하며, 전반적으로 다국어 기능이 크게 개선되었다고 언급합니다.
AI에게 세 가지 언어(영어, 독일어, 슬로바키아어)로 각각 좋아하는 취미를 말해달라고 요청하며, AI가 각 언어로 독서라고 답변하는 모습을 보여줍니다.
OpenAI가 이미 이런 기능들을 내부적으로 개발해놓고 경쟁업체가 비슷한 수준의 제품을 출시할 때까지 기다렸다가 자신들의 버전을 공개하는 전략을 사용한다고 분석합니다.
[00:13:20] GenSpark AI Browser 데모

Google Chrome을 포크한 GenSpark Browser를 소개합니다. Reddit·Hacker News·Twitter MCP 도구 연동으로 자동 브라우징 및 데이터 수집 후 종합 보고서를 생성합니다. 무료 테스트 계정으로 기본 기능을 시연합니다.

AI가 사용자의 아픈 목소리 톤에 맞춰 자신의 음성을 더 거칠고 쉰 목소리로 조정하는 것을 발견했다고 언급하며, 이것이 우연인지 의도적인 기능인지 궁금해합니다.
새로운 채팅을 시작해서 같은 현상이 일어나는지 테스트해보며, AI가 실제로 사용자의 현재 상태에 더 공감하도록 톤을 조정하는 것 같다고 결론짓습니다.
다국어 기능이 놀랍고 언어 전환이 지난주 11Labs보다도 더 잘 작동했다고 평가하며, 대화 중 끼어드는 기능이 크게 개선되어 더 이상 어색하지 않다고 설명합니다.
이제 이 기능이 정당한 범용 번역기가 될 수 있을지 궁금해하며, 다른 언어를 사용하는 사람과 대화할 때 단순히 '범용 번역기 역할'을 요청하면 실제로 작동할 것 같다고 제안합니다.
고급 음성 모드의 인상적인 업데이트를 소개하며, 이전에 포기했던 사용자들도 다시 사용해볼 만한 가치가 있다고 설명합니다.
Gen Spark AI의 새로운 브라우저 출시를 소개하며, 이는 구글 크롬을 포크한 것으로 에이전트가 내장되어 있다고 설명합니다.
Gen Spark 브라우저의 핵심 기능인 MCP 도구 통합을 소개하며, 600개가 넘는 커뮤니티 도구들과 간단한 클릭으로 사용할 수 있는 편의성을 강조합니다.
실제 테스트 사례를 설명하며, 노션 연동에서는 데이터 과부하로 실패했지만, 두 번째 시도에서는 트위터, ChatGPT, 레딧, 해커 뉴스에서 AI 뉴스와 사용 사례를 성공적으로 수집했다고 보고합니다.
AI 도구가 MCP를 사용해 Reddit, 해커 뉴스, 트위터 등 여러 웹사이트를 자동으로 조사하여 이번 주 AI 뉴스와 사용 사례들에 대한 종합적인 개요를 생성하는 과정을 설명합니다.
단순한 웹 검색을 넘어서 큐레이션된 소셜 미디어 콘텐츠로 풍부해진 결과를 제공하며, Gemini 2.5 Pro, 11 Labs, OpenAI 이미지 개선 등 이번 주 주요 제품 출시들을 소개합니다.
[00:17:28] Rapid Fire: 기타 AI 뉴스

Mistlei의 초고속 추론 모델, Anthropic Cloud 프로젝트 컨텍스트 10배 확장, Apple WWDC의 AI 미공개 이슈, Runway AI 영상 활용 사례 모음 등 이번 주 놓치지 말아야 할 짧은 뉴스들을 빠르게 정리합니다.

현재 AI 도구들이 완전히 의존할 수 있는 단계는 아니지만 유망한 발전을 보이고 있으며, 유료 플랜에서는 팟캐스트 변환 등 추가 기능을 제공한다고 설명합니다.
이 플랫폼이 단순한 연구 에이전트를 넘어서 YouTube 비디오 요약, 슬라이드 변환 등의 AI 도구들을 통합하여 제공하며, 브라우저를 직접 사용할 필요 없이 자동화된 작업을 수행할 수 있다고 소개합니다.
모든 AI 도구들이 아직 100% 완벽하지는 않지만 연구의 첫 번째 초안 생성, 슬라이드 제작, 파일 대량 다운로드 등에서 유용하다는 평가를 제공합니다.
AI 도구의 주요 장점들을 소개하며, 슬라이드 생성, 파일 다운로드, 특히 인터넷 리서치 작업에서 뛰어난 성능을 보인다고 설명합니다. 개인 비서처럼 활용할 수 있지만 아직 완전히 신뢰할 수는 없다고 언급합니다.
이번 주 속보 코너를 시작하며, 실제 사용 가능한 AI 뉴스들을 빠르게 다루는 섹션임을 설명합니다.
미스트랄의 첫 번째 추론 모델을 소개하며, 벤치마크에서 두드러지지는 않지만 매우 빠른 처리 속도를 보여줍니다. 실제 테스트에서 10초 안에 정답을 도출하는 놀라운 성능을 시연합니다.
앤트로픽 클로드의 프로젝트 기능이 10배 더 많은 콘텐츠를 담을 수 있게 업데이트되었다고 안내합니다. 하지만 문서가 많아질수록 세부 내용 검색 정확도가 떨어질 수 있다고 주의사항을 전합니다.
애플의 WWDC에 대해 언급하며, 높은 기대에도 불구하고 아직 준비되지 않아 출시하지 않고 있다고 설명합니다. 월스트리트 저널의 무자비한 인터뷰 영상을 추천합니다.
런웨이가 트위터에서 공유된 AI 비디오 사용 사례들을 모은 영감 페이지를 소개합니다. 패턴 재현, 배경 제거, 스토리보드, 장면 확장 등 다양한 활용법을 확인할 수 있다고 안내합니다.
이번 주 생성형 AI 소식은 그렇게 많지는 않았지만,
한동안 가장 주목할 만한 주였습니다.
구글과 OpenAI가 모두
최신 최첨단 모델을 출시했기 때문입니다.
오늘은 새로운 o3 Pro와
완전히 새로워진
Gemini 2.5 Pro를 자세히 살펴보겠습니다.
그리고 Claude는 이번 주에 작지만 중요한
업데이트들을 정말 많이 출시했습니다.
여러분께 꼭 알려드리고 싶은데요,
음성 모드의 대대적인 개편,
프로젝트 기능 등이 포함됩니다.
그 다음에는 본질적으로
AI 에이전트가 내장된 구글 크롬이라고 할 수 있는
새로운 에이전틱 제품을 간단히 살펴보겠습니다.
꽤 흥미로운 내용입니다.
그리고 이번 주 'AI 뉴스 유 캔 유즈' 에피소드에서
몇 가지 빠른 소식들도 전해드리겠습니다.
지난 주의 모든 AI 출시 소식을 정리하여
실제로 사용할 수 있고
정말 중요한 것들만 걸러내는 프로그램입니다.
시작하기 전에 간단한 말씀을 드리면,
아마 이미 들으셨겠지만 제 목소리가
평소보다 좀 쉰 편인데,
지금 몸이 좀 아프기 때문입니다.
하지만 우리는 1년 반 넘게
단 한 번도 금요일 업로드를 빠뜨린 적이 없어요.
그러니 이런 사소한 질병 따위가
우리를 막을 수는 없겠죠?
그럼 바로
첫 번째이자 가장 큰 소식으로
들어가보겠습니다. o3 Pro가 마침내 출시되었습니다.
먼저 핵심 사실들부터 말씀드리고
실제 성능이 어떤지
살펴보겠습니다.
기본적으로 o3 Pro는 새로운 최첨단 모델입니다.
여전히 o3이지만 훨씬 많은 컴퓨팅 파워를 가지고 있어서
훨씬 오래 실행됩니다.
제가 훨씬 오래라고 하면 정말로 그렇다는 뜻입니다.
테스트 데이터를 보여드릴 텐데, 예를 들어
우리가 테스트한 일부 조직화 작업에서
o3는 21초가 걸렸는데 o3 Pro는 10분이 걸렸습니다.
단순히 10배 느린 것이 아닙니다.
때로는 여러분이 o3에서 익숙했던 것보다
최대 50배까지 느릴 수 있습니다.
하지만 얻는 것은 더 많은 추론 능력입니다.
조금 더 나은 추론 능력이죠.
적어도 여기 데이터가 그렇게 시사합니다.
이 평가들에서 보시는 것처럼,
여기서 너무 자세히 다루지는 않겠지만,
o3에서 o3 Pro로의 점프는 대부분의 경우 몇 퍼센트 정도입니다.
하늘과 땅 차이는 아닙니다.
현재 모든 Pro 사용자들,
200달러 플랜 사용자들과
여러 좌석이 필요한 모든 팀 사용자들이 이용할 수 있습니다.
이건 사실 놀라운 일이고,
팀 플랜에 점점 더 많은 기능들을
제공하고 있지만,
거기서도 사용할 수 있습니다.
월 20달러를 내는 일반 프로 사용자들은
현재로서는 이 기능을 사용할 수 없습니다.
API를 통해서도 접근할 수 있지만,
가격이 엄청나게 비쌉니다.
자, 그럼 실제 모델과 성능에 대해 이야기해보겠습니다.
그리고 이것을 이 영상의 두 번째 소식인
Gemini 2.5 Pro와 연결해서 말씀드리겠습니다.
구체적으로, 6월 5일 출시에서 새로운 버전으로 업데이트되었습니다.
이것이 구글의 최고 모델이고,
종종 사람들은 이것을 OpenAI 모델들의
주요 경쟁자로 여깁니다.
그 카테고리의 세 번째는
Anthropic의 Claude 4입니다. 사용 방법은 간단해요. Pro
팀 테마 플랜을 사용 중이라면 O3
Pro를 선택하면 됩니다. 이것은 O1 Pro를 대체했고, 이제 더 이상
사용할 수 없어요.
모델 선택기에서도 제거되었습니다.
그리고 '딸기'에 몇 시간이 있는지 같은 프롬프트를 실행하면
이 놀라운 도구가 답을 찾기 위해
무려 4분 동안 계속 실행됩니다
답은 3개입니다. 네, 맞습니다. 하지만
바로 이런 생각이 들 수 있어요. 'O3에서도
같은 답을 얻을 수 있는데?' 하지만
잠깐, 실제로는 그렇지 않습니다.
저는 실제로 정답을 맞출 것으로 예상했어요.
하지만 아시다시피, 두 번째 시도에서도... 하지만
O3로 한 이 두 번의 시도에서도 보시다시피
그 중 하나는 이 간단한 질문을
틀렸습니다. 그 이유는
O3를 가속화했기 때문입니다. 트위터에서
논의가 있었어요. OpenAI는 여전히
완전히 같은 모델이라고 주장합니다. 단지
더 빨라졌을 뿐이라고요. 하지만 보시다시피 O3는 이제
몇 초 안에 답하지만, 추가 R이 있다고
생각할 위험이 있습니다.
이제 이 기본 예제를 넘어서 봅시다.
저는 단지 실행 시간 길이를
보여드리고 싶었습니다. 이제
흥미로운 부분, 사용 사례에 대해 이야기해봅시다
왜냐하면 저희가 여기서 한 것을 보여드리겠습니다.
저희는 한동안 이런 생각을 해왔어요
주요 사용 사례들을 매핑하는 것 말이에요
저희와 이 채널을 시청하는
커뮤니티가 가질 수 있는 사용 사례들을요
그리고 저희는 여전히 여기서
데이터셋을 개발하고 있습니다.
하지만 기본적으로 현재 저희가 가진 것은
이것입니다. 저희는 다양한 프롬프트를
가장 많이 사용되는 AI 사용 사례들에 대해
매핑했습니다. Anthropic에서 최근 발표한
사람들이 실제로 자신들의 제품을
어떻게 사용하는지에 대한 연구를 바탕으로요.
그 안에는 치료적 사용 사례,
학습 향상, 아이디어 생성 또는
조직적 프롬프트 같은 것들이 있습니다.
이 데이터셋은 코딩에 중점을 두지 않았지만
그 안에 프롬프트 하나는 있습니다.
하지만 기본 아이디어는 실제 세계의
프롬프트를 가져와서 관련성과
저희가 제공한 프롬프트를 얼마나 잘
준수하는지에 대해 수동으로 결과를 평가하는 것입니다.
그리고 현재 O3, O3 Pro 그리고
새로운 Gemini로 이것을 함으로써 저희의 발견 사항은 다음과 같습니다.
먼저 O3 대 O3 Pro에 대해 이야기해봅시다.
많은 경우에 실제로 같은
결과를 생성합니다. 그리고 많은 경우라고 하면
저는 10번 중 4-5번 정도라고 말하겠습니다
O3에서와 같은 것을
O3 Pro에서 얻게 될 것입니다. 차이점은
이것입니다. O3 Pro는
13분 동안 실행되는 반면 O3는
1분 동안 실행됩니다. 그럼 다른 경우들은
어떨까요? 글쎄요, 거기에는 명확한
품질 차이가 있습니다. 만약 당신이
프롬프트하려는 것에 대한 지식이 있다면
정말로 차이를 구별할 수 있습니다
'이것은 꽤 좋다'와 '와우' 응답 사이의 차이를요.
그리고 종종 그것은 미세한 선입니다.
잘못 삽입하거나
해석하는 하나의 사실일 수 있습니다.
하지만 저희 테스트에서 발견한 것은
O3 Pro가 첫째로 훨씬 더
신뢰할 수 있다는 것입니다. 둘째로, 좀 더 팩트체크를 하고
환각을 덜 일으킵니다.
그리고 셋째로, OpenAI가 이미
최고 수준이었던 것들에서
이미 최고 수준이었던 분야에서 말이죠. 제가 항상
말씀드렸듯이, 모든 비즈니스 관련
업무, 모든 계획 관련 업무에서
O3 Pro는 이제 그 분야의 절대 왕자입니다.
그리고 왜 어떤 사람들이 실제로
이 시스템을 이미
AGI라고 부르는지 이해할 수 있습니다. 만약
인간보다 똑똑하다는 것으로 정의한다면
모든 사람을 대변할 수는 없지만, 확실히
많은 경우에서 저보다는
똑똑합니다. 특히 어떤 것을 위해 단 10분만
주어졌을 때 말이죠. 자,
이것이 O3 대 O3 Pro입니다. 이제
O3 Pro 대 Gemini에 대해
이야기해보겠습니다. 이제 Gemini가
확실히 더 나은 특정 분야들이 있고, 저도
논쟁하지 않을 것입니다. 그래서 많은
사람들이 그쪽으로 몰리는 거죠. 저는
코딩 관련된 어떤 것이든
O3나 O3 Pro를 추천하지 않을 것입니다. 저는
그 분야의 경쟁은 Gemini
2.5 Pro와 Claude Opus/Sonnet 사이라고 생각합니다.
정말 상황에 따라 다릅니다. 사람마다
선호도가 다르고, 만약 당신이
개발자라면 그 둘을
직접 시도해봐야 할 것입니다. 하지만 여기서
아이디어 생성을 위해 실행한 몇몇 프롬프트에서
저를 놀라게 한 것이 있습니다. Gemini 2.5
Pro가 O3와 O3 Pro보다
일관되게 더 나은 성능을 보였습니다. 그리고 이것은
이미 O3에서도
아이디어 생성에 있어서 그런 경우였습니다. 제 개인적인 선택은
항상 Claude였습니다. 비록 아직 여기 데이터셋에
포함시키지 않았지만요. 저는 그냥
개인적으로 몇 가지 아이디어 생성
프롬프트를 가져와서 Claude를
Gemini 2.5 Pro와 O3 Pro와 비교했습니다. 그리고 네,
아이디어에 관해서는 정말로
Claude Opus와 Gemini 2.5 Pro 사이의 경쟁입니다.
개인적으로 저는 Claude
Opus를 선호합니다. 하지만 완전히 새로운
아이디어를 브레인스토밍할 때는, O3가
나쁘다는 건 아닙니다. 단지 최고는
아니라는 것입니다. 저는 객관적으로 그리고
이 작업에 참여한 여러 팀원들이
동의하는 것은 Gemini 2.5 Pro나 Claude가
새로운 아이디어를 찾는 데 최고라는 것입니다. 하지만,
여기서 중요한 '하지만'이 있습니다. 그리고 이것이
이 영상에서 여러분이 가져가기를 원하는
내용입니다. 어떤 것이든
조직적인 것, 어떤 비즈니스
관련된 것, 어떤 것이든
전략적 계획이 포함된 것, 어떤 것이든
일정 만들기가 포함된 것, 어떤 것이든
비즈니스에 초점을 맞춘 것에서는 O3 Pro가
왕입니다. 그래서 우리는 여기 이런 조직적
프롬프트들을 가지고 있고 O3와
O3 Pro의 평가 사이에 명확한
차이를 볼 수 있습니다. 여기 아래에서 말이죠. 여기 이런
결과들에서 일관성을 볼 수 있습니다. 모든 경우에서
O3 Pro는 5점 만점에 5점입니다.
건강한 생활은 그런데 개인적인 맥락을
많이 제공하고 나서
다음 몇 주에 걸친 라이프스타일 변화를 계획하는
것입니다. 다시 말하지만 만약 계획과
관련된 것이라면 Pro가 바로 해결해줍니다. 이것은
예를 들어 주간 설계에 관한
하나의 프롬프트입니다. 그리고 여기서 품질과
사려 깊음에서의 이 작은 변화가
O3에서 O3 Pro로 갈 때 정말로
차이를 만들었습니다. 이 주간 일정은
제가 본 것 중 최고이고 다른 모든
모델들과 비교해서도 최고입니다. 그래서
이것이 이 모델에 대한 제
결론이 될 것입니다. 만약 당신이 최고의
세계 최고의 기획 모델을 원한다면
반드시 이걸 써야 합니다. 그리고
팀 플랜을 정당화할 수 있다면
월 60달러부터 시작하는데 최소 2석이
필요하고 한 석당 30달러니까
당신과 팀원 한 명을 위해 구매해서
바로 사용을 시작하세요. 이걸로
실험해보세요. 그리고 비즈니스나
기획 관련 문제가 생기면
그냥 던져보고 결과를 확인하세요.
정말 놀랍습니다. O3도 이미
놀라웠는데, 이건 더 좋습니다. 그리고
새로운 Gemini 2.5 Pro도 여전히 훌륭해요.
코딩도 뛰어나고 아이디어 생성도
뛰어납니다. 그래서 평생 사용할
하나의 모델만 선택해야 한다면
그건 정말 어려운 질문이죠.
현재 제가 매일 사용하는 건
O3 Pro와 Claude의 Opus입니다. 하지만
하나만 선택해야 한다면 O3 Pro가
제게 주는 확신과 정보는
정말 대단합니다. 그리고 매우 바쁜
제 삶에서 그 추가적인 확신과
딸기에 R이 두 개 있다고
절대 말하지 않을 거라는 확신은
제게는 그 돈의 가치가 있습니다.
하지만 여러분이 직접 결정해야 해요.
이 부분이 도움이 되었길 바랍니다.
그리고 모델 비교만 집중한
별도 영상을 만들 수도 있습니다.
개별 프롬프트를 더 자세히 다루고
평가 방식 등을 설명하면서요.
이 채널을 계속 봐오셨다면
정말 어떤 뉴스든 보셨다면
AI 에이전트라는 용어를 분명히
접하셨을 겁니다. 그리고 이
AI 에이전트 광풍에 약간이라도
또는 매우 혼란스러우셨다면
걱정하지 마세요. 혼자가 아닙니다.
이 용어는 전체 AI 영역에서
가장 혼란스러운 것이었습니다.
그리고 본질적으로 정의가
다양하기 때문이고, 그런 이유가 많죠.
하지만 오늘은 'Master AI agents
in 2025, the strategic advantage'라는
플레이북을 공유하고 싶습니다.
이 플레이북은 이 영상을 함께
제작한 HubSpot에서 만든 것이고
실제로 서로 보완하는 두 가지
가이드로 구성되어 있습니다. 간단히
설명해드리겠습니다. 첫 번째 가이드는
'AI agents unleashed playbook
to success in 2025'라고 불리며
HubSpot 스위트에서 직접 나온
실제 AI 에이전트 구현 스토리를
제공합니다. 이는 AI 에이전트가
2025년에 어떻게 실제로 가치를
추가할 수 있는지에 대한 일종의
현실성 체크입니다. 그리고 사람들이
AI 에이전트로 이미 저지른
일반적인 실수들도 보여줘서
시행착오로 예산을 낭비하지
않도록 도와줍니다. 그리고 제가
개인적으로 정말 좋아하는
'이게 AI 에이전트 작업인가?'라는
제목의 의사결정 트리가 포함되어
있어서 이 작업을 에이전트로
자동화해야 할지 아니면 인간의
손에 맡겨야 할지 빠르게 첫 번째
결정을 내리는 데 도움을 줍니다.
두 번째 가이드는 'how to use
AI agents in 2025'라는 제목이고
이는 논리적인 다음 단계로
첫 번째 부분의 인사이트를 행동으로
첫 번째 가이드를 바탕으로 하니까요. 따라서 거기서부터
시작하는 것을 꼭 기억해 주세요. 이 두 가지 모두 완전 무료이니까
이게 조금이라도 관심을 끌었다면
아래 설명란의 첫 번째 링크를 꼭 클릭해서
이 플레이북을 받고
AI 에이전트를 실제 전략적
이점으로 바꾸는 여정을 계속 나아가세요.
무료 가이드와 이 영상 후원을 해준
HubSpot에 진심으로 감사드리고
이제 여러분이 활용할 수 있는
더 많은 AI 뉴스로 돌아가겠습니다.
자, 다음으로는
o3 Pro 출시 외에 ChatGPT에 추가된
몇 가지 업데이트에 대해 이야기해보겠습니다. 구체적으로는
프로젝트 기능이에요. 그리고 이게
제가 개인적으로 가장 좋아하는 기능입니다. 제가 ChatGPT에서
시작하는 대부분의 채팅에 프로젝트를 사용하는데
몇 가지 기능이 추가되었어요. 이제 프로젝트 내에서
딥 리서치를 실행할 수 있습니다.
새롭게 업데이트된 음성 모드도
드디어 프로젝트에서 지원됩니다.
왜 그게 없었는지가 좀 미스터리였거든요.
그리고 프로젝트 내 채팅까지
살펴보는 향상된 메모리 기능도 있어요.
이전에는 이런 기능이 없었거든요.
정말 환상적이죠.
게다가 모바일에서도 더 잘 작동합니다.
이런 것들이 모두 좀
이상한 제약들이었는데 프로젝트 내에서
실질적인 의미가 없었거든요. 이런 것들을
점진적으로 해결해나가는 걸 보니
정말 기쁩니다. 게다가 Canvas에도
또 하나의 업데이트가 있었어요. 세상에.
ChatGPT가 이번 주에 정말 많은
업그레이드를 받고 있네요. 정말 대단해요.
Canvas를 업데이트해서 이제 실제로
결과를 다운로드할 수 있어요. 마치
최근에 딥 리서치 기능에 추가한 것처럼요.
다른 프로젝트나 새로운 채팅의
컨텍스트로 사용하고 싶다면 PDF나 마크다운 파일을
받을 수 있어요. 그게 바로
여러분이 사용하고 싶어할 기능이죠.
그리고 Canvas를 사용해서 코드를 생성한다면
바로 네이티브 형식으로 받을 수 있어요.
꿀과 양파를 빨리 배달 주문해야 했어요.
좋아요, 다시 돌아가죠. 다음 소식은
정말 기대되는 내용인데
제가 이런 음성 어시스턴트와 모든 음성
관련 기능들을 사용하는 걸 좋아하거든요.
타이핑보다 ChatGPT 같은 앱에
입력하는 훨씬 빠른 방법이기 때문이에요.
그리고 제가 타이핑할 수 있는 속도보다
생각하는 속도가 더 빠르다는 걸 자주 느껴요.
특히 휴대폰에서는 더욱 그렇죠.
하지만 음성을 사용하면 제 생각을
따라갈 수 있어요. 그리고 지난 주에 11 Labs에서
정말 놀라운 음성들을 출시했는데
이전에 음성 어시스턴트에서 본 것과는
완전히 차원이 다른 수준이었어요.
그런데 48시간도 안 되어서
OpenAI가 자체 업데이트된
음성 어시스턴트 출시로 따라잡았어요.
이게 제가 실제로 처음으로
시도해보는 거예요. 자, 그럼
한번 해보죠. 안녕, 오늘 어때?
안녕하세요. 저는 잘 지내고 있어요.
물어봐 주셔서 감사해요. 당신은 어떠세요?
하루 어떻게 보내고 계세요? 음, 좀 아프긴 하지만
괜찮아요. 자, 이제 말해봐요.
당신은 말 끊기를 얼마나 잘해요? 아, 안돼요.
몸이 좋지 않으시다니 죄송해요.
음, 말 끊는 것에 관해서는, 저는 가능하면
사람들의 말을 끊지 않으려고 해요.
저는 듣는 것을 중요하게 생각하거든요. 네.
그럼 제가 당신 말을 끊으면 어떨까요?
글쎄, 만약 내가 당신을 방해했다면, 완전히
그렇게 생각해주셔서 기뻐요. 이건
재미있고 쉬운 대화를 나누는 거예요.
방해하는 능력이 훨씬 좋아졌어요. 좋아요,
멋져요. 지난주에 우리가 조금
다국어 테스트를 했었죠. 다시 해봅시다.
제가 다른 언어로
동적으로 전환할 때 어떻게 반응하는지 보고 싶어요.
준비됐나요? 물론이죠. 언제든지
준비되어 있어요. 좋아요. 좋아요. 음, 제가 말한 건
언어들이었어요. 그리고 지금 우리가 할 일은
이제
좋아요, 그 독일어는 좀 어설프지만,
작동은 해요. 좋아요. 좋아요.
정말 많이 좋아졌네요.
좋아요, 이제 영어로 돌아가죠. 좋아요,
영어로 돌아갑시다. 정말
재미있었고 확실히 긴장하게 만들었어요.
다시 바꾸고 싶으면 알려주세요. 대단하네요.
이제 말해봐요, 세 가지 언어 모두로
당신의 취미가 뭔가요? 좋아하는 취미요. 오,
재미있는 질문이네요. 영어로는
제가 가장 좋아하는 취미 중 하나는 독서라고 말하겠어요.
음, 독일어로는
그리고 슬로바키아어로는,
대단해요, 정말 좋네요. 그래서 그들은
이 모든 기능들을 내부적으로 구축해놨어요.
그들은 단지 경쟁업체가 비슷하게
좋은 것을 출시하기를 기다리고 있다가
그냥 자신들의 것을 출시하는 거예요.
또한, 알아챘나요? 목소리를
조금 더, 어떻게 말해야 할까요,
거칠게 바꿔서 오늘 제 아픈
톤에 맞춘 것 같았어요? 우연의 일치였을까요?
한 번 더 시도해보고 싶어요.
완전히 새로운 채팅을 시작해서
같은 일이 일어나는지 보고 싶어요. 안녕, 어떻게 지내?
오늘 하루 어때? 안녕하세요.
잘 지내고 있어요. 물어봐줘서 고마워요. 당신은 어때요?
하루 어떻게 지내고 있어요? 오, 아주 좋아요. 음,
어떻게 지내고 있어요? 정말 잘 지내고 있어요.
고마워요. 채팅하고
안부를 묻는 건 항상 좋아요. 음, 오늘
흥미로운 일을 하고 있나요? 네, 제 생각에는
실제로 그런 것 같아요. 어떻게 생각해요,
하지만? 제 말은, 이런
순간적인 거칠고 쉰
목소리가 지금도 있었어요. 하지만 실제로
제 현재 상태에 더 공감하도록
톤을 바꾼 것 같아요.
흥미롭네요. 다국어 기능,
놀라워요. 실제로 전환이
지난주 11 Labs보다도
더 잘 작동했어요, 말해야겠어요. 조금 더 좋았어요.
둘 다 정말 좋았지만요. 그리고 마지막으로,
말하는 중에 끼어들 수 있고
즉시 멈춰줘요.
1초 더 말하는 게 아니라서
어색하게 만들지 않아요. 그게 제가
ChatGPT의 이 음성 어시스턴트와
다른 모든 앱들에 대해 가진 가장 큰 불만이었어요.
이것이 이제 정당한
범용 번역기가 될 거라는 뜻일까요? 왜냐하면
방해하는 문제가 실제로
실용적이지 못하게 만들었고
언어 전환이 그렇게 부드럽지 않았거든요. 그래서 네,
다른 언어를 사용하는 사람과 대화하고 싶다면,
제 생각에는 그냥 이것에게
범용 번역기 역할을 하라고
프롬프트할 수 있을 것 같아요. 제 말은, 그냥
그 단어를 사용하세요. 그냥 범용
번역기 역할을 하라고 말하세요. 저는 영어를 말하고,
그들은 독일어를 말해요. 가자구요. 그리고 작동해요.
아마 그건 나중에 따라서 해볼 가치가 있을 거예요
다른 주에 한 번 더 해볼 만합니다. 하지만 네,
고급 음성 모드에서 인상적인 업데이트들이 있었습니다.
충분하지 않다고 생각해서 포기하셨던 분들이라면
이제 다시 써볼 만한 가치가 있는 것 같습니다.
다시 말하지만, 이런 내용이
도움이 되신다면
좋아요 버튼을 눌러주시면 정말 감사하겠습니다.
매번 놀라는 것은 좋아요 하나하나가
실제로 채널에 얼마나 많은 도움이 되는지입니다.
그럼 이제 다음 소식으로 돌아가서
여러분이 사용할 수 있는 내용을 살펴보겠습니다.
이번 주 다음 출시 소식은
흥미로운 내용입니다. Gen Spark AI가
미친 듯이 기능을 출시하고 있거든요.
이 회사를 다루기 시작한 것은
그들의 에이전틱 제품이 출시된 이후부터입니다.
정말 새로운 카테고리의 제품이죠.
처음으로 이런 기능을 보여주며
정말 화제가 된 것은
기억하신다면 Manos였습니다.
하지만 저희의 모든 테스트 결과,
간단히 말해서 Gen Spark가
실제로 가장 유용한 것으로 나타났습니다.
그리고 이번 주에 그들이 출시한
새로운 기능은 Gen Spark 브라우저입니다.
지금 다크 모드와 라이트 모드가
무작위로 전환되는 것 같습니다.
그래서 카메라에서 조명 차이가
보일 수 있습니다.
이것은 구글 크롬을 포크한 것으로
에이전트가 내장되어 있어서
다양한 흥미로운 기능들을 사용할 수 있습니다.
그들이 주장하는 모든 기능들의
종합적인 목록은 출시 포스트에서
확인하실 수 있습니다. 제가 여기서
시도해보고 싶은 것은 간단한 리서치 워크플로우입니다.
브라우저를 다운로드하고 로그인하면
- 참고로 저는 무료 계정을 사용하고 있습니다 -
몇 가지 테스트 기능을 바로 제공해줍니다.
가장 흥미로운 것은
지금 출시한 기능입니다.
MCP 도구 통합 기능이죠.
도구 선택으로 가면 지금 대부분의
AI 어시스턴트 플랫폼에서 볼 수 있는
표준 통합 기능들만 보이는 것이 아닙니다.
뭐라고 부르든 상관없이 말이죠.
이런 MCP 도구들도 모두 볼 수 있습니다.
트위터 콘텐츠 탐색기나
브라우저 자동화 도구, 레딧과
해커 뉴스 통합 기능같은 것들이
추천 도구로 있습니다.
하지만 이런 커뮤니티 도구들도
600개가 넘게 있고, 심지어
클라이언트에 어떤 MCP 서버가
적합한지 판단해주는
서버도 있습니다.
아직 시도해보지는 않았지만
흥미로워 보입니다. 요점은
여기에 설정되어 있는 이런 확장 기능들이
정말 많다는 것입니다.
그리고 간단한 클릭만으로 사용할 수 있습니다.
제가 여기서 설정한 것은 레딧 MCP,
해커 뉴스 MCP를 활성화하고
브라우저 자동화, 트위터 콘텐츠 탐색기,
웹 검색에 접근 권한을 주었습니다.
첫 번째 시도에서는 노션을 써봤는데
제 데이터베이스에 수천 개의 항목이 있어서
처리 과정에서 좀 문제가 생긴 것 같아
첫 번째 시도는 포기해야 했습니다.
하지만 두 번째 시도는 실제로 성공했습니다.
그리고 몇 분 안에 이 프롬프트를 실행했습니다:
'이번 주 AI 뉴스와 사용 사례를
내 트위터 피드, ChatGPT, 레딧, 해커 뉴스에서 찾아줘'
실제로 모든 사이트에 접속했습니다.
이 모든 웹사이트들을 확인했습니다. 그리고 여기에서 세부적으로 볼 수 있습니다.
예를 들어, 여기서 MCP를 사용해서 Reddit 게시판을 확인했습니다.
그리고 살펴본 모든 게시물들을 볼 수 있습니다.
고려한 모든 댓글들도 확인할 수 있습니다.
해커 뉴스에서도 동일하게 작업했습니다.
몇 번 더 실행해서 제 트위터 피드에서 연구한 내용을 바탕으로,
챗GPT와 해커 뉴스, 그리고 최근 AI 뉴스를 종합해서,
이번 주 AI 뉴스와 사용 사례들에 대한 종합적인 개요를 만들었습니다.
이제 단순한 웹 검색이 아닌,
Reddit 게시물과 해커 뉴스 게시물,
그리고 제가 팔로우하는 계정들의 내용으로 풍부해진 결과를 얻게 됩니다.
이 계정들은 제가 수년간 트위터에서 큐레이션한 계정들입니다.
이 모든 것을 읽고 여기에 개요를 제공했습니다.
그럼 이번 주 제품 출시가 무엇인지 살펴보겠습니다.
Gemini 2.5 Pro, 맞습니다.
11 Labs는 지난주였지만 여전히 유효합니다.
일주일도 안 됐거든요.
좋아요, OpenAI 이미지 자고 베터(Jango Better).
그건 몰랐네요. 확인해봐야겠습니다.
그리고 네, 이 영상에서 다룬 내용들이 있습니다.
OpenAI의 향상된 음성 기능과
지난주에 다룬 파일 접근 기능 같은 것들 말입니다.
솔직히 말하면, 이것만으로는
아직 완전히 의존할 수 있는 단계는 아니라고 생각합니다.
제가 생각하기에 이 채널에서 제공하는 가장 큰 가치 중 하나는
실제로 여러 사람이 이런 스토리들을 조사하고
그다음에 회의를 해서 이 모든 내용을 논의한다는 것입니다.
찾는 것만이 아니라 의견을 형성하는 것도 중요합니다.
하지만 초기 단계에서는 정말 유망해 보입니다.
그리고 유료 플랜 중 하나를 선택하면
팟캐스트로 변환하는 등의 추가 기능들을 사용할 수 있습니다.
그들이 데모에서 보여준 것처럼 말입니다.
이는 정말 흥미로운 제품 카테고리입니다.
이런 플레이어들이 미친 듯이 출시하고 있기 때문에
엄청나게 성장하고 있습니다.
다음 이야기로 넘어가기 전에 마지막으로 지적하고 싶은 것은
이것이 단순히 이런 종류의 연구를 수행하는 에이전트에만
국한되지 않는다는 것입니다.
엑셀을 사용하고 비디오 파일을 다운로드해서
분석해주는 것 같은 기능들 말입니다.
이전 에피소드에서 다뤘던 내용들입니다.
이전에 구글 크롬 확장 프로그램으로 패키지화되었던
AI 도구들도 포함되어 있습니다.
예를 들어, YouTube에서 어떤 비디오를 확인할 때
요약할 수 있는 도구들을 제공합니다.
버튼 클릭 한 번으로 비디오를 슬라이드로 변환할 수 있고,
그러면 내장 도구가 바로 작업을 수행합니다.
제가 좀 사용해본 후에는 결제를 요구하는데, 이는 당연합니다.
하지만 보시다시피 실제로 이 트위터 인스턴스를 사용해서
이번 주 AI와 머신러닝 뉴스 사용 사례들을 찾았습니다.
그리고 이를 적극적으로 활용했기 때문에
직접 브라우저를 사용할 필요가 없습니다.
다시 한번 말씀드리지만, 이 도구를 포함한 모든 도구들은
아직 100% 완벽하지는 않습니다.
하지만 이런 연구의 첫 번째 초안을 생성하는 데 있어서는
분명히 도움이 됩니다.
슬라이드 제작, 스프레드시트 작업, 정말 놀랍습니다.
파일 대량 다운로드도 정말 좋습니다.
하지만 보통은 이런 인터넷 기능들이
가장 유용합니다.
저도 좀 사용해본 후에는
결제를 요구하는데, 이는 당연한 일입니다.
하지만 보시다시피 실제로 이 트위터 인스턴스를 사용해서
이번 주 AI와 머신러닝 뉴스 사용 사례들을 찾았습니다.
그리고 이를 적극적으로 활용했기 때문에
직접 브라우저를 사용할 필요가 없습니다.
다시 한번 말씀드리지만, 큰 주의사항이 있습니다.
이 도구를 포함한 모든 도구들은 아직 100% 완벽하지 않습니다.
하지만 이런 연구의 첫 번째 초안을 생성하는 데 있어서는
분명히 도움이 됩니다.
도움이 됩니다. 슬라이드나 스프레드시트 생성은
정말 훌륭해요. 파일 일괄 다운로드도
굉장하고요. 하지만 보통은 이런 인터넷
리서치 작업에서 정말 빛을 발하죠.
다른 사용 사례들도 작동할 수 있지만
아직은 실험적인 수준입니다. 하지만
정말 흥미로운 점은 이걸
일정 관리하고, 이메일을 확인하고,
인터넷 리서치를 하는
개인 비서처럼 사용할 수 있다는 거예요.
물론 아직 완전히 신뢰할 수는 없지만,
현재 AI 분야에서
가장 재미있게 가지고 놀 수 있는 것 중 하나입니다.
이번 주 속보 코너를 시작해 보겠습니다.
처음 보시는 분들을 위해 설명드리면, 우리는
여러분이 실제로 사용할 수 있거나
오늘 사용하는 것과 관련이 있을 수 있는
모든 AI 뉴스들을 다루는 섹션을 진행하는데,
하지만 이런 소식들은
몇 분씩 할애하고 싶지 않은 것들이에요.
그래서 빠르게 짚고 넘어가는 거죠.
이번 주 코너는
가장 빠른 릴리스로 시작해보겠습니다.
미스트랄이 첫 번째 추론 모델을 출시했어요.
이 모델이 어떤 벤치마크를 압도하거나
특정 사용 사례 카테고리에서
두각을 나타내는 건 아니지만,
실제로 어떻게 작동하는지 보여드리고 싶어요.
프롬프트를 붙여넣고 엔터를 치면
3, 2, 1.
참고로 이건 사고하는 모델이에요.
오케이, 끝! 이게 사고하는 모델 중에서
가장 빠른 출력이 아니라면
정말 모르겠네요. 이런 답변들은 보통
20초에서 20분까지 걸리거든요.
무료 계정에서 여기서 활성화할 수 있고
몇 번 무료로 사용할 수 있어요.
웹 검색 같은 도구 사용 기능도 있습니다.
클래식한 문제로 테스트해볼게요.
와, 추론이 엄청 많네요.
10초 안에 정답을 맞췄어요.
네, 이번 주 미스트랄 소식이었고,
또 다른 간단한 업데이트인데
앤트로픽 클로드 사용자라면
알아두셔야 할 내용은
프로젝트 기능인데, 이건 아마
클로드나 ChatGPT에서 작업 공간을
정리하는 가장 좋은 방법일 텐데
이제 10배 더 많은 콘텐츠를 담을 수 있어서
훨씬 더 많은 맥락을 추가할 수 있습니다.
평소와 마찬가지로 이런 기능이 확장될 때마다
모든 세세한 내용을 완벽하게 검색해낼 거라고
기대하지는 마세요. 특히 이렇게
확장된 기능을 최대한 활용할 때는 더욱 그래요.
예를 들어 문서 65페이지에 있는 한 줄 같은 경우
놓칠 수도 있어요.
전반적으로 AI 도구에 대해서는
이런 경험칙이 있어요:
문서 15-25페이지 정도가
모든 내용을 제대로 파악할 수 있는 수준이고,
그 이상은
좀 희석되기 시작해요.
그럼에도 불구하고 클로드가 이 기능을 출시했고
훨씬 더 많은 문서를 넣을 수 있게 되었어요.
다음 소식은 AI 출시에 관한 게 아니라
오히려 출시가 없다는 얘기예요.
애플의 WWDC 말이에요.
아시다시피
사람들의 기대는 엄청 높은데,
실제로는 아직 아무것도
출시하지 않고 있어요. 왜냐하면
아직 준비가 안 됐다고 하거든요.
월스트리트 저널의 한 영상을 봤는데
제가 오랫동안 본 기자 중에서
가장 무자비한 기자가 애플 임원 두 명을
인터뷰하는 건데,
애플 AI 전략에 관심 있으시면
강력히 추천해요.
여기서 기자가 포기하지 않고
끝까지 질문을 퍼붓는 장면이 있는데
크레이그는 그냥
억지 미소를 짓고 있어요. 훌륭한 인터뷰였지만
아직 출시된 건 없네요.
다음은 정반대의 사례를 보겠습니다.
런웨이가 사람들이 트위터에서 공유한
모든 사용 사례들을 모아놓은 거예요.
AI 비디오를 어떤 다양한 용도로
사용할 수 있는지 궁금했다면,
이건 제가 본 것 중에서
최고의 영감 페이지 중 하나예요.
패턴 재현,
배경 제거, 스토리보드, 장면
확장 등등 정말 많아요.
이런 것에 관심 있으시면
이 사이트를 확인해보세요.
자, 이번 주는 여기까지예요.
O3 Pro나 새로운 제미나이에
액세스할 수 있다면
좋아하는 프롬프트들을 다시 돌려보세요.
깜짝 놀랄 수도 있을 거예요.
그럼 이만
좀 쉬면서 빨리 나아질게요.
그럼에도 불구하고 여러분 모두 즐거운 하루 되세요.