Grok 3 테스트: 시장 예측이 가능할까?

채널 아이콘
Creator Magic 구독자 104,000명

요약

해당 영상에서는 Elon Musk의 xAI에서 선보인 최신 AI 모델 Grok 3를 활용하여 실시간 주식 대시보드를 구축하는 과정을 상세히 보여줍니다. 영상은 Grok 3의 코드 생성과 디버깅, 실시간 데이터 통합 과정을 통해 Tesla 주식 데이터를 활용하는 방법을 설명합니다. 또한 Visual Studio Code용 Cline 확장과 MCP 마켓플레이스로 AI 기능을 확장하는 방법, 그리고 Microsoft의 OmniParser V2를 통한 컴퓨터 제어 데모를 포함하여 다양한 AI 도구들의 실제 응용 사례를 다룹니다. 전반적으로 AI 도구들이 실무 프로젝트에 어떻게 적용되고 개선될 수 있는지를 보여주며, 시청자들에게 유익한 인사이트와 실험적 접근법을 전달합니다.

주요 키워드

Grok 3 AI 도구 실시간 데이터 주식 대시보드 ChatGPT Cline MCP 마켓플레이스 OmniParser V2 자동화 디버깅

하이라이트

  • 🔑 Grok 3를 활용해 실시간 주식 대시보드 구축 과정을 상세히 시연함.
  • ⚡️ 파이썬 스크립트를 자동으로 생성하고, API 연동을 통해 Tesla 주식 데이터를 가져오는 방법을 설명함.
  • 🌟 발생한 UI 오류에 대해 deep search 기능을 이용, 문제 해결 과정을 보여줌.
  • 📌 Grok 3와 ChatGPT의 속도 및 실시간 데이터 통합 능력을 비교 분석함.
  • 🚀 Visual Studio Code의 Cline 확장과 MCP 마켓플레이스를 이용하여 AI 코딩 환경을 확장하는 방법을 시연함.
  • 🔑 Google Maps API와 OpenStreetMap을 사용한 바르셀로나 커피숍 지도 앱 구축 과정을 소개함.
  • ⚡️ Microsoft의 OmniParser V2를 통해 AI 기반 컴퓨터 제어 및 자동화 기능을 데모함.
  • 🌟 커뮤니티 참여와 구독을 독려하며, 시청자들과 AI 도구 사용 경험을 공유함.

용어 설명

Grok 3

Elon Musk의 xAI에서 발표한 최신 AI 모델로, 실시간 데이터 처리 및 고속 추론을 통해 다양한 응용 프로그램에 적용됩니다.

Cline

Visual Studio Code의 확장으로, MCP 마켓플레이스와 연동되어 AI 코딩 시스템에 추가 기능을 부여하는 도구입니다.

OmniParser V2

Microsoft Research에서 개발한 도구로, AI를 컴퓨터 제어 에이전트로 확장하며 도커화된 Windows 11 환경에서 작동되는 자동화 솔루션입니다.

[00:00:00] 소개 및 AI 툴 오버뷰

Mike가 최신 AI 도구와 Grok 3를 소개하며 주목할만한 트렌드를 개괄합니다. 전반적인 영상의 방향과 기대감을 제시합니다.

AI 도구 소개와 이번 에피소드의 주요 내용을 안내합니다.
[00:00:16] Grok 3로 주식 대시보드 구축

Grok 3를 사용해 Tesla 주식 관련 실시간 시장 지표를 가져오는 파이썬 스크립트를 생성하는 방법을 설명합니다. API 연동 및 환경설정을 포함한 단계별 진행을 보여줍니다.

일론 머스크의 xAI가 개발한 Grok 3를 소개하고, 테스트를 시작합니다.
TAAPI.io API를 활용해 테슬라 주식의 실시간 시장 지표를 보여주는 대시보드 개발을 시작합니다.
Grok 3에 추가 문서를 제공하고 코드 생성을 시작합니다.
생성된 코드를 받아 실제 환경에서 구현을 시작하고 필요한 설정을 진행합니다.
웹페이지 실행 중 문제가 발생하여 Grok 3에 추가 도움을 요청합니다.
Grok의 DeepSearch 기능을 사용하여 에러 해결을 시도합니다. 웹 검색을 통해 라이브러리 변경사항을 확인하고 문제를 해결하려 합니다.
[00:02:58] 오류 해결 및 디버깅

대시보드 상의 UI 오류를 deep search 기능을 통해 조사하고, 문제 해결 과정을 진행하는 모습을 시연합니다. 오류 메시지를 분석하여 적절한 수정을 가합니다.

타임라인 정보가 없습니다.

[00:03:27] 실시간 데이터 모니터링

수정된 대시보드가 실시간으로 업데이트되며, Tesla 주식의 '매수, 보유, 매도' 신호를 제공하는 모습을 확인합니다. 데이터 시각화와 그래프 업데이트가 강조됩니다.

웹페이지가 성공적으로 작동하기 시작했으며, 실시간 데이터가 표시되기 시작했습니다. 그래프 크기 조정이 필요한 상황입니다.
테슬라 주식의 실시간 RSI와 MACD 지표를 보여주는 대시보드가 완성되었습니다. 추가 데이터 박스를 요청하여 기능을 확장합니다.
완성된 대시보드는 테슬라 주식에 대한 다양한 시장 지표를 실시간으로 보여주며, 매수/매도/보유 신호를 제공합니다.
Grok 3의 실제 사용 경험을 공유하며, 한 번에 완벽한 결과를 얻기보다는 여러 단계의 수정과 개선이 필요했음을 설명합니다.
Grok 3의 성능에 대한 평가로, 매우 빠른 처리 속도와 뛰어난 추론 능력, 그리고 실시간 데이터 통합이라는 ChatGPT 대비 강점을 설명합니다.
테슬라 주식에 대한 실시간 분석 테스트를 진행하며, Grok 3가 X(트위터) 포스트와 웹 데이터를 활용해 현재 시장 상황을 분석합니다.
[00:07:02] Grok 3와 ChatGPT 비교

간단한 명령어를 통해 Grok 3가 실시간 정보를 어떻게 접근하는지 테스트합니다. ChatGPT와의 속도 및 데이터 정확도 차이를 논의합니다.

Visual Studio Code의 Cline 확장 프로그램 소개와 MCP 마켓플레이스에 대한 설명을 시작합니다.
[00:07:04] Cline 확장과 MCP 마켓플레이스

Visual Studio Code의 Cline 확장과 연동된 MCP 마켓플레이스를 소개하며, AI 코딩 시스템에 추가 기능을 통합하는 방법을 시연합니다. 확장 프로그램을 통한 코드 보조 기능이 강조됩니다.

Google Maps API를 Cline에 통합하는 과정을 보여주며, API 키 설정부터 테스트까지의 과정을 시연합니다.
Klein을 사용해 VSCode에서 바르셀로나 카페 지도 앱 개발을 시작합니다. OpenStreetMap을 기반으로 하고 구글 맵스 데이터를 활용하여 커피콩 모양의 마커로 카페 위치를 표시하는 앱을 만들기로 했습니다.
[00:08:36] 바르셀로나 커피숍 지도 앱 구축

Google Maps API와 OpenStreetMap을 활용해, 바르셀로나의 커피숍을 커피 빈 아이콘으로 표시하는 앱을 만드는 과정을 보여줍니다. 위치 데이터 시각화가 주요 포인트입니다.

완성된 앱에서는 커피콩 모양의 마커를 통해 바르셀로나의 카페 위치를 확인할 수 있고, 마우스 오버시 가게 정보를 볼 수 있습니다. 지도의 확대/축소와 이동이 가능하며, 확대시 더 많은 카페 정보가 표시됩니다.
마이크로소프트 리서치의 OmniParser V2가 출시되었습니다. 이는 AI를 컴퓨터 제어 에이전트로 전환하는 도구로, 도커화된 Windows 11 환경과 함께 제공됩니다.
[00:10:21] OmniParser V2와 OmniTool 데모

Microsoft의 OmniParser V2를 통해, 도커화된 Windows 11 환경에서 컴퓨터 제어와 다양한 자동화 기능을 데모합니다. AI 기반 컴퓨터 에이전트의 미래 가능성을 시사합니다.

OmniParser는 컴퓨터 제어 API 서버, 도커 기반 Windows 11 VM(Omnibox), 웹 인터페이스(Gradio)로 구성된 통합 시스템입니다.
윈도우 VM 부팅 오류로 인한 설치 실패와 맥 지원 부재에 대한 언급
OmniParser V2의 주요 기능 소개: 화면 요소의 박스 변환과 AI 제어 기능
시스템 성능과 다양한 기능 데모: 빠른 처리 속도와 다양한 응용 프로그램 제어
OmniTool 실제 사용 예시: 우유 구매, 깃허브 레포지토리 클론, 시스템 관리 기능
OmniParser V2의 미래 전망과 AI-컴퓨터 통합의 가능성
영상 마무리와 커뮤니티 참여 독려
[00:13:23] 마무리 및 커뮤니티 초대

전체 내용을 정리하며, 시청자들에게 크리에이터 커뮤니티 참여와 구독을 독려하는 결론 부분을 다룹니다. 후속 영상과 추가 프로젝트 참여를 요청합니다.

타임라인 정보가 없습니다.

안녕하세요, 마이크입니다.
이번 주 놓치면 안 될 새롭고 트렌디한 AI 도구들을 소개해드리겠습니다.
오늘은 Grok 3를 사용해서 실시간 주식 거래 대시보드를 만들어보고,
Cline의 새로운 AI 앱스토어로 바르셀로나의 커피빈을 찾아보며,
로컬 AI 에이전트를 사용해 Windows 11 기기를 완벽하게 제어해보겠습니다.
첫 번째로, Grok 3입니다.
일론 머스크의 xAI에서 출시한 새로운 AI 모델로 모두가 주목하고 있죠.
그리고 정말 뛰어나다고 합니다.
그래서 직접 테스트해보도록 하겠습니다.
먼저 생각 기능을 활성화해서 제가 입력하는 내용을 분석할 수 있게 하겠습니다.
그리고 아주 간단한 프롬프트를 입력하겠습니다.
TAAPI.io API를 호출해서 테슬라의 실시간 시장 지표를 가져오는
파이썬 스크립트를 생성하고 싶습니다.
참고로 곧 새로운 영상이 나올 예정인데요,
자동화된 AI 트레이딩 에이전트를 만드는 내용입니다.
영상을 놓치지 않으시려면 좋아요와 구독 부탁드립니다.
10초마다 업데이트되는 아름다운 그래픽으로 웹 페이지에 표시하고,
테슬라 주식에 대해 매수, 홀드, 매도를 메인 헤드라인으로 보여주고 싶습니다.
디자인 모범 사례를 적용해서 정말 멋지게 보이게 하고 싶은데요,
마치 누가 디자인한 것처럼요? 네, 맞습니다.
애플 엔지니어처럼요.
또한 Grok 3가 이것을 정확히 이해할 수 있도록
몇 가지 문서를 추가로 붙여넣을 겁니다.
TAAPI.io 관련 문서와
API 응답을 어떻게 표시할지에 대한 정보를 넣겠습니다.
자, 이제 모두 입력했네요.
좋은 점은 꽤 긴 컨텍스트 윈도우를 가지고 있다는 거죠.
이제 Grok 3로 실행해보고 어떤 결과가 나오는지 보겠습니다.
보시다시피 지금 생각하고 있고,
이미 앱을 어떻게 만들지 구상하고 있네요.
꽤 멋지죠.
106초 동안 생각했고, 이제 필요한 모든 코드를
바로 눈앞에 보여주고 있습니다.
이것을 복사해서 코드 에디터에서 사용할 수 있겠네요.
파이썬 가상환경을 빠르게 만들었고,
이제 의존성 패키지들을 설치하겠습니다.
.env 파일을 만들고 제 TAAPI API 키를 넣어보겠습니다.
참고로 TAAPI는 다양한 주식과
암호화폐에 대한 실시간 데이터를 여러 거래소에서 제공합니다.
말씀드렸듯이,
다음 주쯤 이 도구들을 사용하는 AI 에이전트 제작 영상이 나올 예정입니다.
API 키를 생성하고 복사해서,
여기에 붙여넣겠습니다.
그리고 마지막 단계로
친절하게 제공해준 명령어로
애플리케이션을 실행하고 브라우저에서 localhost:8000에 접속하면 됩니다.
자, 이렇게 실행이 됐네요!
컨트롤을 누른 상태로 클릭해서 브라우저에서 열 수 있습니다.
음, 지금은 이 메시지만 보이네요.
아름다운 웹사이트가 없습니다.
Grok 3에게 무슨 문제인지 물어보겠습니다.
이 메시지만 보이는데
아름다운 UI 웹페이지가 없네요. 어떻게 해야 하나요?
Grok 3가 생각하지 않고도 답을 줄 수 있기를 바랍니다.
살펴보니 몇 가지 주요 변경사항이 있네요,
특히 app.py 파일에서요.
자, 이 변경사항들을 적용해보겠습니다.
브라우저에서 열어보면,
현재 웹페이지에 아무것도 표시되지 않고
콘솔에 에러가 발생했네요.
그럼 이걸 Grok에 복사해서 붙여넣고 DeepSearch를 실행해보겠습니다.
단순히 답을 검색하는 것뿐만 아니라, 답변에 대해 추론도 할 수 있죠.
처리하는 데 시간이 좀 더 걸릴 것 같네요.
보시다시피 지금 에러를 분석하고 있고,
최신 웹 검색을 활용하고 있습니다.
아마도 시간이 지나면서
라이브러리 중 하나가 변경되었을 수 있고,
이를 해결하기 위해 인터넷에서 정보를 찾아야 할 것 같네요.
잘 작동하는지 볼까요?
이미 에러를 찾았고 관련 URL들을 연결하고 있네요.
필요한 모든 것을 처리한 것 같습니다.
모든 코드를 복사해서 붙여넣었으니, 잘 작동하길 바랍니다.
이제 웹페이지에 접속해보면... 와!
오, 와우!
네, 'hold' 신호를 보여주고 있네요.
데이터가 나타나고 있는데, 와우.
뭔가 작동하고 있네요.
진행되고 있습니다.
더 보기 좋게 수정해볼까요.
다시 Grok 3에 입력해보겠습니다.
지금은 작동하지만 웹페이지가 계속 커지고 있어요.
라인 그래프가 박스 안에 머물도록 수정해주세요. 계속 커지지 않게요.
이것 좀 보세요.
정말 멋지네요.
실시간으로 데이터가 들어오고 있습니다.
몇 가지 수정 후에, 테슬라 주식의 실시간 RSI와 MACD를 보고 있네요.
더 많은 데이터 포인트를 요청했으니,
박스를 더 추가할 수 있는지 확인해보겠습니다.
하지만 이것만으로도 놀랍네요. 이렇게 입력했습니다.
좋아요. 완벽하게 작동하네요.
많은 데이터 박스를 원했는데, 두 개만 주셨네요. 새로운 코드를 작성했습니다.
앱을 재시작하고 웹페이지를 확인해볼까요.
그리고 이제... 와우.
이것 좀 보세요.
이게 다 무슨 의미인지는 모르지만, 실시간으로 업데이트되고 있어요.
다양한 종류의 정보를 보여주고 있네요.
여러 시장 지표들로부터
테슬라 주식을 매수, 보유, 또는 매도해야 하는지에 대한 정보를 주고 있습니다.
현재는 여전히 '보유' 상태네요.
이게 잘 작동하는지 확인하기 위해 뭘 할지 아세요?
이 영상을 만드는 동안 실행해두고
매수나 매도로 변경되는지 업데이트해드리겠습니다.
계속 지켜봐주세요, 변화가 있는지 확인해보겠습니다.
이건 금융 정보나 투자 조언이 아니라는 점 기억해주세요.
이런 걸 시도하실 때는 본인의 판단으로 하시기 바랍니다.
다음 주 채널에서는 실시간
AI 트레이딩 에이전트를 만들어서 이런 데이터 포인트들을 활용해볼 예정입니다.
바로 이런 것처럼요.
보시는 내용이 마음에 드신다면 좋아요와 구독 부탁드립니다.
매주 이런 영상을 만들고 있습니다.
보시다시피, 한 번에 해결되는 게 아니에요.
이번 주에 많은 사람들이 Grok 3가 한 번에 모든 걸 만들 수 있다고 했지만,
제 경험상 그건 사실이 아니었습니다.
먼저 생각을 해야 했고,
후속 질문들을 해야 했으며,
마지막으로 해결할 수 없는 문제가 생겼을 때는,
DeepSearch 기능을 사용해서 웹을 검색하고 찾은 내용을 분석해
문제를 해결하고 대시보드를 작동하게 만들어야 했습니다.
자, 그럼 Grok 3는 ChatGPT와 비교해서 어떨까요?
초기 벤치마크 결과를 보면 속도가 향상되었음을 알 수 있습니다.
확실히 매우 빠른 것을 느꼈습니다.
추론 능력이 뛰어나고 이해력도 좋습니다.
게다가 ChatGPT보다 더 강력한 기능이 있는데,
바로 전문가 포럼과 직접 연동되어
실시간 데이터를 제공받을 수 있다는 점입니다.
그럼 두 번째 시도를 해보겠습니다.
새로운 채팅을 시작하고
테슬라의 주가를 확인하고 현재 어떤 조치를 취해야 하는지 물어보겠습니다.
제가 보유한 1,000달러 상당의 주식에 대해, 딥서치나 심층 분석은 하지 않고
Grok 3가 실시간 정보에 접근할 수 있는지만 확인해보겠습니다.
검색 중입니다.
X 포스트와 웹페이지들을 확인하고 있네요.
매우 빠르게 답변이 오고 있습니다.
오늘 태평양 시간 기준으로 답변을 주고 있습니다.
제가 GMT를 사용하긴 하지만, 그건 중요하지 않습니다.
테슬라의 최신 주가를 알려주고 있는데,
2월 18일 기준이라 며칠 전 데이터를 참조하고 있어서
완전히 정확하지는 않지만, X의 어제 포스트를 보면
테슬라가 1.5% 하락했다고 나와있어
뭔가 불확실한 점이 있다고 암시하고 있습니다.
2월 21일 금요일 장전 시간 기준으로
현재 가격과 시장 불확실성을 고려했을 때
포지션을 유지하라고 제안하는데, 이는
제가 방금 Grok 3로 만든 앱이 알려준 것과 정확히 일치합니다.
그래서 Grok
3는 실시간 데이터로 제 앱의 분석이 정확하다는 것을 확인해주고 있습니다.
자, 다음은 Cline을 소개해드리겠습니다.
Visual Studio Code용 확장 프로그램으로 코딩을 도와주는 도구입니다.
Cursor나 Windsurf 같은 도구들과 비슷하죠.
그런 것처럼요.
하지만 매우 독특한 것을 도입했습니다.
바로 MCP 마켓플레이스인데,
AI 기능을 위한 앱스토어라고 생각하시면 됩니다.
휴대폰에 앱을 다운로드하는 대신,
AI 코딩 시스템에 슈퍼파워를 추가하는 거죠.
어떻게 하는지 보여드리겠습니다.
먼저 Visual Studio Code에서
확장 탭으로 가서 Cline이 설치되어 있는지 확인합니다.
설치되어 있다면 이 귀여운 로봇 얼굴이 보일 거예요.
이 작은 확장 아이콘이 보일 텐데, 이게 MCP 서버를 위한 겁니다.
이것이 본질적으로 AI에 추가할 수 있는 모든 슈퍼파워의 마켓플레이스입니다.
AI에 추가할 수 있죠.
Airtable, Shopify, Spotify, Discord 같은 인기 있는 것들이 있습니다.
상상할 수 있는 모든 앱을 코딩 에이전트와 통합할 수 있죠. 그리고 아시나요?
지난주에
AI 이미지 생성을 코딩 어시스턴트에 통합해보았는데,
이번에는 인기 있는 것들을 살펴보면서
Google Maps를 통합하는 것이 좋을 것 같네요.
원클릭으로 설치할 수 있습니다.
여기서 보시면
API 키를 요청하고 있으니, 간단히 입력하겠습니다.
키를 받았다고 하네요.
자동으로 MCP를 설정하고 있는데, 정말 멋지네요.
저장을 클릭하겠습니다.
성공적으로 설정되었다고 합니다.
이제 승인하고 서버를 테스트해보겠습니다.
보세요.
응답으로 캘리포니아에 있는
Google의 정확한 위치를 알려주고 있습니다.
작동이 잘 되고 있네요.
이제 Klein을 사용해서 VSCode 안에서
MCP로 무언가를 만들어보겠습니다.
자, 시작해볼까요.
Klein에게 간단한 프롬프트를 작성했습니다. 바르셀로나의
주요 카페들을 OpenStreetMap에 표시하는 간단한 앱을 만들어달라고 했죠.
지도 위의 각 핀은 커피콩 모양이어야 하고,
마우스를 올리면 정보가 표시되어야 합니다.
데이터는 구글 맵스에서 가져오기로 했습니다.
실행해보니 Klein이 구글 맵스 도구를 사용하겠다고 하네요.
정말 멋진데요.
마켓플레이스에 있는 MCP 도구 중 하나를 사용하고 있습니다.
앱에 표시할 데이터를 가져오기 위해 실행했네요.
와, 정말 멋집니다.
바르셀로나의 카페들을 찾아서
제 앱에 추가하고 있는데, 정말 놀랍네요.
저장하고 어떻게 보이는지 확인해보겠습니다.
제안된 명령어를 실행해볼게요.
와, 이걸 보세요.
바르셀로나의 카페 지도가 만들어졌습니다.
이 커피콩 위에 마우스를 올리면 가게 이름을 볼 수 있어요.
리뷰나 평점 같은 추가 정보가 있으면 좋겠지만,
제가 Klein에게 요청한 것이 정확히 이거였죠.
배경으로 OpenStreetMap을 사용해서 만들어줬고,
가장 중요한 것은 MCP 서버가 구글 맵스
API에 접근해서 지도에 표시할 데이터를 가져온다는 점입니다.
정말 대단하네요.
지도를 움직일 수 있고 정말 멋집니다.
확대/축소도 가능한데, 확대하면
더 많은 아이콘이 나타납니다.
여기 원래 있던 커피콩 위에 마우스를 올려보면
커피콩 아이콘 외에는 작동하지 않지만,
마우스를 올리면
바르셀로나에서 커피 마실만한 좋은 장소를 찾을 수 있죠.
자, 이렇게 됐네요.
바르셀로나 지도 위에 커피콩들이
앞으로 앱을 확장할 준비가 되어 있습니다.
오, 이건 흥미롭네요.
그래프에 변화가 생기고 있어요.
화면에 보여드리겠습니다.
그래프가 상당히 극적으로
제가 말하는 동안에도 변하고 있는데,
'매수'라고 나오네요. 이건 투자 조언이 아닙니다.
자, 마지막이지만 매우 중요한 소식입니다.
OmniParser V2가 출시됐는데, 이건 정말 혁신적입니다.
마이크로소프트 리서치에서 만든 도구로, 모든 AI를 컴퓨터 제어 에이전트로 바꿔줍니다.
GitHub 저장소에 있는 이 멋진 OmniTool을 제공하는데,
이건 서드파티가 아닌 마이크로소프트가 직접 만든 겁니다.
게다가 이건 단순한 서드파티 앱이 아닌 마이크로소프트의 공식 도구입니다.
더욱 놀라운 건, 이 옴니 툴 안에
도커화된 Windows 11 머신이 포함되어 있고
이 Windows 11 머신을 제어하는 데 필요한 모든 것이 미리 설치되어 있다는 거죠.
여기 개요를 보여드리겠습니다.
이 도구는 세 부분으로 구성되어 있습니다.
컴퓨터를 제어하는 API를 실행하는 OmniParser 서버, Omnibox라고 하는
도커 안에서 실행되는 Windows 11 VM, 그리고
컴퓨터를 제어하기 위한 UI 또는 웹 인터페이스인 Gradio가 있죠.
자,
맥에서 이것저것 시도해보고 꽤 많은 시간을
투자한 끝에, 여기까지 왔습니다.
기본적으로,
내 윈도우 VM이 부팅되지 않고 화면에 여러 오류가 표시되었습니다.
그래서 설치 지침을 다시 확인해보니
윈도우와 리눅스에서는 빠르게 실행된다고 되어있지만
맥에 대한 언급은 없더군요. 아마 여러분은 저보다 더 잘 될 수도 있을 겁니다.
이 단계들을 하나씩 따라하고 시스템이 지원된다면
이 훌륭한 AI 에이전트를 실행할 수 있을 겁니다.
OmniParser V2는 화면의 모든 요소를 박스로 변환하여
클릭 가능한 형태로 만들어주는 놀라운 기능을 가지고 있습니다.
원하는 대로 사용할 수 있죠.
각 박스에는 AI 에이전트가 접근할 수 있는 라벨이 있어서
컴퓨터를 완벽하게 제어할 수 있습니다.
어디서든 사용할 수 있고, 웹 에이전트로 웹 브라우징을 하거나
코딩 에이전트로 코드를 분석하고 작성하며, OS 에이전트로 윈도우 시스템을 제어할 수 있습니다.
앞으로는 맥 시스템에서도 사용할 수 있기를 바랍니다.
매우 빠른데, 이런 프레임을 처리하는데 0.8초밖에 걸리지 않습니다.
스티커 메모를 가져오고, 설정에 들어갈 수 있으며
워드 문서에 접근하고 내용을 작성할 수 있습니다.
모든 종류의 작업을 만들 수 있죠.
시스템 정보도 확인할 수 있고
정말 대단합니다.
VLC까지, 이건 미래의 모습 같습니다.
하지만 제가 실행할 수 없어서 아쉽네요.
여러분은 실행할 수 있을지도 모르겠습니다.
여기 OmniTool이 실제로 동작하는 예시가 있습니다.
웹 브라우저로 우유를 구매할 수 있는데, 간단히
'우유 좀 사줘'라고 말하면 에이전트가 전체 제어를 시작합니다.
웹 브라우저에 접속해서 Instacart로 가서 우유를 구매하는 과정을 진행합니다.
우유를 구매해줄 거예요.
레포지토리 클론도 할 수 있어서, 예를 들어
OmniParser GitHub 페이지로 갈 수 있습니다.
GitHub에서 검색하고
필요한 것을 찾아서
컴퓨터에 클론합니다.
디스크 공간도 확인할 수 있죠.
에이전트는 정확히 어디를 클릭하고 무엇을 찾아야 하는지 알고 있어서
결과를 보여줍니다.
업데이트 설정도 확인할 수 있어요.
예를 들어
'윈도우 업데이트가 있는지 확인해줘'라고 입력하면
윈도우 업데이트로 가서 확인하고 결과를 보여줍니다.
여러분에게.
아직 초기 단계지만 OmniParser V2는 미래의 모습을 보여줍니다.
무엇을?
AI와 컴퓨터가
자연스럽게 통합되어 인간이 더 이상 필요하지 않을 수도 있는 미래죠.
이번 주 시청해주셔서 감사합니다. 제 크리에이터
매직 커뮤니티에 참여하세요.
팁을 공유하고 Q&A를 하며 서로 돕는 멋진 곳입니다.
이것도 설치해보면 좋겠네요.
멋질 것 같아요.
또한 우리의 놀라운 노코드 프로젝트도 공유합니다.
링크는 설명란 아래에 있습니다.
여러분을 만나 뵙고 어떤 작업을 하시는지 듣고 싶네요.
좋아요와 구독 부탁드리고, 유튜브가 추천하는
다음 영상도 시청해주세요. 감사합니다!