[00:00]
안녕하세요, 마이크입니다.
[00:00]
이번 주 놓치면 안 될 새롭고 트렌디한 AI 도구들을 소개해드리겠습니다.
[00:03]
오늘은 Grok 3를 사용해서 실시간 주식 거래 대시보드를 만들어보고,
[00:07]
Cline의 새로운 AI 앱스토어로 바르셀로나의 커피빈을 찾아보며,
[00:11]
로컬 AI 에이전트를 사용해 Windows 11 기기를 완벽하게 제어해보겠습니다.
[00:16]
첫 번째로, Grok 3입니다.
[00:18]
일론 머스크의 xAI에서 출시한 새로운 AI 모델로 모두가 주목하고 있죠.
[00:23]
그리고 정말 뛰어나다고 합니다.
[00:25]
그래서 직접 테스트해보도록 하겠습니다.
[00:26]
먼저 생각 기능을 활성화해서 제가 입력하는 내용을 분석할 수 있게 하겠습니다.
[00:31]
그리고 아주 간단한 프롬프트를 입력하겠습니다.
[00:33]
TAAPI.io API를 호출해서 테슬라의 실시간 시장 지표를 가져오는
[00:37]
파이썬 스크립트를 생성하고 싶습니다.
[00:41]
참고로 곧 새로운 영상이 나올 예정인데요,
[00:43]
자동화된 AI 트레이딩 에이전트를 만드는 내용입니다.
[00:47]
영상을 놓치지 않으시려면 좋아요와 구독 부탁드립니다.
[00:51]
10초마다 업데이트되는 아름다운 그래픽으로 웹 페이지에 표시하고,
[00:55]
테슬라 주식에 대해 매수, 홀드, 매도를 메인 헤드라인으로 보여주고 싶습니다.
[01:00]
디자인 모범 사례를 적용해서 정말 멋지게 보이게 하고 싶은데요,
[01:04]
마치 누가 디자인한 것처럼요? 네, 맞습니다.
[01:07]
애플 엔지니어처럼요.
[01:09]
또한 Grok 3가 이것을 정확히 이해할 수 있도록
[01:12]
몇 가지 문서를 추가로 붙여넣을 겁니다.
[01:16]
TAAPI.io 관련 문서와
[01:18]
API 응답을 어떻게 표시할지에 대한 정보를 넣겠습니다.
[01:23]
자, 이제 모두 입력했네요.
[01:24]
좋은 점은 꽤 긴 컨텍스트 윈도우를 가지고 있다는 거죠.
[01:27]
이제 Grok 3로 실행해보고 어떤 결과가 나오는지 보겠습니다.
[01:31]
보시다시피 지금 생각하고 있고,
[01:33]
이미 앱을 어떻게 만들지 구상하고 있네요.
[01:36]
꽤 멋지죠.
[01:37]
106초 동안 생각했고, 이제 필요한 모든 코드를
[01:41]
바로 눈앞에 보여주고 있습니다.
[01:43]
이것을 복사해서 코드 에디터에서 사용할 수 있겠네요.
[01:47]
파이썬 가상환경을 빠르게 만들었고,
[01:49]
이제 의존성 패키지들을 설치하겠습니다.
[01:51]
.env 파일을 만들고 제 TAAPI API 키를 넣어보겠습니다.
[01:56]
참고로 TAAPI는 다양한 주식과
[02:00]
암호화폐에 대한 실시간 데이터를 여러 거래소에서 제공합니다.
[02:04]
말씀드렸듯이,
[02:05]
다음 주쯤 이 도구들을 사용하는 AI 에이전트 제작 영상이 나올 예정입니다.
[02:10]
API 키를 생성하고 복사해서,
[02:12]
여기에 붙여넣겠습니다.
[02:14]
그리고 마지막 단계로
[02:15]
친절하게 제공해준 명령어로
[02:18]
애플리케이션을 실행하고 브라우저에서 localhost:8000에 접속하면 됩니다.
[02:22]
자, 이렇게 실행이 됐네요!
[02:24]
컨트롤을 누른 상태로 클릭해서 브라우저에서 열 수 있습니다.
[02:27]
음, 지금은 이 메시지만 보이네요.
[02:29]
아름다운 웹사이트가 없습니다.
[02:31]
Grok 3에게 무슨 문제인지 물어보겠습니다.
[02:33]
이 메시지만 보이는데
[02:34]
아름다운 UI 웹페이지가 없네요. 어떻게 해야 하나요?
[02:37]
Grok 3가 생각하지 않고도 답을 줄 수 있기를 바랍니다.
[02:40]
살펴보니 몇 가지 주요 변경사항이 있네요,
[02:44]
특히 app.py 파일에서요.
[02:46]
자, 이 변경사항들을 적용해보겠습니다.
[02:48]
브라우저에서 열어보면,
[02:50]
현재 웹페이지에 아무것도 표시되지 않고
[02:53]
콘솔에 에러가 발생했네요.
[02:54]
그럼 이걸 Grok에 복사해서 붙여넣고 DeepSearch를 실행해보겠습니다.
[02:58]
단순히 답을 검색하는 것뿐만 아니라, 답변에 대해 추론도 할 수 있죠.
[03:01]
처리하는 데 시간이 좀 더 걸릴 것 같네요.
[03:04]
보시다시피 지금 에러를 분석하고 있고,
[03:07]
최신 웹 검색을 활용하고 있습니다.
[03:09]
아마도 시간이 지나면서
[03:11]
라이브러리 중 하나가 변경되었을 수 있고,
[03:13]
이를 해결하기 위해 인터넷에서 정보를 찾아야 할 것 같네요.
[03:17]
잘 작동하는지 볼까요?
[03:18]
이미 에러를 찾았고 관련 URL들을 연결하고 있네요.
[03:21]
필요한 모든 것을 처리한 것 같습니다.
[03:24]
모든 코드를 복사해서 붙여넣었으니, 잘 작동하길 바랍니다.
[03:27]
이제 웹페이지에 접속해보면... 와!
[03:30]
오, 와우!
[03:31]
네, 'hold' 신호를 보여주고 있네요.
[03:32]
데이터가 나타나고 있는데, 와우.
[03:35]
뭔가 작동하고 있네요.
[03:38]
진행되고 있습니다.
[03:39]
더 보기 좋게 수정해볼까요.
[03:42]
다시 Grok 3에 입력해보겠습니다.
[03:43]
지금은 작동하지만 웹페이지가 계속 커지고 있어요.
[03:46]
라인 그래프가 박스 안에 머물도록 수정해주세요. 계속 커지지 않게요.
[03:50]
이것 좀 보세요.
[03:51]
정말 멋지네요.
[03:52]
실시간으로 데이터가 들어오고 있습니다.
[03:54]
몇 가지 수정 후에, 테슬라 주식의 실시간 RSI와 MACD를 보고 있네요.
[04:00]
더 많은 데이터 포인트를 요청했으니,
[04:02]
박스를 더 추가할 수 있는지 확인해보겠습니다.
[04:05]
하지만 이것만으로도 놀랍네요. 이렇게 입력했습니다.
[04:08]
좋아요. 완벽하게 작동하네요.
[04:09]
많은 데이터 박스를 원했는데, 두 개만 주셨네요. 새로운 코드를 작성했습니다.
[04:12]
앱을 재시작하고 웹페이지를 확인해볼까요.
[04:15]
그리고 이제... 와우.
[04:16]
이것 좀 보세요.
[04:17]
이게 다 무슨 의미인지는 모르지만, 실시간으로 업데이트되고 있어요.
[04:21]
다양한 종류의 정보를 보여주고 있네요.
[04:25]
여러 시장 지표들로부터
[04:28]
테슬라 주식을 매수, 보유, 또는 매도해야 하는지에 대한 정보를 주고 있습니다.
[04:32]
현재는 여전히 '보유' 상태네요.
[04:34]
이게 잘 작동하는지 확인하기 위해 뭘 할지 아세요?
[04:36]
이 영상을 만드는 동안 실행해두고
[04:38]
매수나 매도로 변경되는지 업데이트해드리겠습니다.
[04:42]
계속 지켜봐주세요, 변화가 있는지 확인해보겠습니다.
[04:45]
이건 금융 정보나 투자 조언이 아니라는 점 기억해주세요.
[04:48]
이런 걸 시도하실 때는 본인의 판단으로 하시기 바랍니다.
[04:51]
다음 주 채널에서는 실시간
[04:54]
AI 트레이딩 에이전트를 만들어서 이런 데이터 포인트들을 활용해볼 예정입니다.
[04:58]
바로 이런 것처럼요.
[04:59]
보시는 내용이 마음에 드신다면 좋아요와 구독 부탁드립니다.
[05:02]
매주 이런 영상을 만들고 있습니다.
[05:04]
보시다시피, 한 번에 해결되는 게 아니에요.
[05:07]
이번 주에 많은 사람들이 Grok 3가 한 번에 모든 걸 만들 수 있다고 했지만,
[05:10]
제 경험상 그건 사실이 아니었습니다.
[05:12]
먼저 생각을 해야 했고,
[05:14]
후속 질문들을 해야 했으며,
[05:16]
마지막으로 해결할 수 없는 문제가 생겼을 때는,
[05:19]
DeepSearch 기능을 사용해서 웹을 검색하고 찾은 내용을 분석해
[05:23]
문제를 해결하고 대시보드를 작동하게 만들어야 했습니다.
[05:27]
자, 그럼 Grok 3는 ChatGPT와 비교해서 어떨까요?
[05:32]
초기 벤치마크 결과를 보면 속도가 향상되었음을 알 수 있습니다.
[05:35]
확실히 매우 빠른 것을 느꼈습니다.
[05:37]
추론 능력이 뛰어나고 이해력도 좋습니다.
[05:40]
게다가 ChatGPT보다 더 강력한 기능이 있는데,
[05:43]
바로 전문가 포럼과 직접 연동되어
[05:46]
실시간 데이터를 제공받을 수 있다는 점입니다.
[05:49]
그럼 두 번째 시도를 해보겠습니다.
[05:52]
새로운 채팅을 시작하고
[05:56]
테슬라의 주가를 확인하고 현재 어떤 조치를 취해야 하는지 물어보겠습니다.
[06:00]
제가 보유한 1,000달러 상당의 주식에 대해, 딥서치나 심층 분석은 하지 않고
[06:05]
Grok 3가 실시간 정보에 접근할 수 있는지만 확인해보겠습니다.
[06:09]
검색 중입니다.
[06:10]
X 포스트와 웹페이지들을 확인하고 있네요.
[06:12]
매우 빠르게 답변이 오고 있습니다.
[06:15]
오늘 태평양 시간 기준으로 답변을 주고 있습니다.
[06:19]
제가 GMT를 사용하긴 하지만, 그건 중요하지 않습니다.
[06:23]
테슬라의 최신 주가를 알려주고 있는데,
[06:26]
2월 18일 기준이라 며칠 전 데이터를 참조하고 있어서
[06:29]
완전히 정확하지는 않지만, X의 어제 포스트를 보면
[06:34]
테슬라가 1.5% 하락했다고 나와있어
[06:38]
뭔가 불확실한 점이 있다고 암시하고 있습니다.
[06:41]
2월 21일 금요일 장전 시간 기준으로
[06:46]
현재 가격과 시장 불확실성을 고려했을 때
[06:49]
포지션을 유지하라고 제안하는데, 이는
[06:52]
제가 방금 Grok 3로 만든 앱이 알려준 것과 정확히 일치합니다.
[06:56]
그래서 Grok
[06:57]
3는 실시간 데이터로 제 앱의 분석이 정확하다는 것을 확인해주고 있습니다.
[07:02]
자, 다음은 Cline을 소개해드리겠습니다.
[07:04]
Visual Studio Code용 확장 프로그램으로 코딩을 도와주는 도구입니다.
[07:07]
Cursor나 Windsurf 같은 도구들과 비슷하죠.
[07:10]
그런 것처럼요.
[07:11]
하지만 매우 독특한 것을 도입했습니다.
[07:13]
바로 MCP 마켓플레이스인데,
[07:15]
AI 기능을 위한 앱스토어라고 생각하시면 됩니다.
[07:19]
휴대폰에 앱을 다운로드하는 대신,
[07:22]
AI 코딩 시스템에 슈퍼파워를 추가하는 거죠.
[07:25]
어떻게 하는지 보여드리겠습니다.
[07:26]
먼저 Visual Studio Code에서
[07:28]
확장 탭으로 가서 Cline이 설치되어 있는지 확인합니다.
[07:32]
설치되어 있다면 이 귀여운 로봇 얼굴이 보일 거예요.
[07:35]
이 작은 확장 아이콘이 보일 텐데, 이게 MCP 서버를 위한 겁니다.
[07:38]
이것이 본질적으로 AI에 추가할 수 있는 모든 슈퍼파워의 마켓플레이스입니다.
[07:43]
AI에 추가할 수 있죠.
[07:44]
Airtable, Shopify, Spotify, Discord 같은 인기 있는 것들이 있습니다.
[07:48]
상상할 수 있는 모든 앱을 코딩 에이전트와 통합할 수 있죠. 그리고 아시나요?
[07:52]
지난주에
[07:53]
AI 이미지 생성을 코딩 어시스턴트에 통합해보았는데,
[07:57]
이번에는 인기 있는 것들을 살펴보면서
[07:59]
Google Maps를 통합하는 것이 좋을 것 같네요.
[08:02]
원클릭으로 설치할 수 있습니다.
[08:04]
여기서 보시면
[08:05]
API 키를 요청하고 있으니, 간단히 입력하겠습니다.
[08:08]
키를 받았다고 하네요.
[08:10]
자동으로 MCP를 설정하고 있는데, 정말 멋지네요.
[08:14]
저장을 클릭하겠습니다.
[08:15]
성공적으로 설정되었다고 합니다.
[08:17]
이제 승인하고 서버를 테스트해보겠습니다.
[08:20]
보세요.
[08:20]
응답으로 캘리포니아에 있는
[08:24]
Google의 정확한 위치를 알려주고 있습니다.
[08:27]
작동이 잘 되고 있네요.
[08:29]
이제 Klein을 사용해서 VSCode 안에서
[08:32]
MCP로 무언가를 만들어보겠습니다.
[08:35]
자, 시작해볼까요.
[08:36]
Klein에게 간단한 프롬프트를 작성했습니다. 바르셀로나의
[08:39]
주요 카페들을 OpenStreetMap에 표시하는 간단한 앱을 만들어달라고 했죠.
[08:43]
지도 위의 각 핀은 커피콩 모양이어야 하고,
[08:45]
마우스를 올리면 정보가 표시되어야 합니다.
[08:46]
데이터는 구글 맵스에서 가져오기로 했습니다.
[08:48]
실행해보니 Klein이 구글 맵스 도구를 사용하겠다고 하네요.
[08:52]
정말 멋진데요.
[08:54]
마켓플레이스에 있는 MCP 도구 중 하나를 사용하고 있습니다.
[08:57]
앱에 표시할 데이터를 가져오기 위해 실행했네요.
[08:59]
와, 정말 멋집니다.
[09:01]
바르셀로나의 카페들을 찾아서
[09:05]
제 앱에 추가하고 있는데, 정말 놀랍네요.
[09:09]
저장하고 어떻게 보이는지 확인해보겠습니다.
[09:12]
제안된 명령어를 실행해볼게요.
[09:13]
와, 이걸 보세요.
[09:15]
바르셀로나의 카페 지도가 만들어졌습니다.
[09:18]
이 커피콩 위에 마우스를 올리면 가게 이름을 볼 수 있어요.
[09:21]
리뷰나 평점 같은 추가 정보가 있으면 좋겠지만,
[09:24]
제가 Klein에게 요청한 것이 정확히 이거였죠.
[09:27]
배경으로 OpenStreetMap을 사용해서 만들어줬고,
[09:31]
가장 중요한 것은 MCP 서버가 구글 맵스
[09:34]
API에 접근해서 지도에 표시할 데이터를 가져온다는 점입니다.
[09:38]
정말 대단하네요.
[09:38]
지도를 움직일 수 있고 정말 멋집니다.
[09:41]
확대/축소도 가능한데, 확대하면
[09:45]
더 많은 아이콘이 나타납니다.
[09:46]
여기 원래 있던 커피콩 위에 마우스를 올려보면
[09:50]
커피콩 아이콘 외에는 작동하지 않지만,
[09:52]
마우스를 올리면
[09:53]
바르셀로나에서 커피 마실만한 좋은 장소를 찾을 수 있죠.
[09:57]
자, 이렇게 됐네요.
[09:58]
바르셀로나 지도 위에 커피콩들이
[10:01]
앞으로 앱을 확장할 준비가 되어 있습니다.
[10:04]
오, 이건 흥미롭네요.
[10:06]
그래프에 변화가 생기고 있어요.
[10:07]
화면에 보여드리겠습니다.
[10:10]
그래프가 상당히 극적으로
[10:12]
제가 말하는 동안에도 변하고 있는데,
[10:16]
'매수'라고 나오네요. 이건 투자 조언이 아닙니다.
[10:19]
자, 마지막이지만 매우 중요한 소식입니다.
[10:21]
OmniParser V2가 출시됐는데, 이건 정말 혁신적입니다.
[10:25]
마이크로소프트 리서치에서 만든 도구로, 모든 AI를 컴퓨터 제어 에이전트로 바꿔줍니다.
[10:30]
GitHub 저장소에 있는 이 멋진 OmniTool을 제공하는데,
[10:34]
이건 서드파티가 아닌 마이크로소프트가 직접 만든 겁니다.
[10:38]
게다가 이건 단순한 서드파티 앱이 아닌 마이크로소프트의 공식 도구입니다.
[10:41]
더욱 놀라운 건, 이 옴니 툴 안에
[10:45]
도커화된 Windows 11 머신이 포함되어 있고
[10:48]
이 Windows 11 머신을 제어하는 데 필요한 모든 것이 미리 설치되어 있다는 거죠.
[10:52]
여기 개요를 보여드리겠습니다.
[10:53]
이 도구는 세 부분으로 구성되어 있습니다.
[10:55]
컴퓨터를 제어하는 API를 실행하는 OmniParser 서버, Omnibox라고 하는
[11:00]
도커 안에서 실행되는 Windows 11 VM, 그리고
[11:04]
컴퓨터를 제어하기 위한 UI 또는 웹 인터페이스인 Gradio가 있죠.
[11:08]
자,
[11:08]
맥에서 이것저것 시도해보고 꽤 많은 시간을
[11:12]
투자한 끝에, 여기까지 왔습니다.
[11:15]
기본적으로,
[11:16]
내 윈도우 VM이 부팅되지 않고 화면에 여러 오류가 표시되었습니다.
[11:19]
그래서 설치 지침을 다시 확인해보니
[11:22]
윈도우와 리눅스에서는 빠르게 실행된다고 되어있지만
[11:25]
맥에 대한 언급은 없더군요. 아마 여러분은 저보다 더 잘 될 수도 있을 겁니다.
[11:29]
이 단계들을 하나씩 따라하고 시스템이 지원된다면
[11:32]
이 훌륭한 AI 에이전트를 실행할 수 있을 겁니다.
[11:36]
OmniParser V2는 화면의 모든 요소를 박스로 변환하여
[11:39]
클릭 가능한 형태로 만들어주는 놀라운 기능을 가지고 있습니다.
[11:43]
원하는 대로 사용할 수 있죠.
[11:44]
각 박스에는 AI 에이전트가 접근할 수 있는 라벨이 있어서
[11:48]
컴퓨터를 완벽하게 제어할 수 있습니다.
[11:51]
어디서든 사용할 수 있고, 웹 에이전트로 웹 브라우징을 하거나
[11:55]
코딩 에이전트로 코드를 분석하고 작성하며, OS 에이전트로 윈도우 시스템을 제어할 수 있습니다.
[12:00]
앞으로는 맥 시스템에서도 사용할 수 있기를 바랍니다.
[12:04]
매우 빠른데, 이런 프레임을 처리하는데 0.8초밖에 걸리지 않습니다.
[12:09]
스티커 메모를 가져오고, 설정에 들어갈 수 있으며
[12:11]
워드 문서에 접근하고 내용을 작성할 수 있습니다.
[12:14]
모든 종류의 작업을 만들 수 있죠.
[12:16]
시스템 정보도 확인할 수 있고
[12:17]
정말 대단합니다.
[12:18]
VLC까지, 이건 미래의 모습 같습니다.
[12:22]
하지만 제가 실행할 수 없어서 아쉽네요.
[12:23]
여러분은 실행할 수 있을지도 모르겠습니다.
[12:25]
여기 OmniTool이 실제로 동작하는 예시가 있습니다.
[12:28]
웹 브라우저로 우유를 구매할 수 있는데, 간단히
[12:31]
'우유 좀 사줘'라고 말하면 에이전트가 전체 제어를 시작합니다.
[12:35]
웹 브라우저에 접속해서 Instacart로 가서 우유를 구매하는 과정을 진행합니다.
[12:39]
우유를 구매해줄 거예요.
[12:41]
레포지토리 클론도 할 수 있어서, 예를 들어
[12:44]
OmniParser GitHub 페이지로 갈 수 있습니다.
[12:47]
GitHub에서 검색하고
[12:48]
필요한 것을 찾아서
[12:50]
컴퓨터에 클론합니다.
[12:52]
디스크 공간도 확인할 수 있죠.
[12:54]
에이전트는 정확히 어디를 클릭하고 무엇을 찾아야 하는지 알고 있어서
[12:57]
결과를 보여줍니다.
[12:59]
업데이트 설정도 확인할 수 있어요.
[13:01]
예를 들어
[13:02]
'윈도우 업데이트가 있는지 확인해줘'라고 입력하면
[13:06]
윈도우 업데이트로 가서 확인하고 결과를 보여줍니다.
[13:10]
여러분에게.
[13:10]
아직 초기 단계지만 OmniParser V2는 미래의 모습을 보여줍니다.
[13:14]
무엇을?
[13:14]
AI와 컴퓨터가
[13:15]
자연스럽게 통합되어 인간이 더 이상 필요하지 않을 수도 있는 미래죠.
[13:20]
이번 주 시청해주셔서 감사합니다. 제 크리에이터
[13:23]
매직 커뮤니티에 참여하세요.
[13:24]
팁을 공유하고 Q&A를 하며 서로 돕는 멋진 곳입니다.
[13:27]
이것도 설치해보면 좋겠네요.
[13:29]
멋질 것 같아요.
[13:30]
또한 우리의 놀라운 노코드 프로젝트도 공유합니다.
[13:32]
링크는 설명란 아래에 있습니다.
[13:35]
여러분을 만나 뵙고 어떤 작업을 하시는지 듣고 싶네요.
[13:37]
좋아요와 구독 부탁드리고, 유튜브가 추천하는
[13:42]
다음 영상도 시청해주세요. 감사합니다!