커서와 함께하는 브라우저 MCP: 작업 및 테스트 자동화

채널 아이콘
All About AI 구독자 189,000명

요약

해당 영상은 브라우저 MCP 서버를 활용하여 Chrome 확장 프로그램 설치부터 서버 설정, 그리고 다양한 자동화 작업을 수행하는 방법을 상세히 설명합니다. 영상에서는 JSON 설정 파일을 Cursor 도구에 등록해 자동으로 웹페이지를 조작하고 스냅샷을 찍거나 API 문서를 수집하는 과정을 시연합니다. 또한 헤드라인 수집과 로컬 테스트 앱을 이용한 자동화 테스트 과정을 통해 MCP의 다양한 기능과 가능성을 소개합니다. 마지막으로 OpenAI 에이전트 SDK와의 통합 테스트 예고로 향후 발전 가능성도 언급됩니다.

주요 키워드

MCP Cursor 자동화 Chrome 확장 프로그램 네비게이션 스크린샷 API 문서 헤드라인 테스트 OpenAI 에이전트 SDK

하이라이트

  • 🔑 Chrome 확장 프로그램을 통해 손쉽게 MCP 서버와의 연결 설정을 완료함.
  • 📌 JSON 기반 서버 구성 파일을 Cursor에 복사하여 자동화를 구현하는 방법을 시연함.
  • 🚀 웹페이지 네비게이션과 스냅샷 기능을 이용해 빠른 테스트 및 코드 수정 과정을 보여줌.
  • 🌟 예제 코드를 작성하여 test.py 파일과 API 문서를 자동으로 생성하는 기능을 확인함.
  • 📌 Hacker News에서 헤드라인을 수집하고, 간단한 카운터 앱 테스트를 수행하여 실제 동작을 검증함.
  • ⚡️ 자동화 테스트를 통해 코드 변경 후 웹사이트 동작 확인 과정을 자동으로 진행함.
  • 🚀 테스트 중 개인정보 유출 방지를 위해 개인 데이터를 사용하지 않도록 주의사항을 언급함.
  • 🌟 향후 OpenAI 에이전트 SDK와의 통합을 통한 추가 자동화 테스트 가능성을 예고함.

용어 설명

MCP

브라우저 자동화 및 테스트 도구로, Chrome 확장 프로그램과 서버 설정을 통해 작동하는 시스템입니다.

Cursor

코드 수정 및 자동 테스트 실행을 지원하는 도구로, MCP와 연동하여 사용됩니다.

Chrome 확장 프로그램

브라우저에서 추가 기능을 제공하는 프로그램으로, MCP 서버와의 연결을 용이하게 해줍니다.

API 문서

텍스트 생성 등 특정 기능에 관한 정보를 자동으로 수집, 저장하는 문서 파일입니다.

auto browser MCP

코드 변경 후 웹페이지를 자동으로 제어하고 테스트하는 기능을 제공하는 MCP의 확장 기능입니다.

OpenAI 에이전트 SDK

OpenAI의 에이전트를 활용하여 자동화 작업을 지원하는 개발 도구입니다.

[00:00:00] Chrome 확장 프로그램과 MCP 서버 설정

Chrome 확장 프로그램을 설치하고 MCP 서버의 JSON 구성 파일을 복사해 붙여넣는 기본 설정 과정을 설명합니다. 연결 및 초기 설정 방법을 쉽게 안내합니다.

브라우저 MCP 서버 소개와 Chrome 확장 프로그램 설치 방법을 설명합니다.
Cursor에서 MCP 설정을 추가하고 Chrome 확장 프로그램과 연결하는 과정을 보여줍니다.
[00:01:11] 브라우저 네비게이션 및 스냅샷 기능

MCP를 통해 웹페이지에 접근해 Google Gemini 문서 페이지를 열고 스냅샷 기능을 시연합니다. 간단한 클릭 명령과 URL 접근으로 기능을 확인합니다.

브라우저 MCP를 통해 Google Gemini 문서에 접근하고 스크린샷을 캡처하는 기능을 시연합니다.
Python 코드 예제를 찾아 test.py 파일로 저장하는 과정을 보여줍니다.
[00:03:03] 코드 작성 및 API 문서 생성

예제 코드를 작성해 test.py 파일로 저장하고, 텍스트 생성 페이지에서 API 문서를 자동으로 수집하는 과정을 보여줍니다. 음성 명령을 통한 작업 지시도 포함됩니다.

음성 명령을 통해 텍스트 생성 문서를 API docs.txt로 저장하는 작업을 수행합니다.
API 문서 자동화 수집과 저장 기능을 시연하며, 이것이 프로젝트 문서화에 시간을 절약해주는 유용한 도구라고 설명합니다.
[00:04:20] 헤드라인 수집과 카운터 앱 테스트

Hacker News의 상위 헤드라인을 수집하여 파일로 저장하는 과정을 시연하며, 간단한 카운터 앱을 로컬 서버에서 테스트합니다. 실제 웹페이지 상호작용을 통한 기능 확인이 이루어집니다.

해커뉴스 웹사이트에서 상위 10개 헤드라인을 자동으로 수집하여 텍스트 파일로 저장하는 과정을 보여줍니다.
간단한 카운터 앱을 만들어 로컬호스트에서 실행하고 자동화된 테스트를 시도하려 했지만, 실행에 어려움이 있었습니다.
앱을 수정하여 텍스트 입력 필드를 추가했으나, 앱이 계속 리셋되는 문제가 발생하여 테스트가 제대로 진행되지 않았습니다.
[00:07:03] 자동화 테스트 및 추가 기능 시연

텍스트 입력 필드를 통한 추가 테스트와 자동화된 버튼 클릭, 스냅샷 테스트를 진행하며, 브라우저 MCP가 코드 변경 후 자동 테스트를 수행하는 모습을 보여줍니다. 마지막에는 OpenAI 에이전트 SDK와의 통합 가능성을 예고합니다.

브라우저 문제로 인한 어려움을 겪고 있지만, 이 아이디어가 매우 흥미롭다고 생각하며 자동화된 테스팅에 활용할 수 있을 것으로 기대합니다.
기본적인 리액트 앱에서 버튼 클릭 시 카운트가 증가하는 기능을 시연하며, 커서에게 2씩 증가하도록 변경을 요청합니다.
자동 브라우저 MCP를 통해 커서가 직접 브라우저를 제어하고 코드 변경사항을 테스트할 수 있음을 설명합니다.
커서가 자동으로 웹사이트에 접속하여 버튼 기능을 테스트하고 카운트가 정상적으로 증가하는지 확인합니다.
브라우저 MCP 사용 시 보안상의 이유로 개인정보가 포함된 작업은 피해야 한다는 주의사항을 전달합니다.
오늘은 제가 사용해본 아주 멋진
MCP 서버를 보여드리려고 합니다.
이것은 브라우저 MCP인데요,
설정 방법을 보여드리겠습니다.
아주 간단합니다. 먼저 여기
Chrome 확장 프로그램을 설치해야 합니다.
Chrome에 추가하는 건 매우 간단하고,
그 다음에는 서버를 설치해야 합니다.
문서 페이지로 가서
시작 가이드를 확인할 수 있습니다.
오늘은 Cursor를 사용할 건데요,
아주 간단합니다.
여기 서버 설정이 있으니
이 설정을 복사하겠습니다.
이제 Cursor로 가서
설정 메뉴에서 MCP를 선택하고
새로운 글로벌 MCP 추가를 클릭하면
JSON 파일이 나타나는데,
여기에 복사한 내용을 붙여넣으면 됩니다.
이게 기본적으로 해야 할 전부입니다.
한 가지 더 해야 할 것이 있는데요,
Chrome 확장 프로그램에서
연결 버튼을 클릭하고
페이지를 새로고침하면
모든 준비가 끝납니다.
이제 시연을 해보겠습니다.
기본적으로 브라우저를 설정하고
Cursor에서 브라우저를 사용할 수 있는데
이를 통해 할 수 있는 멋진 기능들이
몇 가지 있습니다.
여기 제 브라우저 탭이 보이죠.
Cursor가 연결된 것을 확인할 수 있습니다.
이제 제가 할 수 있는 것은
'이동'을 통해 Google Gemini
문서를 확인해보겠습니다.
실행하면 MCP 도구에
연결되고 URL이 표시됩니다.
이제 실행하면 왼쪽에서
얼마나 빠른지 보실 수 있죠.
이걸 조금 옮겨보겠습니다.
이제 스냅샷을 찍을 수 있는데
이는 기본적으로 스크린샷으로
정보를 추출할 수 있습니다.
좋습니다.
이제 클릭을 해보겠습니다.
Python 코드 예제로 변경해보죠.
브라우저에서 이제
Python을 찾아볼 건데
클릭 도구를 실행해보겠습니다. 완벽하네요.
얼마나 멋진지 보이시죠.
이제 예제 코드가 필요한데
test.py로 저장해보겠습니다.
지금 Cursor에서 에이전트 모드를 사용 중입니다.
이제 이 예제 코드를 가져와서
test.py를 만들고
수락해보겠습니다.
코드를 보시면
여기 있는 것과 정확히 일치하는 것을
볼 수 있습니다. 이걸 옮겨보면
여기 있네요. 완벽합니다.
이제 기능들을 확인해볼까요?
다시 불러와서
음성 명령을 사용할 수 있습니다.
음성 명령으로
텍스트 생성에 대한
추가 문서가 필요한데,
해당 페이지로 가서
텍스트 생성 페이지의 정보를
API docs.txt로 저장해주세요.
긴 프롬프트를 시도해보고
모든 도구를 실행해보겠습니다.
텍스트 생성으로 이동했네요.
이제 아마도
스크린샷을 찍을 거예요.
스냅샷을 찍고
이제 API docs.txt를 만들 텐데
정말 멋지죠.
우리가 할 수 있는 다른 것들이 있는데
곧 보여드릴 건데 제가 생각하기에
매우 흥미로운 것들이에요. 이것은 시간을 절약해줄 수 있죠
프로젝트의 문서를 자동으로
수집하고 싶을 때 유용합니다
이제 API 문서를 작성할 건데요
txt 파일로 만들어서 살펴보겠습니다
자, 여기서 볼 수 있죠. 이걸 확대해보면
이렇게 있는데요
텍스트 생성 Gemini API
문서가 있고, 이것은 매우 간단한
방법으로 모든 문서를
가져온 거예요. 꽤 멋진
네비게이션 기능이죠. 이제
다른 페이지로 해볼게요. 이걸 지우고
이걸 삭제하고 열어서
이렇게 하고, 한번 확인해볼까요
해커 뉴스를
뭐 이런 걸로 해보죠
여기로 이동할 거고, 완벽하네요
자 이제
좋아요, 상위 10개의
헤드라인을 가져와서 저장해볼게요
hackernews.txt에 보시면
헤드라인들이
여기 있네요, 좋습니다
스냅샷도 찍었나요? 네, 성공했네요
꽤 빨랐죠. 이제 아시겠죠
브라우저를 어떻게 조작하는지
하지만 다른 멋진 기능을
보여드리고 싶은데요. 이걸 설정하고 나면
할 수 있는 다른 것이 있어요
간단한 카운터 앱이나 뭐 그런 걸
만들어보고 싶은데요, 정말 간단한
앱을 실행하고 로컬호스트로 이동해서
간단한 테스트를 해보고 싶어요
이걸로요
간단한 카운터 앱을 만들어주시겠어요?
위아래로 카운트되는 버튼이 있는
앱을 설치하고 로컬호스트에서
3001 포트로 실행해주세요
그리고 간단한 테스트를 해볼게요
이 앱으로 이동한 다음에요
한번 시도해보고 어떻게 되는지
살펴보죠. 지금은 당연히
cloth를 사용해서 앱을 만들고 있고
hopefully MCP 서버를 사용해서
앱으로 이동해서 잘 작동하는지 볼 수 있을 겁니다
아직 테스트해보진 않았지만
네, 한번 해보죠
꽤 흥미롭다고 생각했는데
앱이 실행되지 않네요. 하지만
자동으로 고칠 수 있는지 봅시다
앱의 스냅샷을 찍어야 할 것 같아요
앱의 스냅샷을 찍어볼게요
실행이 안 되고 있으니
다시 시도해보려고 합니다
좋아요, 성공했네요. 꽤 똑똑하죠
이제 테스트해볼 수 있을까요
좋아요, 카운터로 이동했는데
클릭은 안 되네요
그건 안 되나 보네요. 하지만
버튼 위에 호버는 했어요
이제 클릭을 시도할 텐데
테스트하려고 하진 않네요
그건 안 되는군요
앱을 좀 바꿔볼까요
텍스트 입력 필드를 만들어보죠
텍스트 입력 필드가 있으면
간단한 시를 입력 필드에 써보려고 합니다
입력 필드에요
보시다시피 텍스트 입력 필드가
여기 있고 잘 보이네요
이제 이동을 시도할 건데
클릭하려고 하네요
계속 앱이 리셋되고 있어요
잘 모르겠네요, 좀 이상하지만
다시 계속 재시작되고 있어요
뭔가 문제가 있는 것 같네요
제 브라우저에 문제가 있는 것 같은데
여기서 더 어떻게 해야 할지 모르겠네요. 하지만
아이디어는 정말 멋진 것 같아서
나중에 다시 시도해볼 겁니다. 이를 통해
자동화된 테스팅을 할 수 있거든요. 제가 홈페이지에서
봤던 것처럼 작동하는지
그 영상을 대신 보여드리죠
hackernews.com으로 이동해서 검색해주시겠어요?
MCP를
브라우저로 검색해주세요
좋습니다. 상단의 게시물을 클릭해주세요
제가 아주 기본적인 리액트 앱을 가지고 있는데
버튼을 클릭할 때마다
아주 기본적인 리액트 앱에서 버튼을 클릭할 때마다
카운트가 1씩 증가합니다
그리고 커서에게 새로운 기능을 요청할 수 있어요
2씩 증가하도록 변경해달라고 요청하면
보통은 커서가 코드를 변경하고 나면
제가 다시 앱으로 돌아가서
작동하는지 테스트를 해야 했죠
제대로 동작하는지 확인하기 위해서요
이렇게 커서가 루프에 있었지만
이제 자동 브라우저 MCP를 사용하면
커서가 직접 제 브라우저를
제어할 수 있습니다. 커서에게
변경사항을 만든 후
로컬 서버에서 자동 브라우저로
테스트하라고 지시할 수 있죠
이제 다시 돌아가서 같은 요청을 해보겠습니다
2씩 증가하도록 변경해달라고 하면
커서가 먼저 이전처럼
코드를 변경할 텐데
제가 직접 웹사이트에 가서 테스트할 필요 없이
자동 브라우저 MCP 서버를 호출해서
스스로 테스트할 수 있습니다
웹사이트로 이동해서
버튼을 클릭하고 0에서 2로
증가했는지 확인하고, 다시 한번
버튼이 제대로 작동하는지 확인합니다
카운트가 0에서 2로, 다시 4로
증가했고 커서가 모든 것이
잘 작동한다고 알려줍니다. 커서가 완벽하게
검증할 수 있고, 코드를 작성하고
실제로 웹사이트에 가서
변경사항이 제대로 적용됐는지
테스트할 수 있죠. 꽤 멋지지 않나요?
이건 제가 오랫동안
생각해왔던 컴퓨터 사용에 대한
아이디어입니다. 예를 들어
웹사이트나 어떤 앱을 만들었을 때
컴퓨터를 사용해서
앱의 기능들을 실제로 테스트할 수 있죠
이것도 비슷한 맥락인데
우리가 커서에게
이런 작업을 지시하는 거죠
한 가지 언급하고 싶은 게 있는데
브라우저 MCP를 사용해보실 분들은
제가 빠르게 설명드리겠습니다
MCP 제작자가 말하길 이 확장 프로그램이
분석 데이터를 전송하는 장치를 사용한다고 해서
안전을 위해 개인정보가 포함된
작업은 하지 않는 것이 좋습니다
테스트용으로만 사용하시고
개인적인 정보가 있는 곳에는
들어가지 않는 것이 좋습니다
하지만 정말 멋진 기능이죠
커서에 직접 명령을 전달할 수 있고
브라우저 탐색부터 파일 변환까지
아주 빠르게 처리할 수 있으니까요
하지만 개인정보는 사용하지 마세요
네, 저는 이 브라우저 MCP로
재미있게 실험해봤는데
내일은 OpenAI 에이전트 SDK를
살펴보려고 합니다
MCP를 에이전트 SDK와 함께 어떻게 사용할 수 있는지
아직 해보지 않았거든요
그래서 내일 영상에서
다뤄보도록 하겠습니다