코드 기반 액션으로 더 효율적인 AI 에이전트 구축

채널 아이콘
All About AI 구독자 189,000명

요약

이 영상은 코드 에이전트를 활용하여 여러 API 호출과 연속적인 JSON 요청을 단일 코드 실행으로 통합하는 방법을 설명합니다. 화자는 기존의 도구 호출 방식과 비교하여 코드 기반 액션의 효율성과 간결함을 실험하고, 실제 사례를 통해 비용과 실행 속도 개선 효과를 보여줍니다. 또한 Nvidia GTC 이벤트와 GPU 래플 정보를 안내하며, Matplotlib을 이용한 맞춤형 시각화 도구 제작 과정을 자세히 설명합니다. 전체적으로 AI 에이전트 개발의 새로운 접근법과 그 실용성을 강조합니다.

주요 키워드

코드 에이전트 Code As Action API 호출 JSON Matplotlib Authorized Imports Nvidia GTC GPU 래플 웹 에이전트 비용 절감

하이라이트

  • 🔍 코드 에이전트를 이용해 기존의 여러 JSON 요청을 하나의 코드 작업으로 줄이는 방법을 보여줍니다.
  • 🚀 API 호출 예제를 통해 스마트폰 구매를 위한 비용 산정 과정을 비교 분석합니다.
  • 📈 Matplotlib을 활용해 API 가격 변동 및 미래 예측 결과를 시각화하는 커스텀 도구 제작 과정을 시연합니다.
  • 🎉 Nvidia GTC 이벤트와 GPU 래플 정보를 소개하여 AI 커뮤니티와의 소통 및 참여를 유도합니다.
  • 💡 실험을 통해 코드 기반 액션의 장점 – 즉, 실행 단계 단축과 비용 절감 효과 – 을 강조합니다.

용어 설명

코드 에이전트 (Code Agent)

AI가 직접 코드를 실행하여 여러 작업을 동시에 처리하고, 복잡한 연산이나 API 호출을 단순화하는 시스템입니다.

Code As Action

문자열 기반의 JSON 요청 대신 실제 코드 실행을 통해 작업을 수행함으로써 효율성과 간결함을 높이는 접근 방식입니다.

API

어플리케이션 프로그래밍 인터페이스로, 서로 다른 소프트웨어 모듈 간의 상호작용을 가능하게 하는 도구입니다.

Authorized Imports

코드 실행 시 특정 라이브러리만 허용함으로써 보안을 강화하고, 악성 코드 실행을 방지하는 기능입니다.

[00:00:00] 코드 에이전트 소개 및 초기 설정

오픈소스 연구 기사에서 영감을 받아 코드 에이전트를 테스트하는 방법과 기존의 JSON 기반 도구 호출 방식을 소개합니다. 초기 스마트폰 구매 비용 산정을 위한 API 호출 예제를 설명합니다.

허깅페이스의 오픈소스 연구 논문에서 발견한 코드 에이전트에 대해 관심을 가지게 되었습니다.
기존의 JSON 기반 순차적 도구 호출 방식과 다른 새로운 접근 방식을 소개합니다. API 호출을 통해 스마트폰 구매에 가장 비용 효율적인 국가를 찾는 예시를 설명합니다.
기존 방식은 하나의 국가에 대해 여러 번의 API 호출이 필요했지만, '코드 as 액션' 방식은 단일 코드 블록으로 더 효율적인 처리가 가능합니다.
코드 기반 접근 방식의 장점으로는 도구 재사용성, 더 나은 벤치마크 성능, 직관적인 표현, LLM의 코드 학습 경험 등이 있습니다.
코드 에이전트를 사용하여 커스텀 도구를 개발하고 테스트해보려는 계획을 설명합니다.
[00:03:37] Nvidia GTC 이벤트 및 GPU 래플 안내

Nvidia의 GTC AI 컨퍼런스와 관련된 이벤트 및 GPU 래플 정보를 안내합니다. 등록 절차와 이벤트 참여 방법을 상세히 설명합니다.

3월 17일 엔비디아 GTC AI 컨퍼런스 개최 소식과 함께 GeForce RTX 4080 SUPER GPU 래플 이벤트를 안내합니다.
래플 참여 방법과 컨퍼런스 등록 절차에 대해 상세히 설명합니다.
젠슨 황의 기조연설, Mistral AI CEO와 랭체인 CEO의 세션 등 주목할 만한 컨퍼런스 세션들을 소개합니다.
래플 참여를 위한 구체적인 요구사항과 향후 진행 계획에 대해 설명합니다.
[00:05:12] 웹 에이전트와 코드 에이전트를 통한 API 가격 예측

웹 페이지 도구를 통해 API 가격에 관한 정보를 검색하고, 코드 에이전트를 사용해 에러 처리 및 병렬 실행을 보여줍니다. API의 현재 가격과 미래 예측 과정을 논의합니다.

발표자는 규칙상 참가할 수 없다는 아쉬움을 표현하며, 추후 더 자세한 정보를 공유하겠다고 약속합니다.
visit_webpage 도구를 소개하며, 이 도구가 스몰 에이전트 라이브러리를 사용해 웹 페이지를 방문하고 마크다운 형식으로 콘텐츠를 가져오는 기능을 설명합니다.
코드 에이전트의 중요성을 강조하며, 웹 에이전트 도구 접근 권한과 승인된 임포트 추가 기능을 설명합니다.
Claude API와 Google Gemini 2.0 API의 가격을 조사하고, 지난 2년간의 LLM 비용 감소 추세를 분석하여 2025년 가격을 예측하는 목표를 설명합니다.
manager_agent.run_query를 실행하고 결과를 확인하는 과정을 시작하며, 파이썬 코드 실행과 에러 처리 방식을 설명합니다.
[00:09:29] 커스텀 시각화 도구 제작 및 최종 결과 분석

Matplotlib을 통합한 맞춤형 도구를 제작하여 API 가격 변동을 시각적으로 분석하는 과정을 시연합니다. 최종적으로 코드 에이전트를 활용한 통합 실행 결과를 확인하며 효율성을 강조합니다.

에이전트가 작업을 완료하여 API 가격 예측 결과를 보여줍니다. Deeps R1 API의 내년 예상 가격은 0.48이며, 토큰/API 예상 가격은 0.19입니다.
코드 에이전트가 계산 과정을 수행했습니다. 백만 단위당 평균 비용을 가정하고 49%의 역사적 감소율을 적용하여 최종 가격을 산출했습니다.
이 방식의 장점은 여러 요청을 하나의 통합된 코드로 처리하여 30% 더 효율적으로 작업을 수행할 수 있다는 점입니다.
새로운 도구 개발을 시작하여, matplotlib을 활용한 API 가격 변화 시각화 도구를 만들기로 결정했습니다.
새로운 도구 생성을 위한 프롬프트를 작성하고, matplotlib을 사용하여 데이터를 시각화하고 PNG 파일로 저장하는 기능을 구현하기 시작했습니다.
새로운 plot 도구를 임포트하고 기본적인 설정을 확인합니다.
plot_agent를 생성하고 matplotlib을 사용하여 데이터 시각화 도구를 설정합니다.
필요한 라이브러리를 임포트하고 보안을 위해 임포트 제한을 설정합니다.
plot_agent에 대한 더 자세한 설명을 추가하고 도구 사용법을 개선합니다.
코드를 실행하여 API 가격 변동 예측 그래프를 생성합니다.
생성된 그래프에서 현재 가격(2.19/백만 토큰)과 예측 가격을 확인합니다.
주말에 허깅페이스에서
오픈소스 딥 리서치 논문을 읽고 있었는데
제 눈을 사로잡은 것이 있었습니다.
그래서 이것에 대해
좀 더 깊이 파고들어 보고 싶었죠.
바로 코드 에이전트를 사용하는 것인데요,
이것을 테스트해보고
제가 발견한 내용을 공유하고 싶었습니다.
보시다시피 이들은 제가
이 채널에서 자주 사용했던
접근 방식과는 다른
도구 호출 방식을 사용하고 있습니다.
여기 보시면... 잘 보이시나요?
조금 확대해보겠습니다.
이정도면 잘 보이실 것 같네요.
이제 보시면,
왼쪽 상단에
스마트폰 모델 코드 액트 원(Code Act One)의
구매하기에 가장 비용 효율적인
국가를 결정하라는 지시사항이 있습니다.
이것이 우리의 목표이고
사용 가능한 API들이 있습니다.
환율 조회, 변환, 세금 계산,
최종 가격 조회, 휴대폰 가격 조회,
배송비 추정 등이 있는데
이것들을 우리의 도구라고 생각하시면 됩니다.
이 채널에서 우리는
텍스트 JSON을 액션으로 사용하는
순차적인 방식을 많이 사용했었죠.
여기서는 국가를
독일로 입력하면 응답을 받습니다.
1.1과
0.19를 받고, 모델과 국가를 다시 입력하면
700이라는 응답을 받습니다.
이제 다른 도구를 호출해서
변환하고 세금을 계산해야 하죠.
이렇게 하나의 국가에 대해서만
세 번의 호출이 필요한 거죠.
꽤 많은 요청이 필요한데,
반면에 오른쪽을 보시면
LLM 에이전트를 사용한
'코드 as 액션' 방식이 있습니다.
이걸 정말 시도해보고 싶었는데요.
여기서는 순차적으로 도구를
호출하는 대신 코드를 작성합니다.
도구를 호출하는 대신
모든 국가를 리스트에 넣고
빈 최종 처리 결과를 설정한 다음
가장 효율적인 국가를 찾기 위해
for 루프를 실행합니다.
이렇게 하면 많은 단계가 필요 없고
한 번의 액션으로
처리할 수 있다는 걸 알 수 있죠.
아래로 스크롤해보면
코드 액션이 JSON보다
훨씬 간단하다는 것을 알 수 있습니다.
JSON에서는 5개의 연속 액션을
4개의 병렬 스트림으로 실행해야 하며
각각 20개의 JSON 블록을 생성해야 하지만
코드에서는 한 단계면 됩니다.
for 루프를 실행하고
국가들이 리스트에 있으니까요.
저는 이게 매우 흥미로웠고
전에 시도해보지 않은 방식이었습니다.
코드를 사용하면 도구들을
공통 라이브러리처럼 재사용할 수 있고
벤치마크에서 더 나은 성능을 보입니다.
액션을 표현하는 더 직관적인 방법과
학습 과정에서 LLM이 코드에 많이 노출된
두 가지 이유 때문인데요.
제가 테스트해본 결과
여기 있는 벤치마크에서
좋은 결과를 얻었습니다.
그래서 이걸 실제로 테스트해보고 싶었고,
다른 문서들도 찾아보았습니다.
여기 스몰 에이전트와
그들이 사용하는 코드 에이전트가 있습니다
오늘은 이것에 대해 몇 가지 테스트를 진행하고
이것이 실제로 어떻게 작동하는지
직접 확인해보려고 합니다
제가 직접 이 위에 도구를 만들어보고 싶은데
커스텀 도구를 추가해서
코딩 에이전트가 제 도구도 활용할 수 있는지
확인해보고 싶습니다. 하지만 그전에
이 채널에서
매우 흥미로운 이벤트를 진행한다는
소식을 전해드리고 싶습니다. 멋진 상품도
준비되어 있어서 이 영상을 보여드리려고 합니다
3월 17일, 엔비디아가 GTC
AI 컨퍼런스를 산호세에서 개최합니다
현장 참석은 제한적이지만
컨퍼런스는 온라인으로도
진행될 예정입니다
올해 이 채널에서는
엔비디아의 GeForce RTX 4080 SUPER
GPU를 받을 수 있는 래플에 참여할 기회를 드립니다
이 래플에 참여하기 위해서는
AI 분야와 그 발전 방향에
관심이 있으면 됩니다
GTC 컨퍼런스에서는
온라인으로 참여할 수 있는 많은 세션이 있는데
생성형 AI, ML, 로보틱스 등
흥미로운 주제들이 많습니다
래플에 참여하기 위해서는
이 세션들에 참여해야 하는데
먼저 등록을 해야 합니다
아래 설명란의 링크를 통해
이 페이지로 이동할 수 있습니다
'지금 등록하기'를 클릭하고
등록 양식을 작성하면
이 등록 양식을 받게 되는데
이것을 작성하면
카탈로그에서 찾을 수 있는
모든 세션에 참여할 수 있습니다
저는 개인적으로
젠슨 황의 기조연설을
가장 기대하고 있습니다
또한 Mistral AI의 CEO인
아서 메나드의 세션도 있고
랭체인의 공동창업자이자 CEO인
해리슨 체이스의 'AI 에이전트 프로덕션' 세션도
기대됩니다
저는 이 세션들을 온라인으로 참여할 예정이고
래플에 참여하고 싶으시다면
여러분도 참여하셔야 합니다
나중에 제가 폼을 공개할 예정인데
여기에 참여한 세션 정보를 입력해야
GeForce 4080 SUPER를
받을 수 있는 자격이 주어집니다
이 상품에 도전할 수 있는 거죠
오늘은 약 한 달 후에 있을
GTC 컨퍼런스와
래플에 대해 알려드리고 싶었습니다
지금부터 등록을 시작하시면
컨퍼런스가 시작될 때
준비가 되어 있을 테니까요
세션도 보시고
래플에도 참여하실 수 있습니다
추가 정보는 나중에 다시 알려드리겠습니다
지금은 설명란의 링크를 통해
등록만 하시면 되고
컨퍼런스 시작이 가까워지면
자세한 정보를 다시 전달해 드리겠습니다
저는 정말 기대되네요
여러분도 그러시길 바랍니다
정말 흥미진진할 것 같고
상품도 정말 좋은데
제가 참여할 수 없다는 게
아쉽네요
제가 참가할 순 없지만, 네, 규칙이 그렇죠
추후에 더 자세한 정보를 가지고 돌아오겠습니다
계속 지켜봐 주세요. 그리고 지금은
여기 커서에 아주 이해하기 쉬운
예제를 준비해 놨습니다
먼저 임포트를 할 건데요, 확대해서 보여드리면
visit_webpage 도구를 임포트 하겠습니다
이 도구는 스몰 에이전트 라이브러리를 사용해서
웹 페이지를 방문하고
마크다운 형식으로 콘텐츠를 가져옵니다
이걸 컨텍스트로 사용할 수 있죠
여기 보시면 웹 에이전트가 있는데
visit_webpage 도구를 사용하고 있습니다
이 도구의 설명을 보면
웹 검색을 실행하는데
인자로 쿼리를 전달하면 됩니다
그리고 아주 중요한 코드 에이전트가 있는데
이것은 웹 에이전트 도구에 접근할 수 있고
코드 에이전트가 코드를 작성할 때
승인된 임포트를 추가할 수 있습니다
이 도구들에서 실행할 코드를 작성할 때요
이건 나중에 다시 살펴볼 내용인데
커스텀 도구를 만들 때 다시 다룰 거고
지금은 웹 에이전트에 대한
쿼리를 작성해 보겠습니다
스몰 에이전트를 사용해서
정보를 검색할 건데요
Anthropic의 Claude API 가격이 얼마인지
알아보고
구글 제미나이 2.0 API 가격도 찾아보겠습니다
그리고 가격 인하에 대해서도 알아볼 건데
지난 2년간 LLM 비용이
얼마나 감소했는지 보겠습니다
이 데이터를 분석해서
이를 기반으로
2025년 가격을 예측해보려고 합니다
에이전트가
이전 데이터와 현재 데이터를 기반으로
계산을 수행해서 앞으로 LLM API
가격이 어떻게 될지 예측하는 걸 보여드리겠습니다
이제 실행해 보겠습니다
manager_agent.run_query를 실행하고
답변을 출력하도록 하겠습니다
이제 시작하면 hopefully
몇 가지
예시들을
어, 좀 이상하네요만
보시면 여기
모든 요청을 첫 단계로 로딩하고 있고
이미 파이썬 코드를 실행하고 있습니다
이 검색 쿼리를 실행할 건데
Claude API 가격이 얼마인지 검색하고 있죠
여기서는 코드를 사용하고 있는데
이전에 했던 것처럼
JSON 텍스트 액션 대신에요
보시면 파이썬 코드를 실행 중이고
여기
쿼리와 함수가 있고 응답을 출력합니다
함수에서 바로
실행되는 걸 볼 수 있습니다
여기 모든 결과가 나오는데
꽤 빠르네요. 그리고 이것도
에러가 발생했을 때
최대 단계 수가 설정되어 있어서
최대 단계를 10으로 설정했죠, 여기 보시면
최대 10단계까지 실행할 수 있고
각 단계마다 에러가 발생할 수 있는데
여기 에러 메시지가 보이죠
그러면 다시 시도하는데
에러를 다음 시도에
피드백으로 전달해서
코드를 다시 생성하고
수정할 수 있습니다
이걸 계속 실행시켜 두고
코드 에이전트를 사용한
좋은 예시들이 나오면
다시 살펴보도록 하겠습니다
자, 에이전트가 작업을 완료했습니다.
여기 최종 결과가 나왔는데요,
실행된 코드의 결과를 보시면
최종 답변은
내년도 Deeps R1 API의 예상 가격이
0.48입니다.
토큰/API의 예상 가격은
0.19입니다.
위로 스크롤해서
어떻게 이런 결과가 나왔는지 살펴보겠습니다.
계산 과정을 보면
여기 있네요, 완벽합니다.
여기서 보시면
코드 에이전트가
가격에 대한 수치를 입력했고
단순화를 위해 백만 단위당 평균 비용을 가정했으며
과거의 비용 감소율을
적용했습니다.
약 50%, 정확히는 49%의 감소율을 적용하고
평균 가격에
이 역사적 감소율을 곱해서
최종 가격을 산출했습니다.
정말 멋진 점은
중간에 여러 요청을 하는 대신
모든 것을 하나의 큰 코드로 통합했다는 겁니다.
이렇게 하나의 코드로 만들어서
결과를 얻을 수 있죠.
한 번에 즉시 처리가 가능하며
여러 번의 요청을 주고받을 필요 없이
이것을 가져오고 저것을 가져오고
이 함수를 사용하고
저 함수로 계산하고,
이해하시죠? 그래서
초기 테스트 결과를 봤을 때
이 글에서 언급한 내용에 동의합니다.
이 시스템을 사용하면
30% 더 적은 단계로 처리할 수 있다는 점이죠.
매우 흥미로웠고
전에는 시도해보지 못했던
방식인데, 이제 한 가지 더 시도해보려고 합니다.
이제 코딩 에이전트가 작동하는 것을 확인했으니
새로운 도구를 만들어보겠습니다.
꽤 멋질 것 같은데요.
새로운 도구를 만들어보려고 합니다.
보시다시피 웹 페이지를 방문하는
도구가 있는데
이제 문서를 좀 사용해보겠습니다.
여기 제가 수집한 문서가 있는데
스몰 에이전트에서 가져온 것이고
도구 문서도 있습니다.
matplotlib을 사용해서 도구를 만들어보겠습니다.
API 가격 변화를 시각화하는
꽤 흥미로울 것 같네요.
자, 추가해보겠습니다.
코드 에이전트를 가져오고 도구들도 가져와서
음...
문서를 추가하고 스몰 에이전트도 있고
도구
문서도 있으니
새로운 커스텀 도구를 만들기 위한
프롬프트를 작성해보겠습니다.
자, 여기 프롬프트가 있습니다.
matplotlib을 사용해 데이터를 시각화하는 도구를 만들고
create_plot이라는 함수를 만들어서
생성된 플롯을 PNG 파일로 저장하고
tools.py에 이것을 수정해달라고 하겠습니다.
이 프롬프트로 시도해보죠.
네, 좋습니다. tools.py를
이렇게 업데이트하면 되겠네요. create_plot이 있고
matplotlib을 임포트하고
이것이 우리가 얘기했던
승인된 임포트도 변경해야 한다는 점을
코드 에이전트가 인식하는지
확인해보고 싶네요.
일단은 이것을 코드에
추가해보겠습니다.
임포트가 잘 된 것 같고
새로운 도구도 있네요, create_plot
완벽해요, xi_plot.png
음, 꽤 괜찮아 보이는데
한번 시도해볼게요
꽤 광범위했지만
한번 해보죠. 그리고
이게 잡혔는지 확인하고 싶은데
아직은 아닌 것 같네요. 일단
플롯을 만드는 것부터 시작해볼까요
plot_agent를 만들어서 도구를 호출해보죠
create_plot으로요. 자, 10단계가 있네요
단계가 있고
matplotlib을 사용해서 데이터를 시각화하고 저장하는 거죠
괜찮아 보이네요
음, 설명을 좀 더 자세히 해야 할 것 같지만
일단 한번 보죠
자, 이제 보니
tools에서 임포트를 해야 할 것 같네요
임포트해야 해요
그걸
음, 그래요
스크립트를 개선해야 할 것 같네요
스크립트를
그리고 우리는
matplotlib을 임포트해야 해요
matplotlib, 좋아요. 보시다시피
인증된 임포트를 더 추가했어요
이렇게 함으로써
에이전트가 작성할 수 있는 코드를
더 잘 제어할 수 있게 됐죠
임포트를 제한함으로써
악의적인 코드가 생성되는 것을 방지할 수 있어요
맞죠?
사용할 수 있는 서드파티 라이브러리를
제한함으로써 말이에요
꽤 똑똑한
방법이라고 생각해요. 자, 이제
code_agent에서
tools를 써서 프롬프트를 작성해볼게요
plot_agent에게
create_plot 도구 사용에 대한
더 나은 설명을 요청해보죠
이 설명을 좀 업그레이드해보죠
이게 중요할 것 같아서요
좋아요, 이제 좀 낫네요
보시다시피 설명을
좀 더 확장했어요
이렇게 하면 에이전트가
더 잘 작동할 것 같네요
자, 이제 거의 다 됐어요
여기 아래에 도구를 임포트했고
도구도 잘 작동하는 것 같아요
이제 실행만 하면 될 것 같은데
우리는
뭔가를 추가해야 해요
네 번째 단계를 추가해볼까요
마지막으로 데이터를 시각화하는
플롯을 만들어보죠. 한번 해볼게요
그렇게 자세하진 않지만
데이터를 시각화할 플롯이에요
여기서 에이전트는
어떤 데이터인지 이해해야 해요
괜찮을 것 같네요
자, 이제 실행해볼게요
python code_agent.py를 실행하면
qwen-2.5-coder-32b-instruct를
사용하고 있죠
보시다시피 꽤 빠르네요
그냥 실행시켜 두고
마지막에 우리가 얻게 될 것은
API 가격 변동 예측 그래프예요
자, 여기 나왔네요
그래프를 보시면
왼쪽에는 백만 토큰당 가격이
아래쪽에는 모델이 있고
여기 현재 가격인 2.19가
백만 토큰당 비용으로 나와있고
예상 가격은
여기 아래에 있네요
완벽하진 않지만
그게 중요한 게 아니었어요
이걸 다시 실행했는데
녹화를 깜빡했거든요
여기 보시면 플롯을 만드는
코드가 있고 이게 하나의
액션으로 처리됐어요
여러 단계로 나누지 않고
한 번에 처리한 거죠
이게 바로
이 영상의 핵심이에요
이런 실험을 해보고 싶었어요
AI 에이전트가 이런 코드를
실행하게 함으로써 많은
시퀀스나 요청을
절약할 수 있죠
이를 통해 우리는
요청, 즉 비용과
지연 시간을 절약할 수 있어요
꽤 흥미로웠고
많이 배웠어요
이게 마지막 영상은 아닐 거예요
계속해서 실험하고 시도해볼 거니까요
이 채널에서요
Nvidia GTC 등록 링크도
아래에서 확인해주세요
시청해주셔서 감사하고
며칠 후에 다시 만나요
안녕히 계세요