[00:00]
구글이 방금 RAG를 영원히 바꿔놓았을 수도 있습니다
[00:02]
최신 Gemini API 업데이트로 말이죠
[00:04]
그들이 Gemini 파일 검색 도구를 출시했는데
[00:07]
이건 정말 혁신적입니다
[00:09]
규모와 가격 측면에서 효과적으로 관리되는 RAG를
[00:12]
완전히 파괴적인 수준으로 제공합니다
[00:14]
자, 저는 최신 Gemini API의
[00:16]
파일 검색 도구를 사용해서 이 앱을 만들었습니다
[00:19]
여러분을 과정으로 안내하면서
[00:21]
실제로 어떤 일이 일어나는지 설명하고 싶습니다
[00:23]
여기서 API 키가 필요한데 이미 선택해 놨습니다
[00:25]
제가 직접 파일 세트를 업로드하는 옵션이 있지만
[00:27]
현대 i10 자동차 매뉴얼을 그냥 사용하겠습니다
[00:29]
업로드하고 채팅하기를 클릭할게요
[00:30]
제가 그렇게 하는 순간, 첫 번째 단계는
[00:33]
의미적 청킹입니다
[00:34]
문서를 의미 있는 단락으로 나누어
[00:36]
맥락을 이해하는 것입니다
[00:38]
우리를 위해 그 작업을 하고 있습니다
[00:40]
두 번째는 문서 임베딩으로
[00:41]
텍스트를 숫자 벡터로 변환하는 것입니다
[00:43]
그 다음 세 번째는 벡터 인덱싱입니다
[00:45]
이는 텍스트 벡터를 검색 가능한 맵으로 구성하여
[00:47]
검색할 수 있게 하는 것입니다
[00:49]
그 다음에는 계층화된 검색을 수행하는데
[00:51]
이는 인덱싱이 완료된 후의 다음 단계입니다
[00:53]
여러분이 보신 것처럼
[00:55]
완전히 자동화된 여러 단계들이 있었고
[00:57]
저는 실제로 RAG 시스템을 설정하지 않았습니다
[00:59]
이것은 Gemini API의 새로운 파일 저장 도구가
[01:02]
우리를 위해 처리해주고 있는 것입니다
[01:04]
이제 저는 질문을 할 수 있습니다
[01:06]
질문도 제안해주고 있네요. 정말 멋집니다
[01:08]
일반적인 오류 해결에 대한 정보를
[01:11]
어디서 찾을 수 있나요?
[01:12]
이제 수행하게 될 작업은
[01:14]
문서를 살펴보고
[01:15]
응답을 제공하는 것입니다
[01:17]
하지만 제가 집중하고 싶은 부분은
[01:19]
소스입니다. 맞죠?
[01:20]
이것이 인용 부분인데
[01:22]
매우 전형적인 RAG처럼 동작하고 있습니다
[01:24]
하지만 아름다운 점은
[01:26]
제가 RAG 시스템을 구축하지 않았다는 것입니다
[01:29]
이 모든 것이 Gemini API 내에 포함되어 있습니다
[01:32]
만약 제가 종단간 RAG 프로세스를 사용했다면
[01:35]
해야 했을 수많은 수동 작업들이
[01:38]
이제 API 자체에서
[01:40]
완전히 처리됩니다
[01:43]
그리고 가장 좋은 점은 이것이 단순히
[01:46]
API 호출이라는 것입니다. 맞죠?
[01:48]
다시 돌아가서 이것이
[01:50]
대형 언어 모델과 어떻게 다른지
[01:52]
그리고 진전이 무엇인지 논의해봅시다
[01:54]
진행하면서 코드도 살펴볼 것입니다
[01:55]
아시다시피 Gemini 같은
[01:57]
대형 언어 모델들은 정말 놀랍습니다
[01:59]
시를 쓰고, 코드를 디버깅하고
[02:02]
복잡한 주제들을 몇 초 만에 설명할 수 있습니다
[02:04]
세상에 대한 방대한 지식을 가지고 있지만
[02:07]
하나의 근본적인 사각지대가 있습니다
[02:09]
그들은 여러분의 세계에 대해서는
[02:11]
전혀 알지 못합니다
[02:14]
여러분의 문서, 회사의 개인 데이터
[02:16]
프로젝트 노트들 말이죠
[02:18]
이 모든 것이 그들에게는 보이지 않습니다
[02:20]
개발자들에게 있어서 AI가
[02:22]
이런 특정한 개인 정보를 이해하도록 하는 것은
[02:25]
엄청난 도전이었습니다
[02:27]
이를 해결하기 위해 일반적으로 사용되는
[02:29]
주요 솔루션을 검색 증강 생성
[02:32]
또는 RAG라고 합니다
[02:36]
하지만 RAG 시스템을 직접 구축하는 것은
[02:39]
복잡하고 비용이 많이 드는
[02:42]
다단계 엔지니어링 악몽이었습니다. 지금까지는요
[02:45]
그 모든 복잡한 엔지니어링 작업을
[02:48]
간단하고 우아한 API 호출로 바꿔버립니다.
[02:51]
그래서 이번 영상에서는
[02:53]
이것이 무엇인지, 어떻게 작동하는지,
[02:56]
그리고 왜 이것이 우리가
[02:58]
AI를 활용하는 방식을 영원히 바꿀 것인지에 대해 자세히 알아보겠습니다.
[03:01]
파일 검색이 얼마나 대단한지 제대로 이해하려면
[03:04]
기존의 방식, 즉 어려운 방식을
[03:06]
먼저 이해해야 합니다. RAG의 핵심 아이디어는 간단합니다.
[03:09]
대형 언어 모델을 외부 지식과 연결하여
[03:11]
실제 사실에 기반한 응답을 생성하는 것입니다.
[03:14]
AI에게 암기로 답하게 하는 대신
[03:17]
오픈북 시험을 치르게 하는 것과 같다고 생각하면 됩니다.
[03:19]
오픈북 시험을 치르게 하는 것과 같다고 생각하면 됩니다.
[03:21]
이 과정은 세 단계로 이루어집니다. 검색, 증강, 생성입니다.
[03:24]
꽤 쉬워 보이죠? 전혀 그렇지 않습니다.
[03:26]
이 파이프라인을 처음부터 구축하는 것은
[03:29]
정말 큰 프로젝트입니다.
[03:31]
데이터 소싱과 청킹 작업이 포함되는데,
[03:34]
이는 문서를 완벽한 크기의 덩어리로 나누는 작업입니다.
[03:36]
그 다음엔 임베딩 생성이 있는데,
[03:39]
이는 별도의 모델을 사용해서
[03:41]
그 덩어리들을 수치적 표현으로 변환하는 작업입니다.
[03:43]
그 덩어리들을 수치적 표현으로 변환하는 작업입니다.
[03:45]
그리고 벡터 데이터베이스 관리가 있는데,
[03:48]
이는 전문 데이터베이스를
[03:50]
설정하고 관리하며 비용을 지불하여
[03:52]
이러한 임베딩을 저장하고 검색하는 작업입니다.
[03:54]
그리고 검색 및 랭킹 시스템을 구축해야 합니다.
[03:56]
제가 방금 설명한 각 단계는
[03:58]
엄청난 엔지니어링 골칫거리입니다. 아니,
[04:00]
인프라 골칫거리라고 부르는 게 맞겠네요.
[04:02]
이는 이 강력한 기술을
[04:04]
우리와 같은 많은 개발자들의
[04:06]
손에서 멀어지게 한 커다란 장벽입니다.
[04:09]
바로 이런 이유로 파일 검색 도구가
[04:11]
정말 정말 대단한 것입니다.
[04:13]
어떻게 다른지 이해해볼까요?
[04:15]
RAG를 죽이는 건가요? 그런 종류의 것일까요?
[04:17]
전혀 그렇지 않습니다.
[04:19]
파일 검색 자체가 RAG 시스템입니다.
[04:21]
핵심 차이점은 그 모든 복잡함을 숨긴다는 것입니다.
[04:24]
전체 파이프라인을 자동화하는
[04:26]
완전 관리형 RAG 시스템입니다.
[04:28]
이 다이어그램을 보면
[04:30]
프로세스가 실제로 두 가지 주요 단계로 나뉩니다.
[04:33]
먼저 오프라인 인덱싱 과정이 있습니다.
[04:35]
여기서 무거운 작업들이 일어납니다.
[04:37]
파일 검색은 시맨틱 검색이라는 기술을 사용합니다.
[04:40]
단순히 키워드만 매칭하는 것과 달리
[04:42]
실제로 의미를 이해합니다.
[04:44]
파일을 업로드하면 단순히 저장되는 게 아닙니다.
[04:46]
자동으로 덩어리로 나뉘고
[04:48]
앞서 논의한 임베딩이라고 불리는
[04:51]
수치적 표현으로 변환됩니다.
[04:53]
이는 텍스트의 의미적 의미를 포착합니다.
[04:55]
이러한 임베딩들은 여기서 보는
[04:57]
전문 데이터베이스나
[04:59]
파일 검색 저장소에 저장됩니다.
[05:02]
문서에서 임베딩, 그리고 데이터베이스까지의
[05:05]
전체 흐름이 바로 일회성 인덱싱 단계입니다.
[05:07]
그다음엔 실시간 쿼리 프로세스가 있습니다.
[05:10]
사용자가 질문을 하면 제미나이가
[05:12]
먼저 외부 지식이 도움이 될지 판단합니다.
[05:15]
필요 없다면 그냥 답변을 생성합니다.
[05:17]
하지만 답이 당신의 파일에 있다면
[05:20]
예스 경로를 따릅니다.
[05:22]
모델이 하나 이상의 최적화된 검색 쿼리를 생성합니다.
[05:25]
그 쿼리들도 임베딩으로 변환되어
[05:27]
데이터베이스를 검색하는 데 사용됩니다.
[05:29]
시스템이 가장 관련성 높은 텍스트 덩어리들을 찾고
[05:31]
시스템이 가장 관련성 높은 텍스트 덩어리들을 찾습니다.
[05:36]
컨텍스트를 가져와서 최종 Gemini 모델로 다시 전달합니다.
[05:39]
Gemini 모델은 그 컨텍스트를 활용해서 정확하고 근거가 있는
[05:41]
최종 답변을 생성합니다. 여러분이 보고 계신
[05:44]
이 전체적인 정교한 루프가
[05:47]
백그라운드에서 일어나는 과정이며
[05:48]
Gemini API가 여러분을 위해
[05:51]
완전히 관리해드리는 부분입니다.
[05:54]
좋습니다, 이것이 이론적인 측면입니다.
[05:56]
하지만 정말 게임체인저가 되는 이유는
[05:58]
구현에 사용할 수 있는 코드가 얼마나
[06:00]
간단한지에 있습니다. 정말 3단계만
[06:03]
거치면 됩니다. 첫 번째 단계는
[06:05]
보시다시피 파일 스토어를 생성하는 것입니다.
[06:07]
두 번째 단계는 파일을 해당
[06:09]
파일 스토어에 업로드하고 가져오는 것입니다.
[06:12]
전체 오프라인 인덱싱 과정을 시작하는
[06:15]
단일 API 호출만 하면 됩니다.
[06:16]
정말 멋지죠. 인덱싱 과정이라고 할 때
[06:19]
청킹, 임베딩 등 모든 것이
[06:21]
자동으로 처리된다는 의미입니다.
[06:22]
코드에서도 그것을 확인할 수 있고요.
[06:24]
그리고 세 번째 부분은 쿼리 부분입니다.
[06:26]
마지막 호출이 실시간 쿼리 과정을
[06:28]
실제로 트리거합니다. 툴을 사용해서
[06:30]
모델을 스토어에 연결하기만 하면
[06:32]
답변 생성이 시작됩니다.
[06:34]
정말 간단하죠. 복잡한 엔지니어링 산더미에서
[06:37]
단 몇 줄의 코드로 바뀐 것입니다.
[06:39]
파일을 가져오는 여러 옵션들도
[06:41]
제공되며, 청킹과 설정은
[06:42]
모두 툴이 자동으로 처리해줍니다.
[06:45]
걱정할 필요가 없어요. 이것이
[06:47]
방금 살펴본 다이어그램입니다.
[06:49]
제가 설명한 두 가지 프로세스와
[06:51]
메타데이터가 어떻게 저장되는지에 대한
[06:52]
추가 정보입니다. 이 모든 문서는
[06:54]
제공 가능하며 공유해드릴 수 있습니다.
[06:56]
또 다른 흥미로운 기능들도 있습니다.
[06:57]
기본 제공되는 기능 중 하나는
[06:59]
인용입니다. 업로드하면 일반 RAG처럼
[07:01]
자동으로 인용을 제공할 수 있습니다.
[07:02]
하지만 이것도 자동으로 처리되니
[07:04]
정말 멋집니다. 구현하고 싶다면
[07:06]
이것이 코드 측면입니다.
[07:08]
코드를 보면 구현이 꽤 간단하다고
[07:10]
느끼실 텐데, 그 의미는 엄청납니다.
[07:11]
이것이 가능하게 하는 세 가지 주요
[07:13]
혁신에 대해 얘기해봅시다.
[07:15]
첫 번째는 개발 속도입니다. API를 통해
[07:18]
접근할 수 있다는 것을 이해하시면
[07:19]
개발이 상당히 빨라질 것입니다.
[07:21]
두 번째는 중요한 비용 장벽입니다.
[07:22]
정말 흥미로운 것은 데이터 저장이
[07:24]
완전히 무료라는 점입니다. 쿼리 시
[07:27]
임베딩 생성도 무료입니다.
[07:28]
파일 인덱싱을 위한 소액의 일회성 비용과
[07:30]
최종 답변에 사용된 컨텍스트에 대한
[07:32]
표준 Gemini 요금만 지불하면 됩니다.
[07:34]
세 번째로, 단순함의 힘을 희생하지 않습니다.
[07:36]
기본으로 수십 가지 파일 형식을
[07:37]
지원합니다. 수년간 개인 데이터를
[07:39]
진정으로 이해하는 AI를 구축할 수 있는
[07:41]
능력은 복잡성과 비용의 거대한 벽
[07:43]
뒤에 갇혀 있었습니다. File Search로
[07:45]
Google이 바로 그 벽을 해머로
[07:48]
부숴버린 것입니다. 이제 질문은
[07:50]
'어떻게 구축할 것인가?'가 아닙니다.
[07:52]
여러분을 위한 질문은 이제 근거 있는
[07:54]
AI에 접근할 수 있게 되었으니
[07:56]
무엇을 구축할 것인지입니다.
[07:58]
댓글 섹션에 여러분의 생각을 알려주세요.
[08:00]
여러분이 무엇을 구축할 계획인지
[08:02]
듣고 싶습니다. 그리고 언제나 그렇듯이
[08:04]
이 영상이 도움이 되셨다면 좋아요 버튼을
[08:06]
눌러주시고 다음 영상을 놓치지 않도록
[08:08]
채널 구독해주세요. 시간 내주셔서
[08:11]
감사합니다. 다음 영상에서 뵙겠습니다.