[00:00]
이번 주 Anthropic과 Google이 모두
[00:02]
Gemini와 Claude가 이제 이전 대화를
[00:05]
볼 수 있다고 발표했습니다.
[00:06]
ChatGPT가 과거 대화를
[00:08]
볼 수 있는 방식과 매우 유사한 메모리 기능이죠.
[00:10]
제가 좋아하는 음식을 물어봤더니
[00:11]
관련 채팅을 찾아서 햄버거라고 답했어요.
[00:13]
간단하죠. 당연히 인앤아웃 버거인데
[00:15]
제 특별한 주문 방식까지 기억하고 있었습니다.
[00:17]
더블 미트, 애니멀 스타일, 엑스트라 토스트 번
[00:19]
머스터드, 생 다진 양파, 애니멀
[00:21]
스타일 프라이즈, 치즈 없음. 아는 사람은 알죠.
[00:23]
그래서 이 영상에서는
[00:24]
AI 메모리에 대해 이야기하고
[00:25]
그것이 맥락에 좋은 점과 나쁜 점을
[00:27]
주로 Claude에 초점을 맞춰 다루되
[00:28]
ChatGPT와 Gemini에 대해서도 이야기할 거예요.
[00:30]
그리고 제가 가장 좋아하는 메모리 MCP
[00:31]
서버를 보여드릴 텐데 이 기능은 상당히
[00:32]
논란이 많습니다. 흥미롭긴 하지만
[00:35]
동시에 조심스럽기도 해요.
[00:36]
왜 그런지 설명해드리겠습니다. 우선,
[00:38]
몇 번이나 AI와 대화를 하다가
[00:39]
속도 제한 때문에 다시 시작해야 했던 적이 있나요?
[00:41]
이전 대화에서 배운 내용을 다시 설명해야 했죠.
[00:43]
정말 짜증나는 일이고
[00:45]
과거 채팅을 보고 맥락을 파악하는 능력은
[00:46]
굉장히 큰 도움이 됩니다.
[00:48]
우리에게 많은 도움이 될 거예요.
[00:49]
많은 시간을 절약해줄 것입니다. 하지만
[00:51]
반대편도 있어요. 아니요, 프라이버시
[00:52]
얘기가 아닙니다. 잘못 구현되거나
[00:54]
잘못 사용되면 실제로 우리를
[00:56]
훨씬 비효율적으로 만들 수도 있거든요. Anthropic이
[00:57]
Claude용으로 출시했는데 메모리
[00:59]
기능을 사용하려면 설정으로 가서
[01:01]
활성화해야 하는데, 지금은
[01:02]
Max 플랜 사용자만 이용할 수 있습니다.
[01:04]
대화 기본설정이라고 불리며
[01:05]
검색 및 참조 채팅을 켜면 됩니다.
[01:07]
기본적으로 작동 방식은
[01:09]
자신에 대한 것이나
[01:11]
과거 대화에 대해 물어보면
[01:12]
그것을 기억해낼 수 있습니다.
[01:14]
"어떤 안경을 쓰고 있나요?"라고
[01:15]
말해볼 수 있고 기억하는지 봅시다.
[01:18]
관련 채팅을 찾고 있습니다.
[01:20]
이전 대화를 바탕으로
[01:22]
레이밴 메타 안경을 가지고 계시나요?
[01:23]
제가 원래
[01:25]
레이밴 메타 사이즈 50을 가지고 있었는데
[01:26]
너무 작아서 레이밴 메타 사이즈 53을
[01:30]
주문했다는 것을 기억하고 있습니다. 이 큰 것들이죠.
[01:33]
처방 렌즈를 받았다는 것도 기억하고
[01:34]
블랙프라이데이에 이것들을 샀다고 했어요.
[01:36]
반년 넘게 된 대화를
[01:38]
이야기하고 있는 거죠.
[01:39]
이 기능이 아직 베타 버전이지만
[01:40]
정말 마음에 드는
[01:41]
두 가지 구현 사항이 있습니다.
[01:43]
하나는 가시성을 제공한다는 것입니다.
[01:45]
관련 채팅을 참조할 때
[01:46]
알려주고 웹에서는
[01:48]
해당 대화로
[01:49]
클릭해서 들어갈 수도 있어요.
[01:51]
어떤 면에서는 기능 안의 기능으로
[01:52]
Claude 검색을 개선하고 이전 채팅에서
[01:54]
찾고 있는 것을 정확히
[01:55]
찾을 수 있게 도와줍니다.
[01:56]
제게 빠진 주요 기능은
[01:57]
여기 아래 검색 및 도구
[01:59]
버튼에서 켜고 끌 수 있었으면 좋겠다는 것입니다.
[02:01]
MCP 서버에 있긴 하지만
[02:03]
확장 사고처럼
[02:05]
쉽게 켜고 끌 수 있는 설정이어야 한다고 생각합니다.
[02:06]
문서를 살펴보던 중에 흥미로운 점을 발견했는데
[02:09]
여기서 흥미로운 점은 Claude가
[02:10]
실제로 무엇을 볼 수 있는지입니다. Claude에게
[02:12]
이러한 경계 내에서 대화를 검색하도록
[02:14]
프롬프트할 수 있습니다. 프로젝트 외부의 모든 채팅이나
[02:16]
개별 프로젝트
[02:19]
대화들을 말이죠. 검색은
[02:21]
각 특정 프로젝트 내에서 제한됩니다. 이는
[02:22]
정말 멋진 사용 사례라고 생각하고
[02:24]
ChatGPT와 비슷한 면에서
[02:25]
ChatGPT는 한동안 메모리 기능을 가지고 있었지만
[02:28]
ChatGPT는 두 가지 다른 유형의 메모리를 가지고 있습니다.
[02:30]
개인화 설정으로 들어가면
[02:32]
저장된 메모리를 참조할 수 있는데, 이는
[02:34]
Claude와 Gemini가 방금 획득한 기능이거나
[02:36]
메모리를 관리할 수 있습니다. 여기서 당신에 대해
[02:38]
항상 알고 있을 특정 메모리를
[02:39]
추가하거나 삭제할 수 있습니다. 그리고 저는
[02:41]
아직 Gemini 버전에 액세스하지 못했습니다.
[02:42]
솔직히 말해서 Gemini에
[02:44]
돈을 지불하지 않기 때문입니다. 하지만
[02:45]
관계없이 모든 사람에게 제공될 것이라고 생각합니다.
[02:47]
오늘 2.5 Pro 사용자들에게 출시되고 있습니다. 그리고 그들은 이미
[02:49]
이 기능이 내장되어 있습니다. 따라서
[02:51]
민감한 정보를 저장하고 싶지 않다면
[02:52]
임시 채팅을 켤 수 있는데, 이는
[02:54]
시크릿 모드와 같은 것입니다. 이것이 다른 점입니다. 저는
[02:56]
ChatGPT를 사용하고, Claude를 사용하고,
[02:57]
Gemini를 사용하고, 때때로 Meta AI도 사용합니다.
[03:00]
그리고 기본적으로 우리의
[03:02]
메모리가 분리되어 있습니다. 모두
[03:04]
별도로 저장되고 있습니다. 그리고
[03:06]
메모리를 공유할 수 있다면 실제로
[03:08]
정말 유용할 것입니다. 그것이
[03:10]
제가 MCP를 좋아하는 또 다른 이유입니다. 왜냐하면 MCP가
[03:12]
모든 회사에서 완전히 채택되면
[03:15]
우리는 자체 도구를 연결할 수 있게 될 것이고
[03:17]
이 경우에는 자체 메모리를 연결할 수 있게 됩니다. 저는
[03:19]
한동안 기본 메모리를 사용해 왔습니다.
[03:21]
이것이 제가 계속 사용하고 있는 것입니다.
[03:22]
제가 좋아하는 점은 메모리를
[03:24]
마크다운 파일로 저장하고 그러면
[03:26]
기본적으로 직접 편집할 수 있다는 것입니다.
[03:27]
정말 쉽습니다. 그래서 저는 메모리를 편집하고 관리합니다.
[03:29]
Obsidian으로 말이죠. 그리고
[03:31]
MCP를 통해 메모리를 사용하는 이점은
[03:34]
설정에 들어가서 그냥
[03:35]
켜고 끌 수 있다는 것입니다. 기본 메모리에는
[03:37]
노트 삭제, 노트 읽기,
[03:38]
컨텍스트 구축, 캔버스, 목록 등
[03:41]
디렉토리, 노트 이동, 동기화 상태, 메모리 프로젝트 목록과 같은
[03:44]
다양한 도구들이 있습니다. 여기에는 정말 많은 도구들이
[03:45]
있고 계속 개선되고 있습니다. 그런데
[03:46]
Claude 데스크톱에 연결했고
[03:48]
Claude 코드에 연결했고, Cursor에 연결했고,
[03:50]
Gemini에 연결했고,
[03:52]
kirao.dev에 연결했습니다. MCP로
[03:54]
작업하는 거의 모든 곳에서 기본 메모리를
[03:56]
연결할 수 있습니다. 그래서
[03:57]
Claude 데스크톱으로 구축할
[03:58]
무언가에 대해 이야기하고 있습니다. 그러면
[04:00]
Claude 코드나 Cursor에서 구축하거나
[04:01]
둘 다에서 구축할 때, 둘 다
[04:03]
같은 메모리 뱅크에 액세스하고
[04:04]
메모리에 저장된 내용을 바탕으로
[04:06]
제 진행 상황을 볼 수 있습니다. 그리고 이것이
[04:08]
이러한 앱에 내장된 네이티브 메모리와의
[04:10]
차별화 요소입니다. 하지만 대부분의
[04:13]
모바일 클라이언트는 MCP 지원이 없습니다.
[04:15]
적어도 로컬 MCP 지원, 표준 IO는 없습니다.
[04:17]
그래서 제 휴대폰은 기본
[04:19]
메모리에 액세스할 수 없습니다. 그것이
[04:21]
MCP 기반 메모리 사용의 한 가지 단점입니다. 하지만 분명히
[04:23]
컴퓨터에서 작업할 때는 ChatGPT를 통한
[04:25]
네이티브 내장 메모리 사용을 매우 기꺼이 할 것입니다.
[04:28]
Claude, Gemini 등에서 말이죠. 자, 이제 이런
[04:29]
내장된 메모리 기능들과
[04:30]
MCP 구현들, 그리고 그것들의
[04:33]
장점들에 대해 얘기했지만, 실제로는
[04:34]
양날의 검이에요. 이것에는
[04:36]
다른 면도 있고, 모든 것이
[04:37]
컨텍스트와 관련이 있습니다. 그럼
[04:39]
컨텍스트에 대해 설명해드릴게요. 메모리는
[04:40]
제 생각에는 AGI에 도달하기 위한
[04:42]
핵심 구성 요소 중 하나입니다. ChatGPT나
[04:44]
Claude에서 AGI를 구현할 수 있다는 건 아니에요.
[04:47]
여기서 얘기하는 메모리와 AGI를 위한
[04:48]
메모리는 서로 다른 유형의 메모리지만,
[04:50]
이것은 거대한 첫걸음입니다. AGI에 도달하려면
[04:52]
단기 메모리 한계를
[04:53]
극복해야 하기 때문이죠. 그리고 우리는
[04:55]
이 채널에서 이것에 대해 많이 얘기했어요,
[04:56]
컨텍스트 윈도우의 한계에 대해서요.
[04:58]
컨텍스트 윈도우는 본질적으로
[05:00]
주어진 채팅의 단기 메모리입니다. 채팅이
[05:02]
길어질수록 컨텍스트 윈도우는
[05:03]
작아지고 본질적으로 더 둔해지고
[05:05]
효율성이 떨어집니다. 그리고 지난 1년 동안
[05:06]
여러 AI 회사들이 점점 더 큰
[05:08]
컨텍스트 윈도우를 가진
[05:10]
모델들을 출시했습니다. Gemini는 이제
[05:12]
100만 토큰 컨텍스트 윈도우를 가지고 있어요. Claude Forset도
[05:14]
API에서 100만 토큰
[05:15]
컨텍스트 윈도우를 가지고 있습니다. ChatGPT-5는
[05:18]
현재 40만 토큰 컨텍스트 윈도우를
[05:19]
가지고 있는 것 같아요. 그래서 컨텍스트 윈도우가
[05:21]
커질수록, 그 문제를 어느 정도
[05:23]
해결하는 것처럼 보이죠. 적어도
[05:24]
그렇게 생각할 수 있을 거예요. 하지만 밝혀진 바로는, 더 긴
[05:26]
단기 메모리, 더 큰 컨텍스트 윈도우를
[05:28]
제공한다고 해서 실제로는 그렇게
[05:29]
좋은 성능을 보이지 않아요. 그리고 여기서
[05:31]
컨텍스트 엔지니어링이라는 용어가
[05:32]
정말 중요해집니다. 본질적으로 컨텍스트
[05:35]
엔지니어링은 컨텍스트를 신중하게 관리하는 것입니다.
[05:37]
많은 컨텍스트를 보유할 수 있다고 해서
[05:38]
모든 컨텍스트를 사용해야 한다는 건 아니에요.
[05:40]
매우 선택적이어야 합니다
[05:41]
왜냐하면 컨텍스트는 LLM에서 가장
[05:43]
중요한 요소이기 때문입니다. 그리고 제가 말하고자 하는 바는
[05:46]
이제 ChatGPT, Claude, Gemini가
[05:48]
과거 대화를 볼 수 있다는 것은 훌륭하지만,
[05:49]
그 과거 대화들과 발견한 모든 것이
[05:51]
컨텍스트에 입력됩니다. 그래서 한편으로는
[05:53]
이것이 매우 유익합니다. 이것은 정말 멋져요.
[05:55]
저도 기대하고 있어요. 하지만 다른 한편으로는,
[05:57]
이것이 본질적으로 하는 일은 우리의
[05:59]
컨텍스트를 오염시키는 것입니다. 컨텍스트는 다시 말하지만
[06:01]
대화 내의 모든 것을 의미합니다. 당신의
[06:03]
프롬프트뿐만 아니라
[06:05]
AI의 응답도 컨텍스트로 계산됩니다.
[06:07]
거기에 추가하는 모든 것이
[06:09]
컨텍스트로도 추가됩니다. 만약 당신이
[06:11]
환각을 경험한 적이 있다면,
[06:12]
때때로 그것들은 컨텍스트 슬롭 때문에
[06:14]
발생합니다. 이는 본질적으로 너무 많은 컨텍스트,
[06:16]
너무 많은 일이 일어나는 것입니다. 좋은 컨텍스트와
[06:18]
나쁜 컨텍스트를 구별하는 방법을
[06:20]
모르게 됩니다. 이것은 AI를 혼란스럽게 하거나
[06:22]
당신이 잘못된 말을 하거나 AI가
[06:25]
잘못된 가정을 했을 수 있습니다.
[06:26]
대화의 매 턴마다 모든 컨텍스트가
[06:28]
다시 추가됩니다. 그래서 본질적으로 우리는
[06:30]
이것을 복합시키고 있고 그것이
[06:31]
채팅을 오염시킬 수 있습니다. 그리고
[06:33]
본질적으로 모든 과거 채팅이
[06:35]
잠재적인 컨텍스트가 되면, 상황이 복잡해질 수 있어요.
[06:38]
그래서 제가 여기서 말하고자 하는 바는
[06:40]
메모리는 훌륭하지만, 그것을 제어할 수 있어야 한다는 것입니다
[06:43]
제어할 수 있어야 한다는 점이죠. 자신만의
[06:44]
기억을 관리할 수 있다면 정말 좋지 않을까요?
[06:45]
모든 걸 잊고 일론 머스크가
[06:47]
테슬라를 설립했다고 정말로 믿을 수 있다면 말이죠.
[06:49]
안타깝게도 이런 기억들은
[06:51]
우리 뇌에 하드코딩되어 있습니다.
[06:53]
하지만 AI에게는
[06:54]
그럴 필요가 없죠. AI가 기억을 갖는 것은
[06:57]
매우 유익할 수 있지만, 과거의 맥락이
[06:59]
우리 대화를 오염시키는 건 원하지 않습니다.
[07:01]
특히 AI를 사용해서
[07:03]
중요한 결정을 내리거나
[07:05]
업무에 활용할 때는 더욱 그렇습니다.
[07:06]
그래서 다시 MCP로 구현한
[07:08]
메모리 방식으로 돌아가는 거죠.
[07:09]
여기서는 조금 더 많은 제어권을 갖습니다.
[07:11]
기억을 편집할 수 있고, 매번
[07:13]
설정으로 돌아갈 필요 없이
[07:14]
클릭 한 번으로 켜고 끌 수 있습니다.
[07:16]
그리고 가까운 미래에는
[07:18]
이를 우리가 사용하는 모든 다양한 LLM들,
[07:20]
일상적으로 사용하는 모든 다양한 AI들에
[07:21]
연결할 수 있을 것입니다.
[07:23]
우리가 제어하고 플러그 앤 플레이할 수 있는
[07:25]
통합 메모리 말이죠. 그리고
[07:27]
그게 핵심이라고 생각합니다. 메모리에 대한
[07:28]
제 생각은 그렇습니다. 전반적으로
[07:30]
정말 기대됩니다. 이건 엄청난 진전이라고
[07:31]
생각하거든요. 다만 가까운 미래에
[07:33]
Anthropic에서 메모리를 켜고 끄는 방법에 대해
[07:35]
더 세밀한 제어 기능을 추가해서
[07:37]
설정에서 완전히 끄는 것뿐만 아니라
[07:38]
더 많은 옵션을 제공했으면 합니다.
[07:40]
더 나아가 우리 AI 플랫폼들 간에
[07:43]
기억을 공유할 수 있게 되기를 바랍니다.
[07:46]
최선의 시나리오는 ChatGPT, Gemini, 심지어 Claude까지도
[07:49]
로컬로 호스팅되는 MCP 서버를
[07:51]
모바일에서도 지원해서
[07:52]
메모리에 대한 더 많은 제어권과
[07:54]
이식성을 갖게 되는 것입니다.
[07:55]
여러분이 이 영상에서 통찰을 얻거나
[07:57]
무언가를 배웠기를 바랍니다.
[07:58]
피드백이 있으시면 아래 댓글로 남겨주세요. 시청해주셔서 감사하고 좋은 하루 되세요.