[00:00]
[음악]
[00:03]
[박수]
[00:05]
안녕하세요, 오늘도 새로운 영상으로 찾아왔습니다. 매일
[00:09]
제 댓글창에서 Kimi K
[00:11]
1.5라는 새로운 모델을 테스트해달라는
[00:14]
요청을 받았는데, 오늘은 그걸 해보려고 합니다.
[00:17]
자, Kimi K
[00:21]
1.5가 무엇이냐면, 이것은 모델인데
[00:25]
오픈소스는 아니지만
[00:27]
기술 보고서와 관련 자료를 공개했고
[00:30]
그들의 사이트에서 무료로
[00:32]
속도 제한 없이 사용할 수 있습니다.
[00:35]
실제로 출시된 시기는
[00:37]
R1과
[00:38]
같은 날이었습니다. K 1.5는 O1 수준의
[00:43]
멀티모달 모델이라고 합니다. 즉, 첫째로
[00:47]
이것이 멀티모달 모델이라는 점에서
[00:50]
R1보다 우수한데, R1은
[00:52]
이미지 등을 처리할 수 없기 때문입니다.
[00:55]
짧은 체인 오브 소트 성능에서는
[00:58]
GPT 4.0과 Claude를 능가하며
[01:01]
AIM Math 500과 Live Code Bench에서 큰 차이로 앞섭니다.
[01:06]
또한 긴 체인 오브 소트 성능도 있어
[01:09]
O1과 대등한 수준의
[01:11]
성능을 보여주며, 수학, 비전,
[01:14]
AMI, 코드포스 등 여러 분야에서
[01:17]
우수한 성능을 보입니다.
[01:20]
이는 추론 모델이며
[01:24]
R1처럼 강화학습으로 훈련되었고
[01:26]
여기 벤치마크를 보시면
[01:29]
O1보다는 작은 차이로
[01:31]
앞서고 있으며, Claude도 능가하는 것을
[01:35]
확인할 수 있어 매우 고무적입니다.
[01:38]
훈련 과정에서는
[01:39]
긴 컨텍스트 스케일링을 사용했는데
[01:42]
이는 기본적으로 강화학습 과정에서
[01:46]
컨텍스트 제한을
[01:48]
128k까지 늘린 것을 의미하며, 이는 더 나은 훈련 결과로
[01:52]
이어졌습니다. 또한 개선된
[01:56]
정책 최적화를 통해
[01:58]
긴 체인 오브 소트와
[02:00]
강화학습을 결합하고
[02:02]
온라인 미러 디센트의 변형을 사용하여
[02:05]
강력한 정책 최적화를 실현했습니다.
[02:08]
또한 멀티모달 모델로서
[02:11]
텍스트와 비전 데이터에 대해
[02:13]
공동 훈련되어 두 가지 양식에 대해
[02:16]
통합적인 추론이 가능합니다.
[02:19]
이 모델은 오픈소스가 아니지만
[02:22]
그들의 플랫폼에서 시도해볼 수 있고
[02:25]
속도 제한 없이 무료입니다.
[02:27]
플랫폼에는 두 가지 모델이 있는데
[02:29]
하나는 체인 오브 소트가 없는
[02:32]
기본 Kimi 모델이고
[02:35]
다른 하나는
[02:37]
롱 싱킹 모드입니다.
[02:40]
이는 모델이 깊이 있게
[02:42]
생각하도록 만드는 모드입니다. 오늘은 롱 싱크
[02:46]
모드를 테스트해보겠습니다.
[02:48]
여기 13개의 테스트 질문이 있습니다.
[02:51]
첫 번째 질문은
[02:54]
'이름이 -lia로 끝나는 나라 이름과
[02:56]
그 나라의 수도를 말해보세요'
[02:59]
입니다.
[03:01]
자,
[03:02]
정답은 'Australia와 Canberra'
[03:05]
같은 것이 되어야 합니다. 한번 보내볼까요?
[03:08]
자, 여기 답변이 왔고 정답입니다.
[03:12]
이것을 통과로 표시하겠습니다.
[03:16]
다음 질문은 '키가 큰 식물을
[03:19]
설명하는 단어와 운이 맞는
[03:21]
숫자는 무엇인가요?' 정답은
[03:23]
'three'가 되어야 합니다. 보내볼까요?
[03:28]
자, 여기 답변이 왔고 완벽히 정답입니다.
[03:31]
이것도 통과입니다. 다음 문제는
[03:35]
'각 단어의 두 번째 글자를 모으면
[03:37]
'simple'이 되는 하이쿠를 작성하세요'입니다.
[03:40]
보내볼까요? 자, 여기 답변이 왔고
[03:44]
이것도 정답입니다.
[03:47]
통과입니다. 다음 문제로 넘어가겠습니다.
[03:51]
'name'이라는 단어가 라틴어 어원의 영어 형용사인데,
[03:54]
같은 글자로 시작하고 끝나며,
[03:56]
총 11개의 글자로 이루어져 있고
[03:59]
모든 모음이 알파벳 순으로
[04:01]
배열되어 있다면?
[04:02]
답은 아마도
[04:04]
이런 것일 수 있겠죠.
[04:06]
'transparent'입니다. 확인해 볼까요?
[04:10]
여기 답이 나왔네요. 이것도
[04:13]
정답입니다. 통과로 표시하겠습니다.
[04:17]
다음 문제입니다. Courtney가 48명이라고 했는데
[04:19]
Kelly는 Courtney가 말한 숫자가
[04:22]
20% 과대 계상되었다고 했습니다.
[04:25]
Kelly가 맞다면 실제 인원은
[04:28]
몇 명일까요?
[04:30]
답은 40명이어야 합니다. 확인해볼까요?
[04:33]
여기 답이 나왔고 정답입니다.
[04:36]
통과로 표시하겠습니다. 다음은
[04:39]
사과 2개가 있는데 2개를 더 삽니다.
[04:43]
그리고 사과 2개로 파이를 만들었어요.
[04:47]
파이의 절반을 먹은 후에
[04:49]
남은 사과는 몇 개일까요? 답은
[04:51]
2개여야 합니다. 확인해보죠.
[04:55]
여기 답이 나왔고 정답입니다.
[04:59]
통과입니다.
[05:00]
이제 다음 문제입니다. Sally는 여자아이입니다.
[05:04]
그녀에게는 3명의 형제가 있고,
[05:07]
각 형제는 같은 2명의 자매가 있습니다.
[05:09]
Sally에게는 몇 명의 자매가 있을까요?
[05:12]
답은 1명이어야 합니다. 확인해볼까요?
[05:16]
여기 답이 나왔고
[05:19]
정답입니다. 이것도 통과로
[05:22]
표시하겠습니다. 다음은 정육각형의
[05:25]
짧은 대각선이 64라면
[05:28]
긴 대각선의 길이는 얼마일까요? 답은
[05:31]
73.9입니다.
[05:32]
확인해보죠. 여기
[05:36]
답이 나왔고 이것도 정답입니다.
[05:40]
적절히 표시하겠습니다. 이제
[05:42]
다음 문제입니다. 클릭하면 색종이가
[05:46]
터지는 버튼이 있는 HTML 페이지를
[05:48]
만들어보세요. CSS와 JS도 사용 가능합니다.
[05:52]
확인해보죠. 여기 코드가 있고
[05:55]
실행해보면 잘 작동하네요.
[05:58]
통과입니다.
[06:00]
다음 문제는 HTML, CSS, JS를 사용해서
[06:02]
연주 가능한 신디사이저 키보드를 만드는 것입니다.
[06:07]
확인해보죠. 여기 답이 나왔고
[06:10]
실행해보면 이건
[06:12]
작동하지 않네요. 실패입니다. 다음
[06:16]
문제는 나비 모양의 SVG 코드를
[06:19]
생성하는 것입니다. 확인해볼까요?
[06:23]
여기 답이 나왔고 미리보기를 하면
[06:26]
보기 좋지 않네요. 그래서
[06:29]
실패로 표시하겠습니다. 다음은 HTML, CSS,
[06:32]
JS를 사용해서 3D 원을 만들어
[06:34]
3D 공간에서 끊임없이 움직이도록 하는 것입니다.
[06:39]
확인해보죠. 여기 답이 나왔고
[06:43]
잘 작동하네요. 이건
[06:47]
통과로 하겠습니다. 이제
[06:49]
마지막 문제는 터미널에서 작동하는
[06:52]
라이프 게임을 파이썬으로 작성하는 것입니다.
[06:55]
확인해보죠. 여기 코드가 나왔습니다.
[06:59]
복사해서 실행해보면 잘 작동하네요.
[07:03]
통과로 하겠습니다. 이제 이것이
[07:07]
최종 차트입니다. 꽤 좋았지만
[07:10]
코딩은 DeepSeek R1과 달리
[07:13]
강점이 아닙니다. R1은 코딩에
[07:16]
정말 뛰어나거든요. 하지만
[07:18]
일반적인 질문에는 여전히 좋습니다.
[07:21]
다만 토큰을 반복하는 경향이 있죠.
[07:24]
가장 어려운 두 문제는
[07:27]
3-4번의 생성이 필요했고
[07:30]
한 경우에는 오류 없이 정답을 냈습니다.
[07:33]
좋지만 DeepSeek R1보다
[07:36]
나은 점은
[07:36]
없습니다. R1이 여전히 더 낫고
[07:40]
가중치도 공개되어 있어서 더 좋습니다.
[07:44]
원한다면 사용해도 좋지만
[07:47]
모델이 오픈소스였으면 했는데
[07:49]
그렇지 않고 현재는 API도
[07:53]
사용할 수 없다는 게 아쉽습니다.
[07:56]
좋은 모델이지만 새로운 것이
[07:59]
없어서 사용 목적을
[08:01]
찾기 어렵고, 현재로서는
[08:03]
사용하기 어려운 상태입니다.
[08:06]
연구 논문은 꽤 좋고
[08:09]
인상적인 요소들이 있어서
[08:12]
그건 좋았습니다. 전반적으로
[08:15]
꽤 괜찮습니다. 여러분의 생각을
[08:18]
댓글로 남겨주시고 구독해주세요.
[08:20]
수퍼 땡스로 후원도 가능하고
[08:23]
채널 멤버가 되어 특전을 받을 수도 있습니다.
[08:24]
다음 영상에서 만나요. 안녕히 계세요.
[08:28]
[음악]