오픈 웨이트 코드 최강자, GLM 4.5

채널 아이콘
GosuCoder 구독자 9,180명

요약

GLM 4.5를 하루 종일 실제 생산 코드에만 적용하며 시험해 본 결과, 속도·지연 시간·비용 면에서 균형 잡힌 성능을 확인했다. 131K 토큰 컨텍스트 윈도우 제약으로 작은 단위 작업에 최적화해야 하지만, UI 애니메이션·얼굴 필터·드론 시뮬레이션 등 다양한 예시에서 탁월함을 보여주었다. VS Code 플러그인 설정(중간 추론, 프롬프트 압축)으로 효율을 극대화했고, eval 점수도 기본 19,100에서 23,670으로 개선되었다. 앞으로도 가벼운 UI·디자인 업무에 유용하게 사용할 계획이며, 설정 공유 문화가 확산되길 기대한다.

주요 키워드

GLM4.5 컨텍스트 윈도우 프롬프트 압축 Medium Reasoning eval 점수 토큰 Root Code VS Code 플러그인 UI 애니메이션 실시간 필터

하이라이트

  • 🔑 GLM 4.5는 131K 토큰 컨텍스트 윈도우로 큰 파일·리팩토링보단 작은 코드 작업에 적합하다.
  • ⚡️ 하루에 약 31.3M 토큰(약 $19)을 사용했지만, 개별 채팅 쓰레드를 작게 유지하면 20센트 미만으로 운영 가능하다.
  • 🌟 VS Code의 프롬프트 압축 기능 덕분에 최대 4~5개의 메시지 이상도 컨텍스트 초과 없이 이어갈 수 있었다.
  • 🚀 21개 커밋·27개 파일·830라인 추가 등의 생산 커밋을 GLM 4.5로 손쉽게 요약·수정·버그 픽스했다.
  • 📌 tetraminos 로딩 애니메이션, 실시간 얼굴 필터, 3D 드론 시뮬레이션 등 UI·디자인 작업에서 뛰어난 성능을 발휘했다.
  • 🔧 기본 설정 eval 점수 19,100에서 모델 설정(temperature·top-p 최적화) 후 23,670으로 향상되어 경험치가 올랐다.
  • 💡 모델 설정을 JSON으로 공유하면 다양한 프로바이더 간 최적 성능 달성이 더 쉬워질 것이다.

용어 설명

오픈 웨이트 모델(OpenWeight Model)

제한 없이 공개된 사전 학습 모델로 누구나 자유롭게 활용할 수 있는 AI 모델

컨텍스트 윈도우(Context Window)

모델이 한 번에 처리할 수 있는 최대 토큰(문자·단어) 수로, 크기가 작을수록 긴 대화 처리에 제약이 생긴다

중간 추론(Medium Reasoning)

추론 난이도를 높여 더 깊이 있는 응답을 도출하는 설정으로, 속도와 정밀도의 균형을 맞춘 옵션

프롬프트 압축(Prompt Compression)

과거 메시지를 요약해 컨텍스트 사용량을 줄이는 기능으로, VS Code 플러그인에서 지원한다

토큰(Token)

모델이 입력·출력을 처리할 때 사용하는 최소 단위로, 비용 산정의 기준이 된다

Root Code

VS Code 기반 AI 코딩 보조 플러그인으로, 다양한 모델 설정을 JSON 파일로 관리할 수 있다

[00:00:00] GLM 4.5 실험 동기와 순위

스피커가 Open Router에서 상위 랜크된 오픈 웨이트 모델을 찬양하며, GLM 4.5가 9위에 오른 것을 확인하고 오늘 하루 종일 이 모델만 사용하기로 결심한다.

오픈웨이트 모델들이 오픈 라우터 프로그래밍 부문에서 상위 10위 안에 진입한 것을 축하하며, 특히 Qwen3 Coder가 2위를 차지한 성과를 언급합니다.
화자가 Qwen3 Coder를 매우 좋아하지만, 그 때문에 GLM4.5를 간과했다고 인정하며, GLM4.5도 9위를 차지한 우수한 모델임을 설명합니다.
오늘 하루 종일 GLM4.5만을 사용해서 프로덕션 코드베이스 작업을 했으며, 매우 만족스러운 경험을 했다고 평가합니다.
[00:00:49] 설정 및 초기 사용법

Medium Reasoning(0.6→0.95) 설정과 Z.ai 프로바이더 선택 방법을 공유하고, Discord 추천 설정 감사 인사를 전한다. 동시에 131K 토큰 컨텍스트 윈도우 제약에 대한 주의와 대처 방안을 설명한다.

미디엄 추론과 0.6 구성으로 Z.AI 프로바이더를 사용했으며, 디스코드 커뮤니티 멤버가 권장한 0.6-0.95 구성 정보에 감사를 표합니다.
GLM4.5의 가장 큰 문제점인 131,000 토큰의 제한적인 컨텍스트 윈도우를 지적하며, 이로 인해 작업 규모가 제한되고 큰 파일이나 리팩토링 작업이 어렵다고 설명합니다.
속도, 지연시간, 가격은 만족스럽지만 컨텍스트 윈도우 제약으로 인해 대규모 작업에는 적합하지 않으며, Root Code에서 이를 해결하기 위한 설정을 사용했다고 언급합니다.
[00:02:23] 생산 코드에 적용한 작업 통계

오늘 21개 커밋, 27개 파일 변경, 830라인 추가·63라인 삭제를 수행했다. AI로 요약한 작업 목록에는 스트리밍 버그 픽스, UI 수정, 이메일 에디터 개선 등이 포함된다.

오늘의 작업 통계를 공유하며, 21번의 커밋, 27개 파일 변경, 830줄 추가, 63줄 삭제로 순증 227줄의 성과를 달성했고, 모든 변경사항을 AI가 요약해주었다고 설명합니다.
스트리밍 시스템 버그와 UI 수정 등 다양한 작업들을 GLM4.5로 처리했으며, 도구 오류는 최소한이었지만 비용이 예상보다 높았다고 설명합니다.
하루에 3천만 토큰을 사용해 약 19달러의 비용이 발생했으며, 한 달 기준으로 계산하면 상당히 비싼 비용이라고 평가합니다.
[00:03:35] 비용 및 효율 분석

총 31.3M 토큰을 소모해 약 $19를 지불했으며, 일일·월간 기준으로 보면 비용 부담이 크다. Cloud Code 대비 비용·성능의 트레이드오프를 언급한다.

Claude Code와 비교했을 때 비용 대비 성능을 분석하며, 채팅을 짧게 유지하면 개별 스레드당 1달러 이하로 사용 가능하다고 조언합니다.
GLM4.5의 뛰어난 행간 읽기 능력을 소개하며, 불분명한 티켓을 정확히 이해하고 완벽한 결과물을 만들어낸 사례를 공유합니다.
미디엄 추론 모드를 사용했으며 다양한 AI 코딩 도구들과 비교 테스트를 진행했다고 설명하면서, Open Router 차트 결과를 언급합니다.
GLM 4.5 모델을 다양한 AI 코딩 도구에서 테스트했지만, 클라이언트에서 컨텍스트 처리에 문제가 있어 자주 작동을 멈춘다고 설명합니다.
[00:05:50] 실제 개발 예시

tetraminos 로딩 애니메이션, 실시간 얼굴 필터, 3D 자율 드론 시뮬레이션, 검색 토글 UI, AI 생성 이메일 컴포넌트 등 다양한 프론트엔드·디자인 작업을 GLM 4.5로 빠르게 구현한 사례를 시연한다.

오픈 라우터에서는 98.3K 컨텍스트만 지원되었고, 가장 낮은 컨텍스트를 제공하는 프로바이더가 선택되어 이상적이지 않았다고 언급합니다.
VS Code에서는 설정이 필요하지만 잘 작동하며, 클라이언트에서는 그런 설정을 할 수 없어 문제라고 설명합니다.
X에 포스트를 올려 AI 도구들의 설정 표준화 필요성을 제기했으며, JSON 파일로 모델 설정을 공유할 수 있으면 좋겠다고 제안합니다.
VS Code의 '프롬프트 압축' 설정이 유일한 해결책이었으며, 이 기능 없이는 4-5개 메시지 후 컨텍스트가 최대치에 도달한다고 설명합니다.
압축 기능으로 3달러짜리 긴 채팅도 가능했지만, 약간의 속도 저하와 지연이 있었으며, 코드를 더 자세히 분석해보고 싶다고 언급합니다.
GLM 4.5는 특히 프론트엔드 애니메이션 작업에 뛰어나며, 오늘 작업한 앱의 몇 가지 기능을 보여주겠다고 마무리합니다.
AI가 생성한 이메일 기능의 테트로미노 애니메이션을 시연하며, 이전 버전보다 훨씬 개선된 UI 요소를 보여준다.
실시간 얼굴 필터 앱을 시연하며 파티 마스크, 무지개, 왕관, 동물 귀 등 다양한 필터들을 AI가 직접 생성했음을 설명한다.
3D 자율 드론 시뮬레이션을 시연하며, 센서 범위와 속도 조절을 통해 장애물 회피 기능을 테스트한다.
[00:09:53] 성능 평가 및 설정 최적화

기본 설정으로 eval 19,100점이었으나, 모델 설정 최적화 후 23,670점으로 상향되었다. 반면 일부 클라이언트 도구에서 낮은 컨텍스트 윈도우를 선택해 도구 실패가 발생함을 지적한다.

RAI로 생성한 이메일과 타이핑 시 나타나는 페이드 효과, 그리고 UI 정리를 위한 검색 기능 토글을 보여준다.
화자가 UI 전문가가 아니라고 솔직하게 인정하면서, 작은 회사에서 프론트엔드 개발을 많이 해야 하는 상황을 설명합니다. GLM45가 이런 UI 작업에서 놀라운 성과를 보여줬다고 평가합니다.
제품의 핵심 부분을 설명하며, AI 생성 이메일을 만드는 컴포넌트 시스템과 설정을 위쪽으로 옮겨서 활성화/비활성화할 수 있도록 개선한 과정을 소개합니다.
지금까지의 작업들이 상대적으로 간단한 것들이었다고 설명하며, 웹 커널 같은 복잡한 작업은 없었고 최대 3개 파일 정도의 작업이었다고 언급합니다. 테트로미노 로딩 애니메이션에 대한 만족감을 표현합니다.
GLM45 모델의 성능 평가 결과를 공유합니다. 기본 설정에서는 19,100점으로 좋지 않았지만, 설정을 적용하면 23,670점으로 향상되어 작은 작업에서는 즐길 만한 수준이 되었다고 평가합니다.
이전 차트와 비교하여 모델의 위치를 설명하며, 퀸트리 코더와 IDE 에이더 사이에 위치한다고 말합니다. 클로드 소닉 4 수준은 아니지만 좋은 모델이라고 평가합니다.
[00:12:30] 결론 및 향후 전망

작고 가벼운 UI 작업에 최적이며, 향후에도 재사용 의사가 분명하다. 설정을 JSON으로 공유하는 문화를 제안하고, GLM 4.5 Air·비전 모델 테스트 계획을 언급하며 마무리한다.

중간 수준 추론은 잘 작동했지만 높은 수준 추론은 많이 테스트하지 못했다고 설명합니다. 작은 작업에서는 정말 저렴하게 사용할 수 있지만 체인이 길어지면 비용이 증가한다고 경고합니다.
R 코드의 압축된 프롬프트 메시지 설정이 프롬프트 캐싱을 방해한다고 분석하며, 긴 작업에서는 오히려 더 많은 비용을 지불하게 될 수 있다는 양날의 검 같은 특성을 지적합니다.
GLM-4.5 모델의 프롬프트 캐싱과 비용 효율성에 대해 설명하며, 131K 컨텍스트 범위 내에서 작은 작업을 처리할 때의 경제적 장점을 언급합니다.
GLM-4.5 모델에 대한 전반적인 만족도를 표현하며, 특히 UI 디자인 작업에서의 재사용 가능성을 100% 확신한다고 밝힙니다.
디자인 전문 모델들의 가치를 강조하며, GPT-4o, GLM-4.5, Sonnet 등을 활용해 UI 디자인 아이디어를 얻고 구현하는 방법을 설명합니다.
시청자들에게 GLM-4.5 사용 경험과 의견을 공유해달라고 요청하며, UI 작업이나 가벼운 작업에서 모델 시도를 권장합니다.
OpenRouter에서의 GLM-4.5 사용량을 근거로 모델의 인기도를 설명하고, GLM-4.5 Air 모델과 새로 출시된 비전 모델에 대한 관심을 표현합니다.
잠시 시간을 내서
정말 대단한 일이 일어나고 있다는 걸
인정해야 합니다. 오픈웨이트 모델들이 오픈 라우터에서
프로그래밍 부문 최다 사용 상위 10위 안에
들어가 있다는 것 말이에요. 8월 11일 기준으로
Qwen3 Coder가 2위를 차지했습니다.
정말 훌륭한 모델이에요. 제가
이 모델에 대해 항상 극찬해왔거든요.
저를 조금이라도 팔로우하신다면
제가 얼마나 이 모델을 좋아하는지 아실 겁니다.
하지만 이 모델을 너무 좋아한 나머지
GLM4.5를 조금 무시해왔는데,
이것도 상당히 괜찮게 상위 10위 안에
들어가 있습니다. 특히 이 리더보드 구성을
보시면 9위를 차지하고 있고,
클릭해보면 실제로 GLM4.5를
사용하는 앱들이 많이 있습니다.
킬로 코드가 여전히 1위이고, 루트 코드,
클라이언트, 오픈 코드 등이 있죠.
오늘 저는 제 프로덕션 코드베이스에서
하는 모든 작업에 GLM4.5만 사용해보기로 했습니다.
결과적으로 정말 훌륭한 하루를 보냈어요.
새로운 모델을 처음 사용하고 싶을 때는
충분히 많이 써보는 편입니다.
만약 다른 모델로 갈아타고 싶은
충동을 느끼거나 너무 느려서
또는 도구 호출 실패가 발생해서
좌절하지 않는다면 매우 만족한다는 뜻이죠.
GLM4.5는 오늘 제가 한 작업에서
정말 훌륭했습니다. 제가 실제로
앱에서 구축한 몇 가지를 보여드리겠습니다.
하루 종일 미디엄 추론을 사용했습니다.
구성 0.6 프로바이더 Z.AI를
직접 선택했습니다. 실제로
권장 구성이 0.6에서 0.95라는 걸
발견했는데, 사실 제가 발견한 게 아니라
디스코드에서 누군가가 보내준 겁니다.
보내주신 분께 감사드리고 싶어요.
이 모델의 열렬한 팬이시더라고요.
저를 밀어붙여서 오늘 하루 종일
실제로 사용해보게 해주셨어요.
정말 감사합니다. 하지만 몇 가지
문제점이 있습니다. 가장 눈에 띄는 건
여기 레이저 포인터로 가리키면, 바로 이
컨텍스트 윈도우입니다. 131,000은
코딩 관련 작업에는 정말 매우
빡빡합니다. 그래서 작업을 정말
작게 유지해야 하고, 여러 파일에
걸쳐서 하면 안 되죠. 큰 파일도 안 되고,
큰 리팩토링도 안 됩니다.
하지만 속도는 좋고 지연시간도
꽤 괜찮고 가격도 매우 매우
합리적입니다. 하지만 이 컨텍스트
윈도우 때문에 이 모델이 제가
즐겨 사용함에도 불구하고, 정말로
사용하는 걸 즐김에도 불구하고,
더 큰 범위의 작업에는 사용할 수 없게
만드는 것 같아요. 오늘 이 문제를
해결하기 위해 루트 코드에서 설정한
몇 가지 설정에 대해 말씀드리겠지만,
이걸 염두에 두는 게 중요하다고 생각해요.
여기 몇 가지 통계가 있습니다. 오늘
21번 커밋했고, 27개 파일을 변경했으며,
새 파일은 하나였습니다. 주로
기존 코드 작업을 했죠. 830줄을
추가하고 63줄을 삭제해서
순증 227줄이었습니다. 앞으로
작업할 새로운 것들을 많이
테스트해봤는데, 모두 GLM4.5로 했습니다.
하지만 이것들은 제가 실제로
개발 브랜치에 한 프로덕션 커밋들이에요.
사실 아직 프로덕션에 들어가지는 않았고,
현재 개발 단계에 있습니다.
제 모든 변경사항을 AI가 요약해줬어요.
이런 식으로 보시면 이것들은
텍스트 스트리밍 시스템에 버그가 있었어요.
그래서 그 작업을 했습니다.
UI 관련해서 몇 가지 작은 수정들이 있었고요.
더 큰 작업이 또 하나 있었어요.
이메일 에디터 개선 작업이었는데,
일반적으로는 작은 버그 수정들이었어요.
UI 작업이 많았고, 백엔드 쪽 작업도 조금 있었는데,
정말 잘 처리해냈어요.
사실, 본격적으로 들어가기 전에
전반적인 생각을 좀 더 말씀드릴게요.
정말 사용하기 편했어요.
도구 오류는 정말 미미했고요.
하루 종일 세 번 정도만 있었지만,
예상보다 비쌌어요.
그래서, 전체적으로
얼마나 썼는지 보여드릴게요.
결국 3천130만 토큰을 사용했어요.
이건 여러 날에 걸쳐서 사용한 거고요.
어느 시점에서는
오늘 하루에만 1천30만 토큰 정도였고
이전에는 30만 토큰 정도였어요.
그러니까 오늘 이 모델로
3천만 토큰 정도 사용한 것 같아요.
정말 많은 토큰이고,
예상보다 훨씬 많았어요.
약 19달러를 썼습니다.
시간대 문제가 좀 있는데
이 2달러 93센트는
시간대가 바뀔 때 생긴 거예요.
계속 작업하고 있었는데,
원래는 다 합쳐져 있었어요.
어쨌든, 꽤 비싸죠?
코딩 작업에 하루에 18-19달러씩 쓴다면
한 달에 30일 한다고 치고
아니, 20-25일 정도만 해도
꽤 비싸져요.
염두에 둘 점이고
Claude Code 같은 게
얼마나 가성비 좋은지 보여주네요.
이건 비용은 훨씬 적고
컨텍스트 윈도우도 낮은데도
더 많은 돈을 쓰고 있어요.
Claude Code만 썼다면 쓸 돈보다
말이에요. 하지만 동시에 좋은 모델이에요.
정말 좋은 모델입니다.
채팅을 정말 짧게 유지할 수 있다면요.
재압축되지 않게 하고
체인을 너무 길게 이어가지 않으면
개별 채팅 스레드를
1달러 이하로 유지할 수 있어요.
하지만 보시다시피 21개 커밋을 했고
오늘 정말 많은 코딩을 했어요.
실제로 몇 가지
지금 생각해보고 있는 건은
행간을 얼마나 잘 읽는지예요.
사실 어떤 티켓을 받았는데
잘 작성되지 않은 티켓이었어요.
솔직히 제 생각엔
뭘 원하는지 잘 모르겠더라고요.
그냥 GLM4.5에게 줬는데
제가 원하는 걸 알아냈어요.
그리고 PM, 프로덕트 담당자에게 물어보니
"완벽해"라고 하더라고요.
인간의 언어를
실제 구축해야 할 것으로
정말 잘 번역했어요.
미디엄 추론 모드를 사용했는데,
이전에는
일부 평가에서 낮은 추론을 사용했던 것 같아요.
미디엄 추론으로 올렸는데
정말 잘했어요.
다른 AI 코딩 도구들에서도
시도해봤고요. Open Router 차트를 보면
사용 가능하다고 나와 있어요.
클라이언트에서 사용 가능하다고 되어 있어요. 하지만
이게 문제라고 생각해요. 여기 클라이언트 예시가 있는데
결국 클라이언트가
그냥 작동을 멈춰버려요. 이런 일이
저한테 많이 일어났어요.
컨텍스트 처리를 정말 못해요. 실제로
컨텍스트가 98.3K로만 들어왔는데
프로바이더 중 하나에서, 제가
실제로는 선택할 수 없었어요.
가장 적은 컨텍스트를 가진 프로바이더를 선택했거든요.
그래서 전혀 이상적이지 않았어요.
이걸 조금 옮겨서 읽기 쉽게 만들어볼게요.
오픈 코드에서는 사용 가능해요.
실제로 테스트해봤는데 잘 작동해요.
하지만 여전히 설정이 필요해요.
앞서 말했듯이
오픈 코드.json 파일에서 말이죠.
클라이언트에서는 그걸 할 수 없어요.
다른 것들도 어떻게 하는지
정확히 모르겠어요.
오늘 X에 포스트를 올렸는데
이런 설정들을
표준화해야 한다는 내용이었어요.
많은 사람들이 이런 것들이
무엇인지 모른다는 걸 알지만
제 설정이 담긴 JSON 파일을 떨어뜨려서
제가 이미 시간을 들여
파악한 내용을
모든 사람과 공유할 수 있거나
다른 사람에게서 가져올 수 있다면
정말 좋을 것 같아요. 왜냐하면
저보다 더 나은 설정을 가진
사람들이 정말 많거든요.
이런 모델 설정들을 공유할 수 있으면 좋겠어요.
온도, top P, top K 같은
모든 걸 우리 모두가 공유해서
실제로 어떤 프로바이더를 사용하든
최고의 성능을 낼 수 있도록 말이죠.
VS Code에는 여기 설정이 있어요.
프롬프트 압축하고 메시지를
컨텍스트 크기에 맞게 변경한다고 되어 있어요.
이게 오늘 제가 실제로 사용할 수 있었던
유일한 방법이었어요. 이걸 체크 해제하면
4-5개 메시지 후에
컨텍스트가 최대치에 도달해요. 이게 핵심이었어요.
하지만 문제는 이 특정
체크박스를 사용함으로써 무엇을 잃고 있는지
모른다는 거예요. 하지만 90% 정도는 잘 작동했어요.
실제로 어떤 채팅은
3달러까지 올라갔는데도 잘 작동했고
컨텍스트 윈도우가 압축되고 있다는 걸
알 수 있었어요. 제 생각에는
속도를 조금 늦추고
지연을 추가하는 것 같아요.
언제 그런 일이 일어나는지 느낄 수 있거든요.
실제로 코드를 파보고
좀 더 이해해보고 싶어요.
하지만 루트 코드를 사용한다면
이걸 사용하세요. 그리고 이게
제가 걱정했던 다른 이유 중 하나이기도 하고
클라이언트가 제 생각만큼
잘 작동하지 않았던 이유예요.
컨텍스트가 부족해지면 그냥 멈춰버렸어요.
실제로 압축과 함께
잘 작동하지 않는 것 같았어요.
여기 제 다른 설정들도
확인해볼 수 있어요.
특히 애니메이션 같은 프론트엔드에서 정말 좋아요.
제 앱으로 넘어가볼게요.
오늘 작업한 몇 가지가 있어요.
이 빈 상태는 아주 사소한 것들이에요.
별로 많지 않지만, 뭔가 보여드릴게요.
뭔가를요.
이 AI에게 이메일 생성을 요청하면
이 멋진 작은 애니메이션을 봐요.
이 테트로미노들이 보이시나요?
실제로 AI가 제작해준 건데
이전의 생각하기 애니메이션보다
훨씬 더 좋아 보여요.
그런데 원래는 이렇게 보이지 않아요.
확장 프로그램으로
다크 모드를 활성화했거든요.
제 제품이 정확히 이렇게 보이는 건 아니지만
눈부시게 하고 싶지 않아서
이렇게 설정해놨어요.
그래도 테트로미노는
여전히 볼 수 있죠. 정말 놀라운 작업을 해냈어요.
오늘 만든 다른 것들도
보여드릴게요.
이건 실시간 얼굴 필터 앱이에요.
여러 모델들을 테스트할 때
자주 사용하는 걸요.
에셋 생성을 요청했는데
기본적으로 카메라가 필요해서
녹화 중이라 OBS에서
카메라를 꺼뒀거든요.
크롬에서 카메라를 켜볼게요.
기본적으로 파티 마스크를 쓸 수 있고
코 위에 무지개를 올릴 수도 있고
왕관을 쓰거나 강아지 코를 달거나
고양이 귀를 달거나 콧수염을 달 수 있어요.
이 모든 걸 AI가 직접 그렸어요.
멋진 안경들도 있고
서로 겹치는 것도 있거나 없을 수도 있고요.
꽤 멋져요.
사진 촬영 기능이 작동하는지
모르겠지만 정말 멋지네요.
이건 정말 정말 빠르게
만들 수 있었던 거예요.
카메라를 꺼볼게요.
지금 제가 우스꽝스럽게 보일 것 같아서요.
그리고 또 만든 게
3D 자율 드론이에요.
이걸 잘 처리하는 모델이 많지 않거든요.
이걸 봤을 때 '오, 진짜 드론이 있네'
했어요.
시뮬레이션 시작을 눌러볼게요.
이거 봐요.
정말 대단하네요.
회피 기능도 변경할 수 있어서
장애물들을 피해가는 방식을
조금씩 바꿀 수 있어요.
센서 범위를 줄여볼게요.
속도도 줄이고
어떻게 되는지 봅시다.
이제 센서 범위가 훨씬 낮아져서
직진으로 가네요.
하지만 전반적으로 정말 훌륭하게 처리했어요.
다른 것도 빨리 보여드릴게요.
참고로 이게 RAI로 생성한 이메일이에요.
꽤 멋져 보이네요.
대부분 플레이스홀더 이미지들이고
그런 것들이에요.
다시 말하지만 원래는 흰색이고
다크 모드로 해놔서
그렇게 좋아 보이지 않아요.
하지만 이 부분을 보세요.
제가 타이핑하면 이렇게
페이드 인/아웃 효과가 나타나죠.
이런 작은 도움말들을 GLM이
오늘 정말 잘 만들어줬어요.
그리고 또 만들어준 멋진 기능 중 하나가
이 검색 기능이에요.
항상 열려있지 않고
위아래로 토글할 수 있어서
UI를 좀 더 깔끔하게 정리할 수 있어요.
하이라이트와 모든 것들이 정말 멋지네요. 솔직히
말씀드리면 저는 UI 전문가가 아니에요.
정말 솔직하게 말씀드릴게요.
전 보통 프론트엔드 개발을
피해왔는데, 지금은
정말 많이 해야 해요. 작은 회사라서
이런 일들을 정말 많이 해야 하거든요. 그런데 GLM45가
이런 종류의 작업에서 정말 놀라운 성과를 보여줬어요.
이제 제 제품의
핵심 부분에 좀 더 들어가보겠습니다.
여기에 와서 보면, 이런
컴포넌트들이 함께 조합되어서
실제로 정말 멋있게 보이는 AI 생성 이메일을
만들어냅니다. 저는
우리가 가지고 있는 설정 중 일부를
옮기고 싶었어요. 그 설정이
해당 컴포넌트가 무엇에 관한 것인지
알려주는 역할을 하는데, 이를 위쪽으로 옮겨서
여기서 활성화/비활성화할 수 있도록 했어요. 첫 번째 시도에서
정말 놀랍고 전반적으로 훌륭한 결과를 보여줬어요.
하지만 앞서 말했듯이, 이 모든 것들은
상대적으로 간단한 작업들이었어요.
웹 커널을 구축하거나
말도 안 되게 복잡하거나 거대한 것 같은
작업은 없었어요. 사실 제가 한 가장 큰
작업도 최대 세 개 파일
정도였어요. 그리고 많은 버그를 수정하고
많은 것들을 바꿔야 했는데
항상 뛰어난 성과를 보여줬어요. 그리고
보시세요, 이 테트로미노들이
정말 멋지지 않나요? 지금까지 본 것 중
가장 멋진 로딩 애니메이션 아닌가요?
어쨌든, 저는 정말 흥미진진해요.
이것이 나온 것에 정말 만족해요.
그리고 이 모델을 설정하기 전에
보여드리고 싶은 것은, 기본 R 코드 설정을
사용했다는 것입니다. 기본적으로
모든 일반적인 설정들, 그냥 기본값으로 한 제 평가 점수는 19,100점인데
사실 이건 좀 좋지 않은 점수예요. 하지만
설정을 적용하면 23,670점을
받는데, 이 정도면 제가 말하는
즐길 만한 범위, 합리적인 범위에
속하기 시작해요, 특히
작은 작업들에서는 더욱 그래요. 그리고
제가 마지막으로 올린 차트와
비교해서 보여드리면, 23,000점대
범위 안에 잘 들어가 있는 것을 볼 수 있어요.
세레브러스를 사용하는 퀸트리 코더와
IDE 에이더 사이에 위치해 있어요.
클로드 소닉 4 수준인가요? 아니에요.
전혀 그 수준은 아니에요. 하지만 좋은 모델이에요.
스타일이 많고, 중간 수준의
추론이 저에게는 정말 잘 작동했어요.
높은 수준의 추론은 많이 테스트해보지 못했는데
만약 테스트해보셨다면
아래 댓글로 어떻게 생각하시는지
알려주시면 정말 좋겠어요. 하지만
정말 작은 작업들을 한다면 정말 정말
저렴하게 사용할 수 있는 모델이에요. 그리고
체인이 너무 길어지지 않도록 해야 해요. 제가
말했듯이, 제 채팅 중 일부는
실제로 몇 달러를 넘어서기도 했는데
이 모델의 전체 가격이 60센트와
2.20달러인 것을 고려하면
정말 놀라운 일이에요. 그리고 실제로
R 코드에 있는 이 설정 때문이라고
생각해요. 이 압축된 프롬프트 메시지가
컨텍스트 크기를 변경해요.
프롬프트 캐싱을 망치고 있다고 생각해요.
왜냐하면 제 캐시 값이 항상
정말 낮거든요. 그래서 이것이
양날의 검이라고 생각해요. 만약
더 긴 작업을 하기 위해
이것을 사용한다면, 프롬프트 캐싱이
제대로 작동하지 않아서 실제로는 더 많은 비용을 지불하게 될 거예요
업니다. 이해가 되시나요? 반면에
만약 제가 뭔가 작은 작업을
131K 컨텍스트 범위 안에서
처리할 수 있다면
괜찮습니다. 20센트 정도면
충분할 것 같네요. 네, 전반적으로
정말 훌륭한 모델입니다. 정말 만족했어요.
오늘 실제로 이 실험을
진행해서 너무 기뻤습니다. 미래에도
이 모델을 다시 사용할 건가요? 100%
다시 사용할 겁니다. 특히 작은 UI
작업에서 멋진 아이디어를 얻기 위해서요.
디자인을 잘하는 모델들이 있어서
정말 좋습니다. GPT-4o를 사용해서
실제로 UI를 만들 수도 있고
GLM-4.5도 사용할 수 있고, Sonnet도 사용할 수 있어요. 다시 말하지만, 저는
UI 전문가도 아니고 디자이너도 아닙니다. 그래서
이런 모델들이 저에게
UI를 제공해주는 것이 정말 마음에 들어요
그중에서 선택하고 각각의 장점을 취해서
실제로 완전히 구현할 수 있거든요.
정말 놀랍습니다. 어쨌든, 이제
마무리할 시간인 것 같네요.
댓글로 알려주세요
GLM-4.5를 시도해본 경험이 있는지요. 오늘 제가
실제로 사용하면서 가진
이런 생각들이 여러분이
GLM-4.5에 대해 생각하는 것과 잘 맞는지요. 그렇지 않다면
한번 시도해보세요. 적어도 UI 작업이나
가벼운 작업에서는요. 실제로
정말 즐겁게 작업할 수 있을 겁니다.
저도 확실히 그랬거든요. 그리고 보시다시피
OpenRouter에서 여전히 많이 사용되고 있어요.
사람들이 적어도 코딩 작업에서
이 모델을 즐겁게 사용하고 있다는 걸 알 수 있죠.
이건 저에게 중요한 부분입니다.
제가 매우 관심 있는 다른 모델은
GLM-4.5 Air입니다. 실제로
일반 모델보다 Air 모델에
더 많은 토큰이 사용되고 있다는 게
흥미롭다고 생각해요. 또한 GLM-4.5는
실제로 비전 모델도 출시했는데
아직 테스트해볼 기회는 없었지만
정말 좋다는 얘기를 들었어요.
좋아요, 이제 마무리하겠습니다.
충분히 길게 얘기했네요.
여러분이 잘 지내고 있기를 바라며
멋진 하루 보내세요. 다음에 만날 때까지
모두 안녕히 계세요.