[00:00]
[음악]
[00:03]
[박수]
[00:04]
안녕하세요, 또 다른 영상에 오신 것을 환영합니다.
[00:08]
얼마 전에 MiniMax Audio 2를 다뤘었는데
[00:12]
정말 훌륭했습니다. 많은 멋진 생성을
[00:14]
할 수 있었고
[00:16]
모든 것이 무료였지만, 최근에
[00:18]
멋진 새로운 기능들을 출시했어서
[00:21]
다시 한 번 이야기해보려고 합니다.
[00:22]
[00:24]
어쨌든, 지난 영상 이후로 MiniMax Audio는
[00:28]
Artificial Analysis 같은
[00:30]
여러 사이트에서 많은 벤치마크를 받았고
[00:32]
이제 음성 분야 리더보드에서
[00:34]
최고 모델로 판명되었습니다
[00:36]
이는 확실히 품질의 증거입니다.
[00:39]
[00:41]
Hugging Face TTS Arena에서도
[00:44]
1위를 차지하며 리더보드를 이끌고 있습니다.
[00:47]
이제 어떻게 사용하는지 보여드리겠습니다.
[00:50]
먼저 minimax.io/audio로 가셔야 합니다
[00:53]
그러면 이런 인터페이스를 보실 수 있습니다.
[00:56]
계정 없이도 무료로 사용할 수 있지만
[00:58]
[01:00]
가입하시는 것을 추천드립니다
[01:02]
그러면 매월 약 10,000개의 무료 크레딧을 받으실 수 있어서
[01:04]
정말 훌륭하고
[01:06]
일상적인 작업에 충분합니다.
[01:09]
[01:12]
먼저 여기서 바로 볼 수 있는
[01:15]
주요 옵션은 스크립트나 텍스트를 입력하는 것입니다.
[01:18]
여기서는 또한 변환하고 싶은
[01:21]
스크립트나 문서를 업로드할 수도 있습니다.
[01:24]
[01:25]
[01:27]
PDF 형식, 텍스트 형식,
[01:31]
HTML, 심지어 doc 형식도 가능해서
[01:34]
정말 훌륭합니다. 또한 여기에
[01:37]
낭독하고 싶은 웹사이트나 문서의 URL을
[01:40]
넣을 수도 있고
[01:42]
그것도 할 수 있어서 정말 놀랍습니다.
[01:45]
최대 200k 문자까지 입력을 받아서
[01:48]
오디오북이나 팟캐스트를
[01:50]
쉽게 만들 수 있습니다.
[01:52]
하지만 음성을 생성하기 전에
[01:54]
제공되는 음성들을 보여드리겠습니다.
[01:57]
실제로 음성 페이지로 가서
[01:59]
음성들을 쉽게 둘러볼 수 있습니다.
[02:02]
수많은 음성이 있고
[02:05]
언어, 억양, 성별, 심지어 나이로
[02:07]
음성과 샘플을 쉽게 필터링할 수 있습니다.
[02:12]
이는 필요한 최고의 음성을 찾는 데 정말 좋습니다.
[02:14]
그리고 듣고 싶은 음성의
[02:17]
샘플을 재생할 수도 있습니다.
[02:19]
[02:22]
안녕하세요, 저희 음성 서비스로
[02:24]
도움을 드릴 수 있어서 기쁩니다.
[02:26]
마음에 드는 음성을 선택하시고
[02:28]
창의적인 오디오 여정을 함께 시작해보세요.
[02:33]
저는 세상을 요구하는 게 아니라
[02:35]
조금의 노력과 배려만 바랍니다.
[02:40]
모든 음절은 약속을 담고 있으며
[02:42]
꿈과 현실이 얽혀있는
[02:44]
영역으로 여러분을 이끕니다.
[02:47]
광동어, 중국어, 일본어, 한국어, 스페인어,
[02:50]
브라질 포르투갈어, 아랍어,
[02:53]
인도네시아어, 태국어 등을 포함한
[02:57]
30개 이상의 진정한 언어를
[03:00]
네이티브 특색과 함께 지원합니다.
[03:03]
필요에 맞는 음성을 찾지 못하신다면
[03:05]
음성 디자인 옵션으로
[03:08]
맞춤 음성을 만들 수도 있습니다.
[03:11]
이를 통해 프롬프트를 제공하면
[03:13]
어떤 종류의 맞춤 음성이든
[03:16]
생성할 수 있고
[03:18]
그에 따라 사용할 수 있습니다.
[03:20]
이제 여기 텍스트 투 스피치
[03:23]
옵션으로 넘어가보겠습니다.
[03:25]
인터페이스는 이렇게 생겼습니다.
[03:27]
위쪽에는 텍스트 투 스피치 모델들을
[03:30]
볼 수 있습니다. Speech 2 모델들이
[03:33]
가장 좋은 것들이고 최근에 추가되었습니다.
[03:35]
여기에 추가되었습니다. HD 모델은
[03:39]
최고의 품질을 제공하지만 크레딧을
[03:41]
조금 더 소모하는 반면, 터보 모델은
[03:44]
1초 이내의 초고속 처리로
[03:46]
더 적은 크레딧을 소모합니다.
[03:50]
때로는 최고 품질이 필요하지 않을 때
[03:52]
이런 옵션이 있다는 것은 정말 좋습니다.
[03:55]
이 옵션은 분명히 유용할 것입니다.
[03:58]
그런 다음 텍스트나 스크립트를
[04:00]
여기에 입력할 수 있습니다. 또한 이런 구문을
[04:03]
사용하여 일시정지 시간과
[04:06]
기타 요소들을 텍스트 사이에 추가하여
[04:08]
필요에 따라 최적의 생성을
[04:11]
얻을 수 있습니다.
[04:12]
여기서 볼 수 있는 또 다른 옵션은
[04:15]
새로운 긴 텍스트 옵션입니다.
[04:18]
긴 텍스트는 최대 허용 길이를
[04:21]
20만 자까지 확장하는데, 이는
[04:24]
거의 2-3시간 분량의 콘텐츠를
[04:27]
한 번에 붙여넣을 수 있게 해주므로
[04:30]
정말 놀라운 일입니다. 그리고 모든
[04:32]
일관성과 필요한 모든 것을 갖춘
[04:35]
매우 긴 오디오를 전체적으로
[04:37]
생성할 수 있다는 것은 정말 놀라운 일입니다.
[04:42]
하지만 이것은 더 오랜 시간이 걸리므로
[04:45]
필요할 때만 적절히 사용하세요.
[04:47]
[04:49]
그런 다음 사용하고자 하는
[04:52]
언어를 선택하는 옵션도
[04:53]
볼 수 있습니다.
[04:55]
언어를 자동으로 감지할 수도 있지만
[04:58]
항상 최상의 결과를 얻기 위해
[05:00]
여기서 설정해 두는 것을
[05:02]
권장합니다.
[05:04]
파일을 업로드하여 오디오로
[05:07]
변환할 수도 있습니다. 즉
[05:09]
책이나 연구 논문을 소유하고 있고
[05:12]
그것을 오디오북으로 변환하고 싶다면
[05:14]
꽤 쉽게 할 수 있습니다.
[05:18]
여기에 URL을 입력할 수도 있습니다.
[05:21]
기사를 읽고 싶지만 시간이 없다면
[05:23]
URL을 여기에 붙여넣기만 하면
[05:25]
오디오 형식으로 변환되어
[05:28]
다른 일을 하면서 들을 수 있습니다.
[05:31]
이것은 정말 멋진 기능입니다.
[05:34]
[05:36]
그런 다음 오른쪽에서 사용하고자 하는
[05:39]
음성을 쉽게 선택할 수 있습니다.
[05:42]
또한 음성의 감정을 변경할 수 있는
[05:45]
옵션도 있습니다.
[05:46]
행복, 슬픔, 화남, 두려움 등으로 설정할 수 있으며
[05:52]
이것도 정말 멋진 기능입니다.
[05:54]
[05:56]
음성 변조 옵션도 있어서
[05:58]
오디오를 더 선명하게 만들거나
[06:00]
다른 방식으로 변경할 수 있습니다.
[06:03]
속도, 피치, 볼륨도
[06:06]
여기서 선택할 수 있으며
[06:08]
이것도 정말 멋진 기능입니다. 그리고
[06:11]
생성 기록을 볼 수 있는
[06:13]
히스토리 옵션도 있습니다.
[06:15]
여기서 오디오를 생성해 보겠습니다.
[06:17]
스크립트를 입력하고 오디오 생성
[06:20]
버튼을 누르면 몇 초 안에
[06:22]
음성이 생성되는 것을
[06:24]
볼 수 있습니다.
[06:27]
밥은 달걀 세 개를 저글링하여
[06:29]
고양이에게 인상을 주려고 했습니다. 고양이는
[06:32]
감동받지 않고 하품을 하며
[06:33]
우유 한 잔을 넘어뜨렸습니다. 밥은 당황하여
[06:36]
달걀을 떨어뜨리고 우유에 미끄러져
[06:38]
쿵 하고 넘어졌습니다. 고양이는 눈을 깜빡이며
[06:41]
발을 핥고 걸어가며 분명히
[06:44]
'아마추어'라고 생각했습니다.
[06:46]
밥은 달걀과 우유로 뒤덮인 채 한숨을 쉬었고
[06:49]
고양이는 유일한 깨끗한 의자를 차지했습니다.
[06:51]
교훈: 고양이보다 돋보이려 하지 마세요.
[06:54]
그들은 항상 발로 착지하고
[06:55]
당신은 그냥 엉망이 될 뿐입니다. 이제
[06:58]
한 가지 더 멋진 기능이 있는데
[07:01]
음성 라이브러리로 가면 이 옵션을 볼 수 있습니다
[07:03]
자신만의 음성을 만들 수 있는 기능이 있습니다. 그리고 이것은
[07:06]
3개의 커스텀 음성에 대해서도 무료입니다.
[07:10]
여기서 복제하고 싶은 오디오를 업로드하거나
[07:12]
여기서 직접 녹음할 수도 있습니다.
[07:14]
여기서 직접 녹음할 수도 있습니다.
[07:17]
여기에 넣는 오디오가 고음질인지 확인하세요
[07:20]
최상의 결과를 얻기 위해서 말입니다.
[07:23]
그런 다음 백그라운드 노이즈를 제거하고
[07:25]
이름을 설정하고
[07:29]
음성이 사용될 언어도 선택할 수 있습니다
[07:31]
그러면 음성 복제본이 잠시 후에 생성되어
[07:34]
여기서 확인할 수 있습니다.
[07:37]
여기서 확인할 수 있습니다.
[07:39]
이제 만든 음성으로 텍스트 투 스피치를 하려면
[07:43]
텍스트 투 스피치 옵션으로 가서
[07:45]
음성 탭에서 내 음성 탭으로 가서
[07:49]
방금 만든 음성을 선택하면 됩니다.
[07:52]
방금 만든 음성을 선택하면 됩니다.
[07:55]
이제 원하는 대로 설정하고
[07:57]
스크립트를 입력한 다음
[08:00]
생성 버튼을 누르면 몇 초 안에
[08:03]
오디오가 생성됩니다
[08:05]
정말 멋지죠. 밥은 달걀 세 개를 저글링해서
[08:09]
고양이에게 인상을 주려고 했습니다.
[08:11]
고양이는 감동받지 않고 하품을 하며
[08:14]
우유 한 잔을 넘어뜨렸습니다. 밥은
[08:17]
당황해서 달걀을 떨어뜨리고
[08:19]
우유에 미끄러져 털썩 넘어졌습니다.
[08:22]
고양이는 눈을 깜빡이고 발을 핥고
[08:24]
유유히 걸어가며 분명히 생각했을 겁니다.
[08:27]
"아마추어!" 밥은 달걀과 우유로 뒤범벅이 된 채
[08:30]
한숨을 쉬었고 고양이는 유일한
[08:32]
깨끗한 의자를 차지했습니다. "교훈! 절대로
[08:35]
고양이보다 뛰어나려고 하지 마세요.
[08:37]
고양이는 항상 발로 착지하고
[08:39]
당신은 그저 엉망이 될 뿐입니다. 이 모든 것 외에도
[08:42]
뮤직이라는 새로운 옵션이 있습니다.
[08:45]
뮤직을 사용하면 멋진 노래를 생성할 수 있습니다.
[08:47]
뮤직 탭으로 가면
[08:49]
이 페이지를 볼 수 있습니다.
[08:52]
두 가지 옵션이 있습니다. 그냥 프롬프트를 주면
[08:56]
가사와 음악 등 모든 것을
[08:58]
자동으로 만들어줍니다.
[08:59]
자동으로 만들어줍니다.
[09:01]
아니면 자신만의 가사가 있다면
[09:03]
고급 옵션을 사용할 수도 있습니다.
[09:06]
이 옵션을 사용하면 자신만의
[09:08]
가사를 입력하여 적절히 활용할 수 있습니다.
[09:11]
포켓몬 스타일의 앰비언트 음악을
[09:13]
만들어달라고 요청해보겠습니다. 그러면
[09:16]
이제 보시게 될 것은
[09:18]
적절히 작업을 시작하는 것입니다.
[09:20]
잠시 후에 완성되어 여기서
[09:23]
들을 수 있습니다. 햇빛이 잎사귀를 통해
[09:26]
아주 푸르게 비춥니다. 조용한 길, 평화로운 풍경.
[09:30]
높은 들풀에서 속삭임이 들립니다. 시간이
[09:34]
천천히 흘러갑니다. 그냥 흘러가게 두세요.
[09:37]
오, 세상이 부드러운 허밍을 부릅니다.
[09:40]
조용한 경이로움이 천천히 찾아오는 곳에서.
[09:44]
모든 걸음은 부드럽고 진실한 이야기입니다.
[09:48]
빠른 파란 하늘 아래서.
[09:52]
먼 언덕들이 흐릿하게 보입니다.
[09:56]
이것이 주로 Minimax 오디오의
[09:58]
작동 방식입니다. 정말 멋진 음악과
[10:01]
콘텐츠 크리에이터를 위한 오디오 생성 플랫폼으로
[10:04]
비디오용 음성을 즉시 생성할 수 있습니다.
[10:07]
비디오용 음성을 즉시 생성할 수 있습니다.
[10:09]
짧은 콘텐츠를 만들 때
[10:10]
성우를 구할 필요가 없습니다.
[10:13]
아니면 보이스오버의 부담에서
[10:15]
벗어나고 싶다면
[10:18]
이것은 확실히 놀랍습니다. 무료이고 매일 10,000
[10:21]
크레딧을 제공하는데, 이는 꽤 괜찮습니다.
[10:25]
정말 마음에 듭니다. 그리고 무료 옵션은
[10:28]
확실히 멋집니다. 개인 용도로도 훌륭합니다.
[10:30]
파일이나 URL을 업로드하여
[10:34]
이동 중에 들을 수 있습니다.
[10:37]
최대 200K 문자까지 입력할 수 있고
[10:40]
오디오북이나 팟캐스트를
[10:43]
쉽게 만들 수 있습니다.
[10:44]
몇 초 안에 커스텀 스튜디오 품질의 음성을
[10:46]
얻을 수 있습니다.
[10:48]
광동어를 포함한 30개 이상의 정통 언어
[10:51]
네이티브 특색을 제공합니다.
[10:54]
중국어, 일본어, 한국어, 스페인어,
[10:57]
브라질 포르투갈어, 아랍어,
[11:00]
인도네시아어, 태국어 등 많은 언어를 지원합니다.
[11:04]
HD 모델은 99%의 음성 유사도를 제공하며
[11:08]
글리치를 최소화합니다. 그리고 터보
[11:11]
스트리밍 모드는 1초 미만의
[11:13]
지연시간을 제공합니다.
[11:15]
설명란의 링크를 통해
[11:17]
꼭 한번 시도해보세요
[11:19]
분명히 매료될 것입니다.
[11:21]
분명히 매료될 것입니다.
[11:23]
전반적으로 꽤 멋집니다. 어쨌든
[11:25]
아래에 의견을 남기고 채널을 구독하세요.
[11:27]
슈퍼 땡스 옵션으로 기부하거나
[11:30]
채널에 가입해서
[11:31]
혜택을 받을 수도 있습니다.
[11:33]
다음 비디오에서 뵙겠습니다. 안녕히 계세요.
[11:36]
[음악]