Google, 즉각적인 음성 대 음성 번역을 위한 Gemini 3.5 Live Translate 발표

Google은 수년간 실시간 번역을 추구해 왔으며 이는 “선구적인 기계 학습 실험” 중 하나라고 말합니다. 과거 Google 이벤트 무대에서 수많은 데모를 보았지만 Google 휴대폰, 이어폰 또는 기타 특정 설정이 필요했습니다. 작년에 Google은 번역 앱에서 더 많은 사용자에게 실시간 번역을 제공했으며 이제는 가용성을 더욱 확대하고 있습니다. Gemini 3.5 실시간 번역이 출시되면 이전보다 더 짧은 지연 시간으로 더 많은 장소에서 즉석 번역에 액세스할 수 있습니다.

새로운 AI 모델은 I/O에서 출시된 버전 3.5 제품군의 일부입니다. 오늘 이전에 Google은 Flash 버전만 출시했지만 앞으로 몇 주 안에 Pro 모델이 출시될 것으로 예상하고 있습니다. Gemini 3.5 Live Translate는 70개 이상의 언어를 자동으로 감지하고 번역하도록 조정된 음성-음성 모델입니다.

Google은 Gemini 3.5 Live Translate가 억양, 속도 및 음조를 일치시키면서 스피커 뒤에서 단 몇 초만 따라가면서 일반적인 대화를 따라갈 수 있을 만큼 충분히 빠르다고 말합니다. 간단히 말해서, 목소리는 일반 로봇보다 더 당신처럼 들립니다. 모두 통제된 조건에서 녹음되는 데모는 인상적입니다. 하지만 모델의 능력을 직접 확인하기 위해 오래 기다릴 필요는 없습니다.

Gemini 3.5 실시간 번역을 사용하여 Google Meet의 음성 번역.

Gemini 3.5 실시간 번역은 Google 생태계의 여러 부분에 걸쳐 출시됩니다. 개발자는 Gemini Live API 또는 AI Studio에서 공개 미리보기를 사용하여 구축을 시작할 수 있습니다. 이 모델은 음성을 지속적으로 처리하고 모든 다국어 입력을 자동으로 처리하므로 개발자가 수동으로 설정을 구성할 필요가 없습니다. 또한 바쁜 환경에서 배경 소음을 필터링합니다.

관련 정보는 아래 링크에서 확인하세요

공식 정보 바로가기

관련 기사

댓글 남기기