구글은 9일(현지시간) 새 실시간 음성 번역 모델 ‘제미나이 3.5 라이브 트랜슬레이트’를 공개했다. 이 모델은 구글 번역 앱과 화상회의 서비스 구글 미트, 개발자용 제미나이 라이브 API(실시간 음성 기능 연동 도구) 등에 차례로 적용된다.
새 모델은 이용자가 번역할 언어를 미리 고르지 않아도 대화 속 언어를 자동으로 알아듣는다. 70개 이상 언어를 음성으로 인식해 다른 언어의 음성으로 바꿔준다. 여러 언어가 섞인 대화에서도 사용할 수 있다.
가장 큰 변화는 통역 속도다. 기존 음성 통역은 상대방의 말이 끝난 뒤 번역 음성을 내보내는 경우가 많았다. 새 모델은 상대방이 말하는 동안에도 번역 음성을 이어서 들려준다. 구글은 원래 말과 번역 음성 사이의 차이가 몇 초 수준에 그친다고 설명했다.
새 모델은 안드로이드와 iOS용 구글 번역 앱에 모두 적용된다. 이용자는 이어폰을 연결해 실시간 음성 번역을 들을 수 있다. 안드로이드에서는 스마트폰을 귀에 대면 통화하듯 번역 음성을 들을 수 있는 ‘듣기 모드’도 제공된다.
이 기능을 이용하면 여행 중에도 현지인과 서로 다른 언어로 대화할 때 스마트폰을 통해 실시간에 가까운 음성 통역을 받을 수 있다.
구글 미트에는 일부 기업 고객부터 먼저 적용된다. 구글은 이달 기업용 구글 워크스페이스 고객을 대상으로 새 음성 번역 기능을 시험 제공하고, 연내 적용 대상을 넓힐 계획이다. 다국어 회의에서 발언을 실시간으로 번역해 전달하는 용도다.
개발자용은 제미나이 라이브 API와 구글 AI 스튜디오를 통해 시험 공개된다. 개발자들은 이 기능을 활용해 실시간 음성 번역 서비스를 만들 수 있다. 아고라와 라이브킷 등 실시간 미디어 플랫폼도 관련 기능 연동을 지원한다.
차량 호출 서비스 그랩은 이 모델을 운전자와 여행객 간 다국어 통화에 활용하는 방안을 테스트하고 있다. 서로 다른 언어를 쓰는 운전자와 승객이 앱 안에서 통화할 때 실시간 번역을 제공하는 방식이다.
구글은 AI가 만든 음성임을 식별할 수 있도록 모든 생성 음성에 신스ID 워터마크를 적용한다고 밝혔다. 신스ID 워터마크는 AI로 만들어진 음성에 보이지 않는 식별 표시를 넣는 기술이다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지



![[르포] 중력 6배에 짓눌려 기절 직전…전투기 조종사 비행환경 적응훈련(영상)](https://image.ajunews.com/content/image/2024/02/29/20240229181518601151_258_161.jpg)



