Наука & техника

В Google создали синтезатор речи с человеческим голосом

Образцы работы Tacorton 2 можно прослушать на официальном сайте Google

Собшает интернет издание «Сегодня.ua»

Компания Google разработала синтезатор речи нового поколения Tacotron 2, который основан на нейросети. Данная система преобразования текста в естественно звучащую речь Tacotron 2 справляется с этой задачей эффективнее своих предшественников Tacotron и WaveNet, передает Новое время.

Предыдущие системы генерации речи обладали рядом существенных недостатков. WaveNet, к примеру, издавала очень резкие звуки. Tacotron лучше справлялся с интонациями, но не мог выдавать полноценный «речевой продукт».

Алгоритм Tacotron 2, который представлен командой разработчиков Google при участии Джонатана Шена, работает на основе двух нейронных сетей. Печатная версия конвертируется в специальную Tacotron-спектрограмму, в которой распределяются ритм и ударения, а слова генерируются в аналоге WaveNet. Кроме того, добавлена система сбора данных для обучения нейросети.

Отмечается, что аудиозапись действительно похожа на речь живого человек. Темп речи звучит весьма убедительно, а основные запинки происходят на словах с необычным произношением. Правда, часть слушателей в комментариях утверждает, что некоторые слова система выговаривает «ломано».

Пока образцы работы Tacorton 2 можно прослушать на официальном сайте Google. Но, скорее всего, эта технология сразу начнет использоваться в продуктах компании.

Одной из основных проблем нового алгоритма является отсутствие регулировки тона речи. Нельзя предугадать, какая фраза будет произнесена приподнято, а какая — грубо.

Тем временем Microsoft запретила устанавливать Google Chrome. В корпорации отметили, что приложение должно быть «уникальным и отличительным».

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *