GOOGLE «ЗАГОВОРИЛ» ЧЕЛОВЕЧЕСКИМ ГОЛОСОМ
Специалисты поискового гиганта Google опубликовали статью, в которой рассказали о том, что создали генератор языка, способного говорить и не отличаться от живого человека голосом. Разработка называется Tacotron 2 и умеет очень качественно преобразовывать текст в речь.
Программа является двумя взаимосвязанными нейросетями глубокого обучения. Первая нейросеть создает на основе текста спектрограмму и передает ее следующему алгоритму WaveNet, который ее и озвучивает «голосом». Tacotron 2 знает множество нюансов, без труда справляется со сложными в произношении словам и, читая с листа, учитывает пунктуацию. Благодаря этому, например, он различает конец предложения и начало нового, выделяя это интонацией.
Образцы работы программы специалисты уже выложили на странице, посвященной разработке. Звучит это гораздо лучше, чем монотонные механические голоса современных программ озвучивания, поэтому, наверное, Google быстро найдет разработке применения. WaveNet уже используется в Google Assistant, поэтому Tacotron 2 наверняка станет для нее отличным дополнением.
На данном этапе разработки Tacotron 2 говорит только приятным женским голосом, но, вероятно, в будущем получит и мужской вариант, а, учитывая его способность к обучению, возможно, научится имитировать другие голоса.