GOOGLE «ЗАГОВОРИВ» ЛЮДСЬКИМ ГОЛОСОМ
Фахівці пошукового гіганта Google опублікували статтю, в якій розповіли про те, що створили генератор мови, що здатний говорити і не відрізнятись від живої людини голосом. Розробка називається Tacotron 2 і вміє дуже якісно перетворювати текст в мову.
Програма є двома взаємозалежними нейромережами глибокого навчання. Перша нейромережа створює на основі тексту спектрограму і передає її наступному алгоритму WaveNet, який її і озвучує «голосом». Tacotron 2 знає безліч нюансів, без зусиль справляється зі складними в вимові словами і, читаючи з аркуша, враховує пунктуацію. Завдяки цьому, наприклад, він розрізняє кінець речення і початок нового, виділяючи це інтонацією.
Зразки роботи програми фахівці вже виклали на сторінці, присвяченій розробці. Звучить це набагато краще, ніж монотонні механічні голоси сучасних програм озвучування, тому, мабуть, Google швидко знайде розробці застосування. WaveNet вже використовується в Google Assistant, тому Tacotron 2 напевно стане для неї відмінним доповненням.
На даному етапі розробки Tacotron 2 говорить тільки приємним жіночим голосом, але, ймовірно, в майбутньому отримає і чоловічий варіант, а, з огляду на його здатність до навчання, можливо, навчиться й імітувати інші голоси.