fbpx
Basic Group

В APPLE РОЗПОВІЛИ, ЯК SIRI ВЧИТЬ НОВІ МОВИ

A woman speaks on her iPhone as she walks on a busy street in downtown Shanghai. REUTERS/Aly Song
A woman speaks on her iPhone as she walks on a busy street in downtown Shanghai. REUTERS/Aly Song
Майже 7 років тому компанія Apple придбала стартап, що розробив «розумний» голосовий асистент Siri , який за роки свого існування пройшов значний шлях еволюціонування і зараз здатний спілкуватися з користувачем на двох десятках мов. У нещодавньому інтерв’ю Reuters Алекс Асеро, який організовує навчання Siri , розповів, з яких етапів складається процес вивчення нової мови.
 
Асеро працює над проектом з 2013 року і в даний час очолює команду розробників, що навчають Siri новим мовам. Основною складністю його роботи є перш за все розпізнавання мови. Раніше для цього використовувався алгоритм від Nuance, проте «яблучна» компанія перейшла на власну розробку, в основі якої лежить машинне навчання, що поліпшує систему з кожним новим запитом.
 
На першому етапі навчання Apple збирає групу носіїв мови для зачитування уривків тексту і довгих списків слів з різним акцентом. Людська мова записується і транскрибується іншими людьми. Це формує широке уявлення про те, як можуть звучати слова. Саме ці дані вводяться в алгоритмічну модель машинної підготовки. Система намагається передбачити транскрипцію довільних рядків слів для кращого розпізнавання майбутнього тексту, інженери вносять корективи, і з часом робота алгоритмів поліпшується.
 
Однак перш ніж почати використовувати нову мову в Siri, компанія робить її доступною в функції «Диктування» на macOS і iOS, а також в клавіатурі для iPhone. Apple збирає анонімні дані про мовні обороти, а також вчить систему розпізнавати слова за наявності перешкод, шуму, кашлю, щоб поліпшити процес розуміння слів в складних умовах. Як розповів Асеро, така своєрідна репетиція дозволяє зменшити число помилок майже вдвічі. Доступ Siri до нової мови відкривають тільки тоді, коли інженери впевнені, що асистент має достатньо досвіду для самостійної роботи. Перед запуском спеціально відібрані люди записують кілька фраз-заготовок, а також відповіді на найбільш поширені питання, включаючи «Siri, розкажи анекдот». Відповіді ж на питання в дусі «Знайди ресторан поблизу» формуються динамічно в залежності від умов. Кожні два тижні компанія оновлює базу питань з готовими відповідями. На жаль, на даний момент ні Siri, ні інші цифрові асистенти не вміють формулювати відповіді автономно і потребують доступу до хмарних баз даних.