Categories: Наука

Систему распознавания тюркских языков разработали в Казахстане

Казахстанские ученые расширили автоматизированную многоязычную модель для распознавания десяти тюркских языков. Ранее была разработана модель для распознавания казахского языка, сообщает  Институт умных систем и искусственного интеллекта Назарбаев Университета (ISSAI).

Сообщается, что помимо казахского, система распознает азербайджанский, татарский, турецкий, башкирский, саха, чувашский, узбекский, кыргызский и уйгурский языки.

Многоязычные модели, которые были обучены с использованием общих речевых данных, показали более надежные результаты, чем базовые одноязычные модели, при этом лучшая модель достигла снижения средней частоты ошибок в символах и словах на 56% и 54% соответственно.

По результатам экспериментов выяснилось, что снижение частоты ошибок в символах и словах было более вероятным, когда многоязычные модели обучались с использованием данных из родственных тюркских языков, чем когда они разрабатывались с использованием данных из неродственных, нетюркских языков, таких как английский и русский

В исследовании также был представлен корпус турецкой речи с открытым исходным кодом. Корпус содержит 218,2 часа расшифрованной речи с 186 171 высказыванием и является крупнейшим общедоступным турецким набором данных в своем роде, — сказано в публикации.

Для использования многоязычной модели автоматического распознавания речи для тюркских языков разработана демо-программа. С ее помощью можно распознать десять тюркских языков, а также русский и английский. 

Арина Чирская

Recent Posts

Доллар продолжает дешеветь

По данным Казахстанской фондовой биржи, на торгах 28 ноября средневзвешенный курс доллара составил 512,53 тенге.…

23 часа ago

Выступление Главы государства на диалог-платформе сельских акимов

Уважаемые участники! Сегодняшняя встреча, на которую были приглашены представители исполнительной власти всех уровней нашей страны,…

23 часа ago

В Казахстане планируют повысить тариф на несрочные вызовы скорой помощи в вечернее и ночное время

Министерство здравоохранения Казахстана предложило увеличить тариф на обслуживание несрочных вызовов скорой помощи в вечерние и…

1 день ago

Полиция Жетысу изъяла больше тысячи бутылок поддельной водки (видео)

В области Жетысу участковые инспекторы полиции в рамках оперативно-профилактического мероприятия «Участок» выявили крупный незаконный склад…

1 день ago

В столице проходит диалог-платформа сельских акимов

На сегодняшний день по всей стране избрано 2334 сельских акима, сообщает пресс-служба Акорды Глава государства…

1 день ago

Yandex Ads: на 21% выросли запросы казахстанцев, связанные с покупками

Пользователи в Казахстане ежемесячно задают в Яндекс Поиске более 50 млн запросов, связанных с покупками…

2 дня ago