Categories: Наука

Систему распознавания тюркских языков разработали в Казахстане

Казахстанские ученые расширили автоматизированную многоязычную модель для распознавания десяти тюркских языков. Ранее была разработана модель для распознавания казахского языка, сообщает  Институт умных систем и искусственного интеллекта Назарбаев Университета (ISSAI).

Сообщается, что помимо казахского, система распознает азербайджанский, татарский, турецкий, башкирский, саха, чувашский, узбекский, кыргызский и уйгурский языки.

Многоязычные модели, которые были обучены с использованием общих речевых данных, показали более надежные результаты, чем базовые одноязычные модели, при этом лучшая модель достигла снижения средней частоты ошибок в символах и словах на 56% и 54% соответственно.

По результатам экспериментов выяснилось, что снижение частоты ошибок в символах и словах было более вероятным, когда многоязычные модели обучались с использованием данных из родственных тюркских языков, чем когда они разрабатывались с использованием данных из неродственных, нетюркских языков, таких как английский и русский

В исследовании также был представлен корпус турецкой речи с открытым исходным кодом. Корпус содержит 218,2 часа расшифрованной речи с 186 171 высказыванием и является крупнейшим общедоступным турецким набором данных в своем роде, — сказано в публикации.

Для использования многоязычной модели автоматического распознавания речи для тюркских языков разработана демо-программа. С ее помощью можно распознать десять тюркских языков, а также русский и английский. 

Арина Чирская

Recent Posts

Цифровые технологии усиливают безопасность в Павлодарской области (видео)

Цифровые технологии становятся важным инструментом в обеспечении общественной безопасности. В Павлодарской области ключевую роль в…

19 часов ago

Глава государства принял президента компании Sumitomo

В Токио состоялась встреча Касым-Жомарта Токаева с руководителем одной из крупнейших и влиятельных японских торгово-инвестиционных…

19 часов ago

Касым-Жомарт Токаев осмотрел Ситуационный центр Токио по чрезвычайным ситуациям

Данный комплекс является центральным звеном системы гражданской защиты и управления кризисами города, сообщает пресс-служба Акорды.…

20 часов ago

Президент Казахстана провел встречу с губернатором Токио

Касым-Жомарт Токаев и Юрико Коикэ обсудили вопросы сотрудничества в сфере цифровизации, развития технологий Smart city,…

20 часов ago

«Барыс» обыграл двукратных обладателей Кубка Гагарина (видео)

В рамках очередного игрового дня регулярного чемпионата Континентальной хоккейной лиги «Барыс» в гостях сыграл с…

1 день ago

Həqiqətən işləyən 5 vaxt idarəetmə texnikası

Son tarixlər yaxınlaşır, tapşırıqlar yığılır və gün heç nə düzgün edilməmiş hissi ilə başa çatır.…

1 день ago