Categories: Наука

Систему распознавания тюркских языков разработали в Казахстане

Казахстанские ученые расширили автоматизированную многоязычную модель для распознавания десяти тюркских языков. Ранее была разработана модель для распознавания казахского языка, сообщает  Институт умных систем и искусственного интеллекта Назарбаев Университета (ISSAI).

Сообщается, что помимо казахского, система распознает азербайджанский, татарский, турецкий, башкирский, саха, чувашский, узбекский, кыргызский и уйгурский языки.

Многоязычные модели, которые были обучены с использованием общих речевых данных, показали более надежные результаты, чем базовые одноязычные модели, при этом лучшая модель достигла снижения средней частоты ошибок в символах и словах на 56% и 54% соответственно.

По результатам экспериментов выяснилось, что снижение частоты ошибок в символах и словах было более вероятным, когда многоязычные модели обучались с использованием данных из родственных тюркских языков, чем когда они разрабатывались с использованием данных из неродственных, нетюркских языков, таких как английский и русский

В исследовании также был представлен корпус турецкой речи с открытым исходным кодом. Корпус содержит 218,2 часа расшифрованной речи с 186 171 высказыванием и является крупнейшим общедоступным турецким набором данных в своем роде, — сказано в публикации.

Для использования многоязычной модели автоматического распознавания речи для тюркских языков разработана демо-программа. С ее помощью можно распознать десять тюркских языков, а также русский и английский. 

Арина Чирская

Recent Posts

Токаев: Ученые всегда должны быть в фарватере созидания

Глава государства выступил на заседании Национального совета по науке и технологиям, сообщает прес-служба Акорды. В…

2 дня ago

Джеки Чан снимет фильм в Алматы

Известный китайский и голливудский актер Джеки Чан определился с локациями в Алматы для своего будущего…

2 дня ago

Более трех миллионов казахстанцев установили запрет на получение займов и кредитов

Свыше 3 миллионов граждан Казахстана воспользовались возможностью установить запрет на получение кредитов и микрозаймов. Об…

2 дня ago

Прокуратура СКО выявила нарушения в сфере госзакупок

Прокуратура Северо-Казахстанской области выявила нарушения законодательства в сфере государственных закупок. Ряд акиматов и подведомственных организаций…

2 дня ago

В Павлодаре прошел совместный рейд полиция и «Жастар Рухы» (видео)

В Павлодаре прошли совместные профилактические мероприятия, организованные сотрудниками полиции и представителями молодежного крыла партии «Жастар…

2 дня ago

В Украине ликвидирован мошеннический call-центр, обманувший казахстанцев на сотни миллионов тенге (видео)

23 сентября в результате совместной спецоперации правоохранительных органов Казахстана и Украины была пресечена деятельность транснациональной…

2 дня ago