Categories: Наука

Систему распознавания тюркских языков разработали в Казахстане

Казахстанские ученые расширили автоматизированную многоязычную модель для распознавания десяти тюркских языков. Ранее была разработана модель для распознавания казахского языка, сообщает  Институт умных систем и искусственного интеллекта Назарбаев Университета (ISSAI).

Сообщается, что помимо казахского, система распознает азербайджанский, татарский, турецкий, башкирский, саха, чувашский, узбекский, кыргызский и уйгурский языки.

Многоязычные модели, которые были обучены с использованием общих речевых данных, показали более надежные результаты, чем базовые одноязычные модели, при этом лучшая модель достигла снижения средней частоты ошибок в символах и словах на 56% и 54% соответственно.

По результатам экспериментов выяснилось, что снижение частоты ошибок в символах и словах было более вероятным, когда многоязычные модели обучались с использованием данных из родственных тюркских языков, чем когда они разрабатывались с использованием данных из неродственных, нетюркских языков, таких как английский и русский

В исследовании также был представлен корпус турецкой речи с открытым исходным кодом. Корпус содержит 218,2 часа расшифрованной речи с 186 171 высказыванием и является крупнейшим общедоступным турецким набором данных в своем роде, — сказано в публикации.

Для использования многоязычной модели автоматического распознавания речи для тюркских языков разработана демо-программа. С ее помощью можно распознать десять тюркских языков, а также русский и английский. 

Арина Чирская

Recent Posts

Президент Казахстана провел встречу с делегацией ООН

Глава государства провел встречу с группой высоких представителей ООН, сообщает пресс-служба Акорды. Президент отметил, что…

8 часов ago

Кейс «Додо Пиццы»: как медийная реклама в Яндекс Поиске влияет на бренд-метрики и спрос

Растущий спрос на кафе и рестораны, а также приток туристов в Казахстане влияют на увеличение…

9 часов ago

Президент Казахстана принял главу Всемирной организации здравоохранения

Касым-Жомарт Токаев провел встречу с Генеральным директором ВОЗ Тедросом Адханомом Гебрейесусом, сообщает пресс-служба Акорды. В…

9 часов ago

Король и наследный принц Саудовской Аравии поблагодарили Касым-Жомарт Токаев за поддержку

На имя Главы государства поступили послания Короля Саудовской Аравии Салмана бен Абдельазиза Аль Сауда и…

10 часов ago

Токаев: культура чтения должна стать неотъемлемой частью кода нации

Президент поздравил казахстанцев с Национальным днем книги, сообщает пресс-служба Акорды. – Поздравляю всех соотечественников с…

12 часов ago

КГД: коллекторские агентства занижали доходы и недоплачивали НДС

Комитет государственных доходов подвёл итоги проверок деятельности коллекторских агентств. По данным ведомства, у семи агентств…

20 часов ago