Categories: Наука

Систему распознавания тюркских языков разработали в Казахстане

Казахстанские ученые расширили автоматизированную многоязычную модель для распознавания десяти тюркских языков. Ранее была разработана модель для распознавания казахского языка, сообщает  Институт умных систем и искусственного интеллекта Назарбаев Университета (ISSAI).

Сообщается, что помимо казахского, система распознает азербайджанский, татарский, турецкий, башкирский, саха, чувашский, узбекский, кыргызский и уйгурский языки.

Многоязычные модели, которые были обучены с использованием общих речевых данных, показали более надежные результаты, чем базовые одноязычные модели, при этом лучшая модель достигла снижения средней частоты ошибок в символах и словах на 56% и 54% соответственно.

По результатам экспериментов выяснилось, что снижение частоты ошибок в символах и словах было более вероятным, когда многоязычные модели обучались с использованием данных из родственных тюркских языков, чем когда они разрабатывались с использованием данных из неродственных, нетюркских языков, таких как английский и русский

В исследовании также был представлен корпус турецкой речи с открытым исходным кодом. Корпус содержит 218,2 часа расшифрованной речи с 186 171 высказыванием и является крупнейшим общедоступным турецким набором данных в своем роде, — сказано в публикации.

Для использования многоязычной модели автоматического распознавания речи для тюркских языков разработана демо-программа. С ее помощью можно распознать десять тюркских языков, а также русский и английский. 

Арина Чирская

Recent Posts

КХЛ. «Барыс» в гостях разгромил «Амур» (видео)

«Барыс» провел четвертый из шести выездных матчей. Астанчане сыграли в Хабаровске с «Амуром». Счет в…

3 дня ago

Президент Казахстана осудил ракетные обстрелы и атаки иранских беспилотников на ОАЭ

Касым-Жомарт Токаев осудил ракетные обстрелы и атаки беспилотников с иранской территории на Объединенные Арабские Эмираты…

3 дня ago

Трагедия в Атырауской области: подозреваемый признался в убийстве четырех человек (видео)

В Атырауской области раскрыто особо тяжкое преступление, связанное с исчезновением семьи из села Жангельдин, сообщает…

4 дня ago

Легкость в теле и спокойствие в голове: практик из Астаны рассказал, почему люди выбирают цигун

В Казахстане всё больше людей интересуются древними восточными практиками - цигун и тайцзи. Как проходят…

4 дня ago

Развивая интеллектуальный образ жизни: Xiaomi представляет новую волну AI-решений Human × Car × Home на MWC 2026

Вернувшись на MWC 2026, глобальный лидер в области инноваций и технологий Xiaomi продолжает демонстрировать свою…

4 дня ago

Рыбакина вышла в четвертый круг топ-турнира в Индиан-Уэллс (видео)

В Индиан-Уэллс (США) проходит один самых престижные турниров мирового тенниса BNP Paribas Open (WTA 1000,…

4 дня ago