В Казахстане готовится к утверждению проект приказа Министерства науки и высшего образования РК, который предусматривает создание государственной информационной системы «Национальный словарный фонд казахского языка».
Целью создания фонда является сохранение, защита и развитие казахского языка как культурного наследия, а также укрепление его статуса как государственного языка. Планируется накопление ресурсов, охватывающих все сферы применения казахского языка, его упорядочение, цифровизация и генерация актуального лексического состава. Особое внимание будет уделено адаптации языка к искусственному интеллекту и современным технологиям, а также автоматизации процессов обработки.
Национальный словарный фонд будет формироваться на основе академических и переводческих словарей, Национального корпуса казахского языка, терминологической базы и датасетов, представляющих собой совокупность данных различных форматов.
В правилах формирования фонда определены следующие ключевые понятия:
Генерация: автоматическое создание нового контента (текста, изображений, звука) на основе данных и заданных правил.
Модели искусственного интеллекта (ИИ): внедрение технологий и алгоритмов ИИ для обработки данных на казахском языке в различных системах, приложениях и платформах.
Обработка естественного языка: технология машинного обучения, позволяющая компьютерам интерпретировать, обрабатывать и понимать человеческий язык.
Создание Национального словарного фонда казахского языка является важным шагом в развитии государственного языка и его адаптации к современным технологиям.