Технологии

Когда искусственный интеллект выучит казахский язык

Первую версию большой языковой модели на казахском языке (KazLLM) планируется представить в декабре этого года, заявил министр цифрового развития, инноваций и аэрокосмической промышленности Жаслан Мадиев на заседании Правительства, сообщает агентство Kazinform.

По словам министра, для развития исследований в области ИИ определены два основных направления. Первое — создание большой языковой модели на казахском языке (KazLLM) силами НУ и НИТ. Данная модель будет основана на 100 млрд токенов.

Для обеспечения высокого качества модели критически важно собрать максимальное количество данных на казахском языке. Для этих целей будет проводиться национальный сбор данных — ​масштабная кампания по сбору данных на платформе Hugging Face. В настоящее время собрано 28 млрд токенов из открытых источников и порядка 100 терабайт данных из государственных и квазигосударственных органов, а также государственных архивов и СМИ,

пояснил Жаслан Мадиев.

Параллельно будет разработана KazLLM совместно с международными компаниями. Партнером арабской стороны выступит НИТ. Модель будет основана на 30-40 млрд токенов на основе данных из открытых источников. Проект будет реализован на безвозмездной основе.

Планируется представить первую версию KazLLM в декабре текущего года. К 2029 году мы планируем довести количество патентов в области ИИ до показателя не менее 20 в год,

сказал глава Минцифры.
Мухтар Абаев

Recent Posts

МВД Казахстана и полиция Украины ликвидировали транснациональную мошенническую сеть (видео)

В результате совместной спецоперации Министерства внутренних дел Республики Казахстан и Национальной полиции Украины при взаимодействии…

6 часов ago

Школьник из Павлодара получил грант от Google

Ученику 11 класса из Павлодара Игорю Мартынюку удалось стать первым школьником из Центральной Азии, который…

8 часов ago

Поезда LRT разогнались до 80 км/ч

В Астане в ходе тестовой эксплуатации линии LRT подвижные соствы показали  максимальную проектную скорость —…

8 часов ago

Новая схема обмана: мошенники выдают себя за руководителей компаний и сотрудников госорганов

В Казахстане зафиксировано распространение новой схемы мошенничества, при которой злоумышленники выдают себя за руководителей компаний,…

9 часов ago

15-летний футболист из Казахстана перешел в «Барселону»

15-летний казахстанский футболист Карим Мендиканов подписал контракт с «Барселоной» и в новом сезоне присоединится к…

11 часов ago

Yandex Qazaqstan представил Политику безопасности Яндекс Такси

Yandex Qazaqstan представила Политику безопасности в сервисе такси в Казахстане. Компания выстраивает систему, которая работает…

1 день ago