Технологии

Когда искусственный интеллект выучит казахский язык

Первую версию большой языковой модели на казахском языке (KazLLM) планируется представить в декабре этого года, заявил министр цифрового развития, инноваций и аэрокосмической промышленности Жаслан Мадиев на заседании Правительства, сообщает агентство Kazinform.

По словам министра, для развития исследований в области ИИ определены два основных направления. Первое — создание большой языковой модели на казахском языке (KazLLM) силами НУ и НИТ. Данная модель будет основана на 100 млрд токенов.

Для обеспечения высокого качества модели критически важно собрать максимальное количество данных на казахском языке. Для этих целей будет проводиться национальный сбор данных — ​масштабная кампания по сбору данных на платформе Hugging Face. В настоящее время собрано 28 млрд токенов из открытых источников и порядка 100 терабайт данных из государственных и квазигосударственных органов, а также государственных архивов и СМИ,

пояснил Жаслан Мадиев.

Параллельно будет разработана KazLLM совместно с международными компаниями. Партнером арабской стороны выступит НИТ. Модель будет основана на 30-40 млрд токенов на основе данных из открытых источников. Проект будет реализован на безвозмездной основе.

Планируется представить первую версию KazLLM в декабре текущего года. К 2029 году мы планируем довести количество патентов в области ИИ до показателя не менее 20 в год,

сказал глава Минцифры.
Мухтар Абаев

Recent Posts

Президент Казахстана провел встречу с делегацией ООН

Глава государства провел встречу с группой высоких представителей ООН, сообщает пресс-служба Акорды. Президент отметил, что…

9 часов ago

Кейс «Додо Пиццы»: как медийная реклама в Яндекс Поиске влияет на бренд-метрики и спрос

Растущий спрос на кафе и рестораны, а также приток туристов в Казахстане влияют на увеличение…

10 часов ago

Президент Казахстана принял главу Всемирной организации здравоохранения

Касым-Жомарт Токаев провел встречу с Генеральным директором ВОЗ Тедросом Адханомом Гебрейесусом, сообщает пресс-служба Акорды. В…

10 часов ago

Король и наследный принц Саудовской Аравии поблагодарили Касым-Жомарт Токаев за поддержку

На имя Главы государства поступили послания Короля Саудовской Аравии Салмана бен Абдельазиза Аль Сауда и…

12 часов ago

Токаев: культура чтения должна стать неотъемлемой частью кода нации

Президент поздравил казахстанцев с Национальным днем книги, сообщает пресс-служба Акорды. – Поздравляю всех соотечественников с…

13 часов ago

КГД: коллекторские агентства занижали доходы и недоплачивали НДС

Комитет государственных доходов подвёл итоги проверок деятельности коллекторских агентств. По данным ведомства, у семи агентств…

21 час ago