feedback

AI саммари

Казахстанские разработчики создают LLM для казахского языка, используя стандартные методы расширения токенайзера и дообучения. Они также разработали новые сеты для оценок и адаптировали известные бенчмарки, такие как ArenaHard, Shlepa и MMLU, для оценки моделей на казахском языке. Разработка ведется на энтузиазме, поэтому авторы призывают поддержать проект.
от FlowFeed AI
Обновлено: 2 days ago
В Казахстане команда энтузиастов из числа стажеров Вихрей активно занимается разработкой LLM
LLM (Large Language Model) - большая языковая модель, тип искусственного интеллекта, способный понимать и генерировать текст на естественных языках
для казахского языка. Подход остается стандартным: расширяют токенайзер и дообучают LLM.

Особенностью является то, что они собрали современные сеты для оценок, включая ArenaHard, вариацию Shlepa и даже адаптацию MMLU на основе казахского теста для старшей школы.

Ребята работают на чистом энтузиазме, поддержите их лайками!
Разработка LLM для казахского языка: энтузиасты создают новые бенчмарки
Link copied