Телеком

Бета-тестирование национальной LLM планируется весной 2026 г. - первый вице-премьер

Запустить бета-тестирование национальной LLM (большая языковая модель - ИФ-У) запланировано весной 2026 года, сообщил первый вице-премьер-министр цифровой трансформации Михаил Федоров.

"А название для украинской LLM выберут сами украинцы - в январе начнем голосование в "Дії", - написал он в телеграм-канале в среду.

По его словам, в январе будет сформирована первая база текстов для тренировки LLM, улучшен токенизатор, который разделяет слова на элементы, для быстрой и продуктивной обработки языка, а также собственные бенчмарки для оценки качества.

Федоров пояснил, что сейчас продолжается сбор данных для обучения LLM. "Для высокого качества информации из интернета недостаточно, поэтому работаем с государственными органами, медиа, университетами и другими институтами - это терабайты уникальных данных", - отметил первый вице-премьер.

Он добавил, что специалисты работают над созданием тестов языковой модели, которые помогут оценивать и улучшать ее качество.

"Параллельно создаем юридический фреймворк, чтобы ответственно работать с данными, которые нам предоставляют для тренировки модели", - подчеркнул Федоров.

Отмечается, что техническим партнером проекта является крупнейший украинский оператор мобильной связи "Киевстар", который финансирует разработку национальной большой языковой модели с последующей передачей ее государству.

Первый вице-премьер уточнил, что качество разработки будет тестировать группа независимых экспертов из разных отраслей. В частности, модель будут проверять на техническое качество, этичность и безопасность для пользователей, знание украинского языка и понимание национального контекста.

В декабре 2025 года сообщалось, что Министерство цифровой трансформации вместе с крупнейшим украинским оператором мобильной связи "Киевстар" выбрали модель Gemma 3 от Google (открытая ИИ-модель) для тренировки украинской LLM.

В своем релизе "Киевстар" тогда напомнил, что модель Gemma уже продемонстрировала результаты как базовая модель для MamayLM и Lapa LLM - первых украинских LLM, а также для INSAIT BgGPT - современной LLM для болгарского языка.

Реклама
Реклама

ЕЩЕ ПО ТЕМЕ

ПОСЛЕДНЕЕ