Телеком

Бета-тестування національної LLM планується навесні 2026р – 1-й віцепрем’єр

Запустити бета-тестування національної LLM (велика мовна модель – ІФ-У) заплановано навесні 2026 року, повідомив перший віцепрем’єр-міністр цифрової трансформації Михайло Федоров.

"А назву для української LLM оберуть самі українці — у січні розпочнемо голосування в "Дії", - написав він у Телеграм-каналі в середу.

За його словами, у січні буде сформовано першу базу текстів для тренування LLM, покращено токенізатор, який розділяє слова на елементи, для швидкої та продуктивної обробки мови, а також власні бенчмарки для оцінки якості.

Федоров пояснив, що наразі триває збір даних для навчання LLM. "Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами та іншими інституціями — це терабайти унікальних даних", - зауважив перший віцепрем’єр.

Він додав, що фахівці працюють над створенням тестів мовної моделі, які допоможуть оцінювати й покращувати її якість.

"Паралельно створюємо юридичний фреймворк, щоб відповідально працювати з даними, які нам надають для тренування моделі", – підкреслив Федоров.

Зазначається, що технічним партнером проєкту є найбільший український оператор мобільного зв’язку "Київстар", який фінансує розробку національної великої мовної моделі з подальшою передачею її державі.

Перший віцепрем’єр уточнив, що якість розробки тестуватиме група незалежних експертів з різних галузей. Зокрема, модель перевірятимуть на технічну якість, етичність та безпечність для користувачів, знання української мови та розуміння національного контексту.

У грудні 2025 року повідомлялось, що Міністерство цифрової трансформації разом з найбільшим українським оператором мобільного зв’язку "Київстар" обрали модель Gemma 3 від Google (відкрита ШІ-модель) для тренування української LLM.

У своєму релізі "Київстар" тоді нагадав, що модель Gemma вже продемонструвала результати як базова модель для MamayLM та Lapa LLM – перших українських LLM, а також для INSAIT BgGPT – сучасної LLM для болгарської мови.

Реклама
Реклама

ЩЕ ЗА ТЕМОЮ

ОСТАННЄ