Україна розробляє свій національний штучний інтелект: створення “цифрового мозку”

Близько півтора року тому Україна визначила курс на інтеграцію у світову гонку штучного інтелекту. Мета полягає не лише в споживанні технологій, а й у створенні власної AI-інфраструктури. В рамках цієї ініціативи особливу увагу отримала ідея розробки національної великої мовної моделі (LLM), яка має стати основою для державних сервісів і взаємодії громадян із технологіями, а також елементом аналітичної та безпекової системи країни.

Міністерство цифрової трансформації виступило ініціатором цього проєкту, акцентуючи увагу на важливості суверенності в галузі даних і технологій, особливо в умовах швидкого розвитку світових AI-моделей на кшталт GPT і Gemini. Логіка проєкту полягає в тому, що країна, яка не має власної моделі AI, ризикує потрапити в технологічну залежність. Тому в Україні було ухвалено рішення розпочати створення власної мовної моделі під назвою «Сяйво».

Початково планували, що перші результати з'являться до кінця 2025 року, а вже навесні 2026 року модель буде відкрита для публічного тестування. Проте із заглибленням у технічні аспекти виявилося, що реалізація проєкту виявляється значно складнішою, ніж очікувалось. Строки почали зрушуватися, а архітектура проєкту стала вимагати змін.

Ключову роль у виконанні проєкту відіграє співпраця Мінцифри з компанією «Київстар», яка стала основним партнером у державно-приватному форматі. Оператор мобільного зв’язку забезпечує фінансування, формує технічну команду та займається частиною інженерних розробок. У той же час держава відповідає за координацію, доступ до даних та створення етичних і правових рамок. Хоча такий підхід мав на меті пришвидшити процес, реальність виявилася складнішою через технічні виклики.

Однією з перших проблем стало опрацювання даних. Для навчання великої мовної моделі потрібні значні обсяги текстової інформації, і хоч в Україні є різноманітні архіви та документи, значна частина з них є юридично захищеною або не оцифрованою. Це призвело до необхідності проведення додаткової роботи. Паралельно важливо було створити систему анонімізації та перевірки даних, щоб уникнути порушень авторських прав і зберегти персональну інформацію.

Крім того, існує проблема нестачі кваліфікованих спеціалістів у сфері тренування великих мовних моделей. Глобальний ринок таких фахівців є надзвичайно конкурентним, і частину команди довелося формувати з інженерів з інших напрямків, яких потім навчали специфіці розробки LLM. Цей процес затягнувся на кілька місяців, і команду також підтримували зовнішні експерти.

Технічні складнощі виявилися більшими за очікування. Українська LLM будується не на традиційних Nvidia GPU, а на Google TPU, що вимагало адаптації до нових технологічних умов. Це означало необхідність перепроектування частини процесу навчання моделей.

Зараз проєкт перебуває на стадії завершення першої маломасштабної моделі, яка містить близько чотирьох мільярдів параметрів. Вона не призначена для ширшого використання, а слугує технічним полігоном для тестування всіх процесів, включаючи підготовку даних та оцінку якості відповідей. На цьому етапі команда працює над налаштуванням моделі, щоб вона адекватно реагувала на чутливі запити.

Учасники проєкту зазначають, що цей етап критично важливий для запобігання помилок у майбутньому, коли розроблятиметься більша модель. Завершити малу версію планують у другій половині року, після чого команда перейде до створення основної LLM, орієнтуючись на практичне використання.

Команда також змінила концепцію, відмовившись від проміжної моделі й вирішивши одразу перейти до великої системи, базуючись на новітній модель Google Gemma 4. Однак перехід на нову архітектуру вимагав адаптації вже існуючого токенайзера, що ускладнювало роботу.

Важливою складовою проєкту є акцент на українській мові. Багато світових моделей обробляють українські запити через англомовний проміжний шар, що призводить до втрати нюансів. Для цього команда формує спеціалізовані мовні корпуси обсягом у десятки терабайтів, що дозволить моделі працювати з українською без перекладів.

У рамках побудови правової архітектури проєкт залучає державні та недержавні організації для формування наборів даних. Впроваджуються механізми очищення даних, що містять персональну інформацію, а також створюється система національних бенчмарків для оцінки точності та етики роботи моделі.

Паралельно Україна розвиває власну AI-інфраструктуру через проєкт AI Factory, який передбачає створення обчислювальних кластерів. Деяке обладнання вже закуплено, а в подальшому планується розширення інфраструктури.

Незважаючи на труднощі, проєкт дотримується оновленого графіка, і велика українська LLM може бути готова до тестування до кінця 2026 року. Після цього її планується інтегрувати в національну інфраструктуру.

Таким чином, Україна має намір вирішити три важливі завдання: наздогнати глобальний розвиток штучного інтелекту, розробити власну мовну модель та закласти основу для цифрового суверенітету. Цей процес, що поєднує в собі технологічні, юридичні та кадрові виклики, визначатиме, чи зможе Україна стати не лише споживачем, а й розробником AI-систем.

Схожі статті