
Уряд разом із провідним мобільним оператором працює над створенням національної системи штучного інтелекту для українців. Які переваги це принесе для держави, бізнесу та населення?
В Україні планують реалізувати перший масштабний національний проєкт у сфері мовних технологій, створивши велику мовну модель (LLM). Це не просто черговий стартап чи наукове дослідження, а серйозне національне підприємство, в рамках якого уряд прагне залучити мільйони українських текстів, охоплюючи різноманітні матеріали — від літератури до юридичних документів.
У Мінцифрі швидко вказали на важливість наявності потужного партнера, оскільки самостійно держава не зможе впоратися з цим завданням. Потрібен хтось із "технічним потенціалом", фінансовими ресурсами та знаннями про роботу інфраструктури штучного інтелекту (ШІ).
У червні було оголошено, що "Київстар" стане ключовим партнером держави у розробці LLM. Цей один із провідних телекомунікаційних операторів в Україні взяв на себе завдання, яке раніше не виконувалося в країні. Компанія зобов'язалася не лише сформувати команду та забезпечити технічну інфраструктуру, але й повністю профінансувати початковий етап проекту.
Це стало причиною здивування навіть серед деяких представників спільноти штучного інтелекту. Чому вибір впав саме на "Київстар"? Чи має компанія достатню експертизу, і які конкретно завдання вона планує реалізувати? Яка мета цього кроку для самого бізнесу?
Без відповідей залишилися й головні питання, які ставить собі будь-хто, хто живе в країні, де триває велика війна та економічна турбулентність: чи на часі така розробка? І що конкретно отримає від неї звичайна людина - не айтівець, не держслужбовець, а користувач, платник податків, громадянин?
Перед міністерством та мобільним оператором стоїть складне завдання: з одного боку, реалізувати те, чого ще ніхто в Україні не робив - створити національну LLM, а з іншого - долучити нашу державу до клубу країн, які вже мають власні ШІ-рішення.
Елітарність цього клубу зумовлена, насамперед, ресурсами, необхідними для розробки власної LLM. Це питання не лише фінансових вкладень, але й наявності спеціалістів та технологічної інфраструктури. Для успішної роботи потрібні команди лінгвістів, аналітиків даних, DevOps-інженерів, фахівців з етики штучного інтелекту та стратегів у сфері обробки даних. Без такої комплексної екосистеми модель може залишитися недосконалою або малоефективною.
Частину людських ресурсів можуть забезпечити наукова спільнота та ІТ-сектор, а фінансову - "Київстар". Найбільшим викликом залишатиметься створення та підтримка інфраструктури для розгортання вітчизняної LLM.
Ще в квітні технічний директор нового ШІ-центру при Мінцифрі Дмитро Овчаренко зазначав, що для створення моделі "з нуля" в Україні недостатньо обчислювальних потужностей. Тому в міністерстві одразу вирішили обрати інший підхід — використання вже існуючих open-source моделей, які можна вільно застосовувати, та їх донавчання на українських даних (fine-tuning). Це виявилося значно менш затратним по ресурсах і швидшим процесом.
Щоб проілюструвати цю ідею, процес навчання "з нуля" можна уподібнити до моменту, коли дитину навчають основам читання, письма та логічного мислення. У той час як fine-tune нагадує етап, коли вона отримує спеціалізовану освіту, скажімо, в галузі бухгалтерії чи права.
Цей метод активно застосовується як в державних програмах, так і в бізнесі. Наприклад, українська IT-фірма MacPaw нещодавно презентувала свого ШІ-асистента Eney, розробленого на базі LLaMA 3.2 Instruct, який був адаптований для специфічних потреб компанії.
Відтак виникає питання: а яку саме відкриту модель оберуть для національної LLM? Найперше важливо розуміти, що у світі всього кілька десятків компаній розробляють LLM. Лише обмежена кількість моделей є масштабними, високопродуктивними та конкурентоспроможними на глобальному рівні. При цьому більшість відомих моделей, як-от від OpenAI або Google, не є відкритими. Вони доступні лише через API - власний інтерфейс без розкриття архітектури чи ваг.
Отже, вибір відкритих моделей для навчання насправді є обмеженим. У світі можна нарахувати менше ніж двадцять компаній, які займаються розробкою та публікацією власних LLM з відкритим кодом. Проте навіть серед цих компаній не всі дозволяють комерційне використання своїх моделей: наприклад, Meta забороняє їх комерційне застосування без отримання окремої ліцензії.
"Теоретично, все виглядає просто: є дані, інфраструктура, і можна приступати до етапу тонкого налаштування. Проте на практиці це становитиме виклик, оскільки в Україні такий проект ще ніхто не втілював. Оцінити ймовірність успіху вкрай складно, адже немає подібних прикладів і не на кого спиратися", - зазначає генеральний директор DevRain Олександр Краковецький.
"На даний момент ми перебуваємо на початковому етапі дослідження та розробки, за підсумками якого буде обрана конкретна open-source архітектура для подальшого налаштування. Вирішення цього питання буде здійснене на основі технічних і прикладних критеріїв", - зазначає Михайло Нестор, директор з розробки цифрових продуктів компанії "Київстар" та CPO у Kyivstar.Tech, який відповідає за проєкт з боку оператора.
Одне можна сказати точно: рішення китайських ШІ-компанії як то DeepSeek AI, не будуть розглядатись. Принаймні так заявляли у Мінцифри.
Тенденція розробки суверенних технологій штучного інтелекту набирає обертів у багатьох країнах. Це стосується не лише провідних економік, які вже витрачають мільярди на розвиток штучного інтелекту, але й держав з аналогічними до України прагненнями, що бажають створити власну мовну модель, адаптовану до специфічних місцевих вимог.
У дослідженні, проведеному Українським католицьким університетом (УКУ), підкреслюється, що національний штучний інтелект розглядається урядами різних країн як ключовий чинник для вдосконалення освіти, електронного управління, охорони здоров'я, економічного зростання та навіть підвищення рівня національної безпеки.
Наприклад, Болгарія та Греція працюють над власними LLM: BgGPT та Meltemi. Їх використовують в освітньому процесі, щоб генерувати завдання, відповідати на запитання й пояснювати складні поняття. Модель BgGPT вже показала результативність на рівні шкільних іспитів, іноді навіть вищу за ChatGPT та LLaMA.
У Швеції, де спостерігається нестача робочих ресурсів внаслідок старіння населення, розробляється GPT-SW3. Ця модель призначена для автоматизації роботи з текстовими документами у державному секторі та вирішення проблеми недостачі кадрів.
Один з найактуальніших трендів сьогодні — це впровадження штучного інтелекту в державні послуги. В Албанії функціонує віртуальний асистент, який спрощує процес подачі заявок на державні сервіси. У найближчих планах — розробка національної мовної моделі, що дозволить перекладати юридичні документи в рамках підготовки до вступу в Європейський Союз.
За словами співрозмовника ЕП у Мінцифрі, держава дивиться в напрямку покращення надання послуг для громадян і пришвидшення роботи всередині уряду. Це один із пріоритетів самого міністра Михайла Федорова.
Нестор з компанії "Київстар" зазначає, що важливою характеристикою української LLM є її здатність глибоко розуміти українську мову. Модель буде враховувати різноманітні діалекти, семантичні деталі та точність термінології. Це відкриє можливості для її використання в сферах, де важлива мовна чутливість, таких як право, медицина та державне управління.
І на завершення, варто підкреслити важливий аспект – цифровий розрив. Штучний інтелект стає ключовим фактором економічних перетворень. Якщо Україна не розробить власну модель, вона опиниться в залежності від зовнішніх рішень, які часто не відповідають нашим мовним та культурним особливостям. Національний ШІ забезпечить доступ до інструментів, які дійсно враховують українську реальність, сприяючи розвитку бізнесу, освіти та державних структур, щоб не відставати у світових технологічних змаганнях.
Аби створити по-справжньому українську мовну модель, технічної інфраструктури недостатньо. Головне "паливо" для ШІ - це дані, а саме українські дані, яких досі ніхто в таких масштабах не збирав і не впорядковував для тренування мовної моделі.
Цю ініціативу реалізує Міністерство цифрової трансформації. Відомство відповідає за організацію всіх етапів розробки моделі, охоплюючи як технічні, так і етичні аспекти. У зв'язку з цим створюються три основні органи: координаційний комітет, технічна рада та етична рада.
Перший з учасників буде відповідальний за формування загальної стратегії та концепції проєкту. У його склад увійдуть представники Міністерства цифрової трансформації, зокрема фахівці ШІ-центру, а також представники інших державних органів, команда "Київстару" та експерти з обох консультативних рад.
Етична рада контролюватиме виконання законодавчих вимог, норм конфіденційності та етичних принципів. У той же час, технічна група відповідатиме за архітектурні рішення моделі, процеси навчання, підготовку даних та забезпечення високої якості фінального продукту.
Щодо даних, Мінцифра повідомила ЕП, що для навчання буде використовуватися корпус українських текстів з відкритих джерел. Розглядаються різні датасети, серед яких "Малюк" (113 Гб тексту), NER-UK, UA-GEC та інші. Проте остаточне рішення поки що не прийнято.
Одночасно команда міністерства займається пошуками менш очевидних, але вкрай цінних джерел. Це рідкісні українські матеріали, які формально доступні, проте розкидані по архівах бібліотек, державних установ та наукових фондів. Планується їхнє об'єднання за участю університетів, національних бібліотек і наукових центрів.
"Наша мета полягає в зборі цих даних. Це дозволить створити модель, яка дійсно відображатиме українську культуру та контекст, що відсутні в закордонних варіантах," - зазначають у Мінцифрі.
За їх словами, це дасть змогу моделі краще розуміти українську мову в усій її повноті - з діалектами, термінами, історичними реаліями. Вона зможе давати змістовні, точні й мовно вивірені відповіді на питання про війну, історію чи культуру.
Окремо готується ініціатива, яка дозволить авторам "задонатити" свої тексти на навчання моделі. Адже LLM - це вже новий спосіб знайти інформацію. Коли українці ставитимуть їй питання, це можливість для авторів бути присутніми в цьому загальному контексті.
Ідею висловив Краковецький з DevRain у подкасті "Шілософія", де він зазначив, що українські медіа також могли б долучитися до процесу збору даних. Проте він підкреслив, що не існує прецедентів передачі даних, оскільки залишається невизначеним, як вирішити питання авторських прав.
У Мінцифрі підкреслюють, що до моделі не буде завантажено жодних особистих або конфіденційних даних. Всі дані підлягатимуть процесу очищення та анонімізації, що забезпечить захист і приватність користувачів.
У травні міністр Федоров оголосив, що Україна перебуває в процесі переговорів з однією з провідних міжнародних компаній стосовно розробки національної інфраструктури штучного інтелекту. Він підкреслив, що ця інфраструктура буде повністю реалізована на території країни з урахуванням військових та безпекових викликів.
З самого початку в Міністерстві цифрової трансформації підкреслювали, що реалізація проєкту української LLM неможлива без залучення партнерів. Хоча в Україні є достатня кількість кваліфікованих спеціалістів, компаній, які активно займаються штучним інтелектом, поки що недостатньо. Тому в експертних колах тривалий час виникали припущення, що до співпраці буде запрошено одного з великих західних гравців.
Однак на відкритий запит держави несподівано відгукнувся "Київстар". Це здивувало багатьох. "Я думав, що це буде консорціум типу Microsoft, держава, якийсь науковий центр, можливо інфраструктурний партнер. А поки виглядає так, що просто сказали: "Київстар, зроби". З одного боку, це простіше: одна компанія, одна відповідальність. З іншого - питання лишаються", - розповідає власник однієї з компаній ІТ-компаній, який працює у сфері ШІ.
Втім, партнер визначений, тому тепер важливо зрозуміти його роль. За словами представників компанії, "Київстар" виступає операційним виконавцем: саме він створює проєктний офіс, добирає команду, відповідає за інфраструктуру й забезпечує обчислювальні потужності для попереднього етапу навчання моделі.
Повне фінансування проекту здійснює оператор, що виглядає цілком обґрунтовано, враховуючи воєнний стан та постійні бюджетні обмеження. Сподіватися на державні кошти в рамках такого проєкту було б недоцільно. У компанії "Київстар" оцінюють загальну вартість розробки близько 2 мільйонів доларів, що є помірною сумою в контексті індустрії штучного інтелекту.
Фінансові ресурси будуть в основному використані для оренди необхідної інфраструктури та виплати заробітної плати. Власну інфраструктуру наразі не планують розвивати, оскільки це є тривалим і складним процесом, який не відповідає швидкості реалізації проєкту.
"На даний момент в Україні спостерігається нестача спеціалізованих графічних процесорів, які необхідні для навчання таких моделей. Тому ми маємо намір залучати ресурси дата-центрів хмарних провайдерів. Одночасно в Україні буде здійснюватися поступове розширення GPU-інфраструктури", - зазначив Нестор.
Чому це вигідно самому "Київстару"? Офіційно це спосіб здобути експертизу у сфері ШІ та використовувати модель для власних рішень. Але є й інші, не менш вагомі фактори.
В останні кілька місяців компанія активно демонструє свій інтерес до українського технологічного сектора, особливо в контексті угод злиття та поглинання. Вона встановлює міжнародні альянси, зокрема, уклала нещодавно угоду з SpaceX, та готується до виходу на фондовий ринок: найближчим часом частка акцій "Київстару" з'явиться на біржі. У такій ситуації участь у розробці національної LLM сприймається не лише як вираження громадянської позиції, а й як стратегічна інвестиція в імідж та вплив компанії.
Першу версію української мовної моделі (LLM) планують розробити протягом дев'яти місяців. На старті вона функціонуватиме в режимі бета-тестування. "В цей час державні, наукові, соціальні та освітні організації матимуть можливість завантажити модель і перевірити її функціональність. Після завершення тестування модель буде передана державі та опублікована у відкритому доступі", - зазначає Нестор з "Київстару".
Після запуску модель планують інтегрувати у державні сервіси, зокрема в "Дію". Один із перших прикладних продуктів - інструмент для перекладу та аналізу європейського законодавства. Наразі над ним працює WINWIN AI Center of Excellence. Такий сервіс може суттєво пришвидшити процес євроінтеграції. Подібних рішень, які допомагатимуть державі в "операційці", в міністерстві обіцяють ще більше.
З появою великих мовних моделей (LLM) можливості функціоналу "Дії" значно розширяться. Він повинен стати універсальним інструментом для взаємодії громадян із державними структурами, надаючи можливість отримувати більшість послуг за принципом єдиного вікна.
У Міністерстві цифрової трансформації сподіваються, що українські підприємства почнуть розробляти власні рішення в галузі штучного інтелекту. "Компанії отримають реальну можливість запускати персоналізовані чат-боти та ШІ-агентів для мільйонів людей. Ми прагнемо, щоб в Україні з'явився свій аналог ChatGPT. Проте це, скоріше, завдання для ринку, а не для держави," – зазначають у міністерстві.
У "Київстар" повідомляють, що компанії можуть взяти участь у бета-тестуванні. Для цього необхідно надіслати відповідну заявку. У майбутньому планується введення комерційних рішень на основі LLM, які будуть доступні як через API, так і для локального розгортання на серверах клієнтів.
Окреме питання: якою буде українська LLM за обсягом. Оскільки open-source архітектуру ще не визначено, говорити про точні параметри зарано. Утім, навряд чи варто очікувати на рішення, які здатні конкурувати з найпотужнішими моделями OpenAI.
Згідно з висловлюванням Овчаренка з ШІ-центру Мінцифри, основна увага приділяється моделям з кількістю параметрів від 1 до 16 мільярдів. Цей діапазон дозволяє досягти оптимального співвідношення між продуктивністю і використанням ресурсів: моделі до 7 мільярдів можна ефективно запускати на одному графічному процесорі, тоді як моделі обсягом 13-16 мільярдів потребують для роботи невеликих кластерів, що складаються з декількох з'єднаних комп'ютерів або серверів.
Досвід роботи з моделями LLaMA, Gemma і Mistral демонструє, що належним чином підготовлені середні моделі здатні досягати високої якості в завданнях класифікації, генерації та мовного розуміння, зокрема в контексті локалізації.
"Невеликі та середні моделі мають перевагу в простоті запуску та тонкому налаштуванні під специфічні вимоги, адже саме для цього вони розроблені. Вони споживають менше ресурсів, але здатні демонструвати вищу ефективність при роботі з узкоспеціалізованими наборами даних або в рамках конкретних завдань", - підкреслює Краковецький.
Однак, незалежно від обставин, повністю зрозуміти, яким чином виглядатиме та, що важливо, як функціонуватиме український суверенний штучний інтелект, можна буде лише після його широкого впровадження.
#Google #Microsoft #Київстар #SpaceX #Європейський Союз #Європа #Економіка #Україна #Українці #Бізнес #Китай (регіон) #Інфраструктура #Українська мова #Болгарія #Штучний інтелект #Модель #Швеція #Медицина #Держава (політичний устрій) #Греція #Етика #OpenAI #ChatGPT #Архітектура #Експертиза #Український католицький університет #Мета-платформи #Юриспруденція #Албанія #Магістр права #Програмне забезпечення з відкритим кодом #API #Діалект #Бібліотека #Семантика