Уявіть: вам потрібно знайти рівень середньої зарплати у Київській області за 2023 рік. Раніше це означало блукати десятками сторінок на застарілому сайті Держстату, завантажувати Excel-файл і вручну шукати потрібний рядок. Тепер достатньо зайти на stat.gov.ua, ввести запит своєю звичною мовою у вікно ШІ-асистента StatGPT – і ви отримаєте відповідь за кілька секунд.
Але цей портал, запущений 5 листопада 2025 року, лише частина цифрової трансформації Держстату. За нею стоять чотири роки роботи, ініційованої Міністерством цифрової трансформації на чолі з тодішнім міністром Михайлом Федоровим. Протягом цих років компанія EPAM разом із фахівцями Держстату перебудовувала не сайт, а цілу інституцію: від організаційної культури до технологічного фундаменту. Ініціативу підтримали швейцарсько-українська програма EGAP та Фонд Східна Європа. І все це відбувалося під час повномасштабного вторгнення.
Для партнерського тексту команди EPAM, Держстату та Microsoft розповідають, як за чотири роки вдалось перетворити одну з найбільших консервативних структур країни на сучасний сервіс даних зі штучним інтелектом.
Зміст
Держстат 2.0 у цифрах
- Єдина платформа «Сигма» замість 45 застарілих систем
- Понад 2000 статистичних показників у 109 наборах у банку даних.
- 5000 діалогів зі StatGPT за перші 2,5 місяці.
- 25 технічних фахівців у новій структурі – Центрі обробки статистичних даних.
- Від 10 до 70 спеціалістів EPAM працювали в проєкті в різні періоди.
- Друга інституція у світі (після МВФ), яка впровадила ШІ-асистент для статистики.
«Паровий потяг» на старих рейках
Щоб зрозуміти масштаб трансформації, потрібно побачити стартову точку.
Держстат, за словами учасників трансформації, був «дуже бюрократичною, совковою за духом структурою». На приблизно 90 статистичних спостережень використовували 45 різних інформаційних систем: незалежних, неінтегрованих, написаних у різний час. Деяким було уже 20-25 років, а найновішу впровадили у 2015-му.
«Просто приклад: одну з систем підтримував єдиний програміст. Після його смерті разом з ним зникли й усі знання про те, як вона працює, – розповідає Артем Рудько, заступник голови Держстату з питань цифрової трансформації. – Це була єдина людина, яка розуміла, як працює цей комплекс. Внести зміну вже нема кому».

Три базових етапи статистичного виробництва – збір інформації, обробка та поширення – існували як окремі, автоматично не пов’язані процеси. Зв’язок між виробництвом і публікацією виглядав так: департамент формував Excel-таблиці вручну і передавав іншому департаменту, який викладав файли на статичному сайті.
Навіть простий перелік областей України підтримували окремо в кожній системі. І, наприклад, перейменування одного населеного пункту означало ручні зміни в десятках незв’язаних баз.
Юрій Погребняк, програмний менеджер EPAM:
«Уявіть гігантський потяг, який працював на парі. Величезна кількість людей, аби він їхав, туди закидували вугілля. А завданням було перебудувати це на швидкісний електричний потяг».
Як формували нове бачення
EPAM виграла відкритий конкурс на реалізацію. Компанія мала не просто писати код, а стати стратегічним консультантом з міжнародним досвідом у GovTech. Завдання було масштабним: зробити так, щоб Держстат став повноцінною платформою, через яку користувачам зручно отримувати й використовувати статистику.
Спочатку була фаза дослідження і аудиту у 2021 році. Фахівці проаналізували понад десять вебсайтів статистичних агентств різних країн і сформували два ключових завдання: замінити «зоопарк» систем виробництва статистичних даних на єдину платформу та створити сучасний Портал для доступу до даних різним групам користувачів
«Візія, яка стала компасом трансформації – всі користувачі мають отримувати якісні, актуальні дані у зручний спосіб. Ефективні рішення неможливо приймати без якісних даних. Уряд, бізнес, науковці, журналісти, громадяни: кожен має отримувати зручний доступ до статистики. Саме ця ідея стала відправною точкою трансформації», – кажуть в EPAM.
Це означало змінити підходи сотень людей. Тому EPAM внесла до Держстату практики з IT-індустрії: гнучку методологію управління великими проєктами SAFe (Scaled Agile Framework), продуктове мислення, систему управління IT-послугами для підтримки користувачів, роботу з даними за міжнародними стандартами.
«Традиційно держпроєкти реалізуються за моделлю “великого вибуху”: довгі погодження і запуск лише в самому кінці, коли виправляти помилки вже дорого. Ми знайшли оптимум між державними процедурами та гнучкістю IT та застосували підхід Scaled Agile Framework (SAFe). Спочатку затверджується стратегічне завдання, а деталізація вимог відбувається під час розробки короткими двотижневими циклами. Це дозволяє замовнику коригувати систему в процесі, не порушуючи регламентів, але й не чекаючи на результат місяцями», – розповідає Погребняк.
Шлях до Європи
Внутрішні процеси змінилися, але для інтеграції у міжнародну статистичну спільноту цього замало: дані мають говорити однією мовою з рештою світу.
Ключовим стало впровадження стандарту SDMX (Statistical Data and Metadata eXchange) – міжнародного формату обміну статистичними даними, першу версію якого представили Світовий банк, МВФ, ООН та інші організації-партнери 21 рік тому. По суті, SDMX описує єдині правила, за якими статистичні дані пакуються, передаються та зчитуються. Завдяки цьому системи різних країн та міжнародних інституцій можуть автоматично обмінюватися даними без ручної конвертації чи додаткових адаптацій.
Це світовий стандарт, який використовують Євростат і ОЕСР. Для України він має пряме значення: без відповідності стандарту SDMX країна не зможе повноцінно інтегруватися в європейську статистичну систему. А це одна з обов’язкових вимог на шляху вступу до ЄС, адже Євростат приймає дані лише у сумісному форматі.
«Робити щось не відповідно до SDMX – це вигадувати колесо, – пояснює Рудько. – Ми вирішили фундаментально зберігати всю статистику відразу у правильному форматі»
«Без надійних, актуальних і порівнюваних даних жодна держава не може ефективно формувати політики та приймати обґрунтовані рішення. Те, що зробила Україна за ці роки, є прикладом для всієї європейської статистичної спільноти», – підкреслила Маріана Коцева, генеральна директорка Євростату, на презентації порталу.
Щоб українські дані можна було коректно порівнювати з міжнародними, їх довелося повністю перебудувати. Для користувачів порталу це також означало зміну звичного формату. Раніше статистики формували статичні звіти, намагаючись вгадати потреби користувача. Тепер дані структуровані у «куби», що дозволяє самостійно комбінувати будь-які показники та їхні розрізи.
Найпростіше це уявити так: звичайна таблиця має два виміри, рядки й стовпці. Куб додає третій, четвертий і більше вимірів. Наприклад, одне й те саме значення (скажімо, рівень безробіття) можна подивитися в розрізі області, року, статі, виду економічної діяльності. Кожна така комбінація параметрів дає один «зріз» куба. На практиці це працює як набір фільтрів: обираєте потрібну область, період, демографічну групу і отримуєте саме ті відомості, які вам потрібні, без зайвого.
Майже нова команда
Технології можна впровадити за місяці, але змінити культуру організації складніше.
Рудько зізнається: його очікування від бюрократичного спротиву були гіршими за реальність.
«Десь потрібно було не одну зустріч проводити, щоб переконати керівника департаменту, що зміни в процесах і технологіях йому на користь. Але так, щоб не вдалось переконати, таких випадків я не пам’ятаю», – каже він.
Трансформацією займалась гібридна група: на стороні EPAM у різні періоди працювало від десяти до сімдесяти спеціалістів, включаючи консультантів, архітекторів, розробників, дата-інженерів, фахівців з кібербезпеки та UX/UI-дизайнерів. Кожен напрямок мав свою пропорцію: десь більшість – експерти з EPAM, десь навпаки, спеціалісти компанії виступали менторами.
При цьому темп роботи визначався самою специфікою галузі. Офіційна статистика у всьому світі досить консервативна: щоб показники різних країн можна було порівнювати, всі публікують дані та впроваджують зміни одночасно. «Якщо одна з країн ЄС може оприлюднити показник лише у квітні, зведені дані по Євросоюзу з’являться не раніше. З технологіями так само», – пояснює Рудько.
Через це трансформація у статистичній службі відбувається повільніше, ніж у типовому ІТ-середовищі. Гібридній команді довелося це враховувати: рухатися швидко в технологічній частині й бути більш терплячими там, де трансформація зачіпала усталені процеси.
Активна фаза змін завершилась, але далі Держстат мав працювати самостійно та безперебійно. Тому у грудні 2022 року створили Центр обробки статистичних даних – окрему державну установу з умовами, наближеними до ринкових.
Артем Рудько, заступник голови Держстату з питань цифрової трансформації:
«Тут команда, яка формувалася фактично з нуля. До неї прийшли люди з різних сфер, без досвіду держслужби – з приватного сектору, з новими компетенціями і більш сучасним баченням того, як працювати з даними».
Сьогодні в Центрі працює близько 25 технічних фахівців. Окремо стартувала програма залучення студентів: вже з десяток молодих людей проходять практику, вносячи свіжі ідеї. «Ми, по суті, запустили незворотні процеси цифрової трансформації і передали це вже новій структурі Держстату», – підсумовують в EPAM.
Що вміє портал
Чотири роки підготовки завершилися запуском порталу stat.gov.ua. В основі працює платформа «Сигма», адаптована версія EPAM QuantHub для роботи з даними. Вона об’єднує весь процес в одному середовищі: від збору інформації до її обробки та публікації. Частину статистичних спостережень уже перевели на цю систему, інші додаватимуть поступово впродовж наступних років.
Для користувачів сайт пропонує кілька зручних форматів роботи: інтерактивні панелі (дашборди) з графіками та фільтрами, прямі посилання на конкретні таблиці, а також API, який дозволяє іншим системам автоматично отримувати потрібні дані.
«Зробити щось, що буде працювати роками без змін, неможливо. Змінюється користувач, змінюються світові тенденції, тому портал постійно вдосконалюється. І багато в чому ми покладаємося на фідбек користувача, на його щоденний практичний досвід роботи з даними», – говорить Рудько.
Одне з міністерств уже повністю перейшло на такий формат: їхні системи автоматично отримують оновлені показники від Держстату щоденно через API. Співробітники більше не шукають потрібні файли і не завантажують їх вручну. Організація один раз налаштувала з’єднання, і надалі все відбувається без дій вручну. Саме до такого підходу Держстат закликає всіх, хто працює з його статистикою на регулярній основі.
Спробувати оновлений портал можна за посиланням
ШІ як світовий тренд
Ще одна помітна інновація порталу – ШІ-асистент StatGPT. Користувач вводить запит звичайною мовою. Наприклад, «рівень середньої зарплати у Київській області за 2023 рік» і отримує потрібні цифри одразу. Для цього не потрібно розбиратися у структурі бази даних чи знати професійну термінологію. EPAM вперше показав цю технологію на Світовій конференції SDMX у Бахрейні в жовтні 2023 року, а версію 2.0, вже вбудовану в портал, продемонстрував на Статистичному форумі МВФ у 2024-му.
В основі StatGPT лежить велика мовна модель, але, на відміну від звичайного ШІ, вона не генерує відповіді самостійно. До моделі під’єднали три бази Держстату: глосарій статистичних термінів, індекс сторінок порталу та банк статистичних даних. Асистент шукає відповіді виключно в цих джерелах. Якщо потрібної інформації немає, система прямо про це повідомляє, а не вигадує цифри. Такий підхід називається RAG (Retrieval-Augmented Generation), і саме він захищає від так званих галюцинацій, коли мовна модель впевнено видає неправильну інформацію, а також від спроб маніпуляції, якщо користувач навмисно формулює запит, щоб отримати некоректну відповідь.
Технічно все побудовано на платформі EPAM DIAL з відкритим кодом.
«Система не може вивести жодну цифру, якщо вона не підтверджена даними з офіційної бази. Це принциповий момент: кожна відповідь має джерело, яке можна перевірити», – пояснює Рудько.
Але є принципове обмеження, яке одразу помічають користувачі: асистент знаходить дані, однак не аналізує їх. Наприклад, якщо запитати, де більше населення, у Дніпропетровській чи Вінницькій області, асистент покаже таблицю з двома цифрами, але відмовиться сказати, яка з них більша.
Як розповідають у Держстаті, це свідоме архітектурне рішення. Установа як державна інституція не може нести юридичну відповідальність за аналітичні висновки, згенеровані штучним інтелектом. Будь-яка інтерпретація, навіть найпростіше порівняння, це вже аналітика, і відповідальність за неї має бути на людині, а не на машині.
Окремим викликом стала україномовність: її створювали з нуля, адаптувавши понад 100 наборів даних за чотири-п’ять місяців. Розробники також створили навчальний бот для нових користувачів, і, за словами Рудька, цю ідею згодом перейняли для версії МВФ.
Війна і хмара
Варто врахувати й контекст, в якому відбувалася трансформація: основна фаза реалізації припала на час повномасштабного вторгнення. Платформу «Сигма» розмістили в захищеній хмарній інфраструктурі Microsoft Azure за межами України з багаторівневим захистом відповідно до міжнародних стандартів безпеки. В умовах ракетних обстрілів і ризиків для фізичної інфраструктури це було необхідністю. Партнерами у цьому процесі виступила компанія Microsoft.
Як пояснює Євген Кахановський, керівник Microsoft в Україні та країнах Балтії, Azure захищає дані Держстату на кількох рівнях:
- шифрування даних під час зберігання та передачі;
- контроль доступу за принципом Zero Trust (модель, за якої система не довіряє жодному запиту автоматично і перевіряє кожен окремо);
- географічне резервування (копії даних одночасно зберігаються в кількох дата-центрах у різних країнах);
- безперервний моніторинг кіберзагроз.
Платформа сертифікована за міжнародними стандартами безпеки ISO, проходить незалежний аудит захисту даних SOC і відповідає європейському регламенту захисту персональних даних GDPR.
«Це гарантує, що державні статистичні дані України залишаються захищеними, стійкими та доступними навіть в умовах воєнного часу», – підкреслює Кахановський.
StatGPT також працює на базі Microsoft AI, зокрема Azure OpenAI Service, у захищеному середовищі Azure. Дані залишаються повністю під контролем Держстату, а масштабована хмарна архітектура Azure забезпечує стабільну роботу сервісу навіть при зростанні навантаження.
Зміни тривають: що не було враховано
Чотири роки трансформації не обійшлися без прорахунків. «Найбільше ми недооцінили складність міграції даних. Недооцінили масштаб. Це вплинуло на час: могли б зберегти його і витратити на інші напрямки», – визнає Погребняк.
Щоб перенести десятки тисяч таблиць, потрібно було спочатку розробити методологію (як пов’язати різнорідні дані), потім написати скрипти для перенесення в «Сигму». Процес не завершений досі: на деяких спостереженнях історичні дані глибші, на інших менші.
Після запуску вилізли й показові баги. Наприклад, пошук не знаходив «ВВП»: абревіатура просто не була представлена в пошуковій моделі. Такі нюанси систематично виправляють, а для збору зворотного зв’язку створили експертну групу з 35 фахівців: науковців, журналістів, аналітиків.
Окремий виклик: люди, які десятиліттями працювали зі звичними інструментами, не одразу прийняли нову парадигму. «Навіть зміни на краще – це завжди важко, але з часом люди починають цінувати зручність нових інструментів», – коментують в EPAM.
Що далі
Запуск stat.gov.ua став точкою відліку, тому попереду ще кілька великих кроків.
Найближчий: у 2026 році на єдиному ресурсі з’явиться регіональна статистика. Зараз кожна з 25 областей має окремий застарілий сайт з власною структурою. Порівняти одну область з іншою, коли інформація розкидана по різних сайтах з різною логікою, складно. Все це об’єднають в одному місці.
Паралельно переміщатимуть десятки спостережень із старих систем на «Сигму», цей процес розрахований на три роки.
Водночас Держстат вже налагоджує обмін з податковою по даних РРО. У майбутньому це дозволить відстежувати ціни на продукти щодня, а не раз на квартал.
«Наступний рівень: повна автоматизація, – описує Погребняк. – Отримувати дані не через листи та Excel, а через пряму інтеграцію систем».
Відповідність SDMX означає, що українські показники вже сумісні з Євростатом, ОЕСР та Світовим банком без додаткової конвертації. За словами учасників проєкту трансформації, навіть не всі країни Європи мають настільки інтегровану систему.
У Microsoft цей кейс оцінюють як приклад цифрової стійкості. Державна установа в умовах активних бойових дій впровадила хмарну інфраструктуру, ШІ-інструменти для роботи з публічними даними та забезпечила відповідність міжнародним стандартам. За словами Євгена Кахановського, цей досвід демонструє, як сучасна цифрова інфраструктура здатна підтримувати безперервність роботи держави, прозорість та суспільну довіру навіть в екстремальних умовах, і може слугувати орієнтиром для державних установ у всьому світі.

“Ми прагнемо, щоб портал офіційної статистики став єдиною точкою доступу до офіційних даних, місцем, де користувач може швидко та зручно отримати відповіді на всі свої запитання в одному середовищі. А у перспективі об’єднати дані не лише Держстату, а й інших виробників офіційної статистики для більш повної картини всіх соціально-економічних процесів країни.”
Шлях від десятків розрізнених систем до єдиної платформи зайняв чотири роки та проходив в умовах війни. Сьогодні Держстат працює за новими міжнародними стандартами, має власну технічну групу, штучний інтелект для пошуку статистики й відкритий API. Врешті, справжня міра успіху реформи в тому, коли новий стандарт стає буденністю, а повернення до старого вже здається абсурдом.
Спробувати оновлений портал stat.gov.ua





Повідомити про помилку
Текст, який буде надіслано нашим редакторам: