Керівник Центру досліджень фіскальної політики Віктор Мазярчук виступив на конференції APPS.UCU Generative AI Weekend в Українському католицькому університеті.
У своїй лекції під назвою «Від хаосу до системи: як ми будуємо прозоре управління через дані та дії» він розповів про проєкти Центру і як вони пов’язані з ШІ.
Далі – текст промови.
Перш за все завжди радий бути тут. У мене особливі емоції від цього місця. Незабутні. У мене сьогодні буде достатньо специфічна тематика, переважно про гроші (гроші всіх цікавлять), і де тут можна використовувати штучний інтелект. Бо інвестиції і таке інше – це класична дуже розвинута історія. Я більше буду говорити про гроші держави.
Сьогодні хочу зупинитись на трьох аспектах: люди, дані і візія.
Я не вірю в штучний інтелект. Я вірю в людей, які використовують штучний інтелект. Я вірю в людей, які знають, що роблять, і знають, чого вони хочуть досягти. Це базова штука. Спробую на прикладах розповісти, чому я так вважаю. Ми маємо феноменальних людей у нашій історії. Які творили нашу історію в минулому і які зараз творять нашу історію сучасності. Теоретики, практики – вони творять нашу історію.
Хто знає, що це за слайд? Це про нашу філософію. У ньому поєднуються декілька шарів. Передусім – це професійна глибина кожного з нас. Кожен – фахівець у своїй сфері. Це – середовище УКУ, яке об’єднує. Це – спільна робота. І я б ще сюди додав цінності. Ключова, найбільша цінність – це мультисекторальність.
Ще три роки тому я взагалі не мав жодного стосунку до data sсience. Моя професійна сфера – публічні фінанси. Але в якийсь момент вперся у стелю: коли ти розумієш, що дійшов до максимуму, ти не можеш далі розвиватися. Ти працюєш з великими даними, але ти не можеш їх аналізувати на іншому рівні. Тоді я почав поєднувати два сектори: свій професійний 13-річний досвід і новий для мене – це data sсience.
Трішки про нас. Про нашу команду. Ми команда аналітичного центру, NGO. Може трошки не класична NGO, тому що ми дуже вузькоспеціалізовані. Знаєте, як кажуть, бутікова. У нас єдина професійна тематика – публічні фінанси. Ми в інше не йдемо. І в нас є ще одна професійна тематика, яка прямо пов’язана з УКУ, – це data sсience. І я дуже радий, що зі мною в команді працюють люди, прямо чи опосередковано пов’язані з цим факультетом, з різних програм – і коротких, і довгих. Це синергія.
Знаю, що людей, які виходять з цього факультету, забирають “з руками і ногами”. Я їхав вчора сюди, мені колега каже: “Я готовий забрати навіть студентів, які завершують навчання, у Рахункову палату, тому що нам терміново треба працювати з даними”. Я людина, яка їм трошки допомагає зараз. Це велика проблема для них наразі. Чому? Тому що є величезні масиви даних, з якими ніхто або не працює, або мало працює, або не вміє працювати. І це перевага і можливість для інших включитись в цю тему і робити дуже класні продукти.
Отже ми вузькоспеціалізовані і працюємо виключно в публічних фінансах і data sсience. Якщо цікаво, можна перейти за цим посиланням і почитати більше про нас, про те, що ми робимо.
Ми працюємо з даними, з бюджетом, якщо коротко. Можливо, я та людина, яка бачить в бюджеті все, окрім таємної інформації і витрат на критичну інфраструктуру. Чому? Тому що знаю, де шукати. Це моя професійна тематика. Я використовую data sсience, щоб це бачити. Що ми робимо? Ми працюємо в 4-х великих блоках. Ми збираємо і верифікуємо дані, ми робимо різноманітні BI-інструменти, які допомагають громадськості та урядовцям розуміти, що відбувається, ми пишемо аналітику на основі наших даних. Ми розуміємо ці дані настільки, що інколи показуємо те, чого державні органи не знають, не бачать, тому що вони в глибину не заходять. І останнє – зібраними верифікованими даними ми ділимося з суспільством. Ми даємо чисті датасети – бери і використовуй. Це датасети, пов’язані з фінансуванням відновлення. Студенти сертифікаційних програм УКУ вже 3-й чи 4-й рік частково використовують наші дані і на їх основні роблять свої групові чи індивідуальні проєкти. Ви спитаєте, де ж тут штучний інтелект? До цього його не було. Зараз буде.
Якщо перейти за цим посиланням, ви побачите, що ми ще робимо подкасти. Чому подкасти? Одна з наших ідей – ми хочемо розповідати і пояснювати, що відбувається в економічній сфері, в тому, що ми робимо, максимально простою мовою. Запрошуємо цікавих спікерів. І ми зараз почали експериментувати. У мене давно було бажання зробити англомовний подкаст і шерити його на англомовну аудиторію. Власне моя розповідь про штучний інтелект почнеться з цього слайду. Ми робимо стандартний україномовний подкаст, використовуючи декілька елементів штучного інтелекту. Ми пишемо відео. З відео ми транскрибуємо текст. Наші працівники-комунікаційники цей текст обробляють, часом згладжують кострубатості, роблять його комфортним для читання. Тобто ми випускаємо звук, відео і текст. Але зараз ми ще почали робити повний англомовний клон. Ми робимо англомовний текст. Для цього використовуємо платний GPT для хорошого перекладу. Звичайно, ми його вичитуємо і приводимо до ладу, потім робимо voice cloning, щоб зробити його англомовним і шерити на англомовну аудиторію. Це такий невеличкий кейс, який можна достатньо просто зробити, не маючи сильних скілів у програмуванні, а використовуючи наявні інструменти. Що ми і робимо.
Другий великий блок – це дані. Те, що болить мені і всій моїй команді. Чому болить? Тому що ти береш дані, а там сумно. Зараз розповім про декілька кейсів.
Для мене ключова історія, з якою ми стикаємося, – ми постійно мусимо верифікувати дані з різних джерел, орієнтуючись на наявні бенчмарки. Україна – лідер по відкритих даних. Це взагалі фантастично. Це комунікаційно дуже класно. І дуже правильно, що Україна відкриває дані максимально. Якщо подивитися на глобальні тренди — світ рухається в той самий бік. Відкритих даних стає все більше. Бери, використовуй, аналізуй, створюй — головне, щоб ти розумів, для чого й навіщо. Мінцифри. Портал відкритих даних (www.data.gov.ua) – хто знає цей ресурс? Багато класної інформації. Реально молодці, що дані постійно відкриваються, навіть незважаючи на те, що йде війна. Їх можна використовувати.
Я буду говорити про власний досвід, про досвід нашої команди. Даних стає все більше і більше. Вони оновлюються з різною частотою. Так само класно, що є велика частина даних, які оновлюється щоденно. Про це треба також говорити, а не тільки казати, що все погано. Коли ми зустрічаємося з іноземними колегами і кажемо: “Дивіться, а ми робимо це, це і це”. Показуємо, що ми робимо. Вони питають: “Де ви взяли? Кажу: “Відкрито. Через API викачали всі дані вночі”. “А можна так? У нас такого немає”.
Другий і основний для нас ресурс, якому 10 років, який імплементувало Міністерство фінансів у 2015 році, але ініціатором якого стало громадянське суспільство, – єдиний вебпортал використання публічних коштів (www.spending.gov.ua). Це ресурс, на якому публікується інформація про щоденні платежі держави. І він для нас ключовий, тому що там платіжки – це те, за що держава чи органи місцевого самоврядування заплатили. Це факт. За 10 років у системі – 255-260 мільйонів платіжок. За цей рік – на 30 мільярдів гривень платіжок. Бери щоденні публікації, оновлення, монітор як хочеш. Тільки треба вміти цим користуватися, і якщо ми говоримо про дані, то треба, щоб ці дані були дуже якісні.
Фантастична ініціатива британців «Пікапи для миру», які допомагають нашій армії. Але ми ж не можемо просто так відпустити цих людей, ми хочемо їх прийняти, подякувати. Щоб організувати цю зустріч, Управління міжнародного розвитку Львівської ОВА оплатило кейтеринг – 20 тисяч гривень за фуршет, організацію, обслуговування. І що важливо – це все можна побачити. Я дуже люблю вперше показувати цей ресурс (www.spending.gov.ua) для студентів на факультеті, які вибирають мій курс по публічних фінансах, говорять: “О! Там же ж можна подивитись, що купили в моїй лікарні, чи за що заплатили”. Там є майже все.
Інша історія саме про ефективність використання коштів. Наприклад, можна подивитися, скільки управління освіти ОДА не використали коштів, які дала їм держава. Наприклад, по програмі нової української школи (НУШ) – кошти надаються на купівлю обладнання, підвищення кваліфікації викладачів тощо у Львівській області не використали 2,7 млн. грн. Ці кошти управління освіти Львівської ОДА повернуло в державний бюджет в минулому році. Чи знали, що таке є? Воно лежить на поверхні – бери і користуйся.
І третій ресурс, з яким ми постійно працюємо, втілюючи наші проєкти, – це Прозоро (www.prozorro.gov.ua). Там є всі закупівлі, тобто плани, що буде купуватися. І це клондайк. Чому? Бо якщо в платіжках Казначейства не так багато полів, то в Prozorro – понад 25 мільйонів закупівель і значно ширший обсяг даних. Там просто неймовірний датасет.
Бери, аналізуй, використовуй.
Це основні датасети, з якими ми працюємо, і зараз буду показувати, що ми робимо. Але перед тим поділюсь з вами ключовою проблемою, з якою ми стикаємося, – це якість даних. Картинка намальована штучним інтелектом. Логіка, що в даних, які генерує держава, є багато пустих місць, пробілів, які треба заповнювати.
За QR-кодом ви можете ознайомитись з нашим дослідженням за 2023 рік – наявність інформації та її повнота в платіжках у Spending. Є деякі міністерства та інституції, які не публікують дані про свої платіжки. Я цілком розумію, що сектор безпеки і оборони, критичної інфраструктури там не має бути. Але, вибачте, зарплата в Мінекономіки, в Мін’юсті попала під цю категорію. Чому? Тому що ці міністерства мають одну з програм, яка належить до критичної інфраструктури, і закрили все. Чи про цю проблему знають? Знають. Я особисто з чотирма заступниками міністра про це говорив. Всім байдуже. Не байдуже стає, коли ти починаєш публічно про це писати. Тоді до тебе приходять, говорять: “Ой ну що ти починаєш”. Я кажу: “Так вирішить проблему! Я не прошу, щоб ви відкривали критичну інформацію, відкрийте загальну”. Відповідь – “там складно”. Я кажу: “Не складно. Бажання немає”.
Інша цікава історія. Так виглядає платіжне доручення, яке Казначейство публікує. Там можна подивитися, хто заплатив, кому заплатив, скільки заплатив, за що заплатив. І тут має бути ідентифікатор Прозоро – закупівля, щоб розуміти, за що? Я взяв частину датасету, яка пов’язана з будівництвом. У будівництві точно мають бути закупівлі. Датасет за 2024 рік. 220 платіжок по капітальному будівництву, з яких тільки в частині є ідентифікатор. Все просто: є держава, вона має 2 своїх ресурси: закупівлі – Прозоро і оплати – Spending. Я хочу розуміти, як вони пов’язані. Пов’язані тільки на третину. Це по будівництву. Майже 150 мільярдів гривень ти не можеш прямо пов’язати із закупівлями, а коли ти робиш якісь ресурси, інтерактивні інструменти, тобі це обов’язково. Бо якщо в тебе немає якихось ключів, тобі важко працювати.
Інша історія. Виявив випадково. Вона не має великого масштабу, але вона системна. Час від часу опубліковані платіжки зникають. Просто зникають.
Як ми працюємо? Ми маємо свою інфраструктуру, сховища, і ми щоночі викачуємо десь 5 різних датасетів собі в сховище. І якось ми робимо певну звірку по даних і бачимо, що в нашій інформації цієї платіжки немає, а вона з’явилась на сайті Spending. Ми задумалися, взяли викачали все заново і почали по ключах дивитися. І побачили, що якісь платіжки додаються, якісь – забираються. Що може забиратись? Може забиратися критична інфраструктура. Випадково опублікували, побачили, схаменулися, забрали. Таке може бути, цілком окей. А тут реально взяв порівняв два датасети за 2024 рік, показав приклад, коли зараз публічно цієї інформації немає, але враховуючи, що ми щоденно викачуємо інформацію, вона в нас є в датасеті. Ми можемо розуміти, що щось може зникнути.
Третій блок, що може бути, – у нас ідентифікатор може бути неправильний. Один з прикладів – Харківський національний університет сплачує за неіснуючий тендер загалом на 1 100 000 грн. Тобто він вказав у платіжці тендер, якого тут немає. Це технічна одруківка, тому що тут малося на увазі скоріш за все 2023 рік. Але коли ти ключами автоматизуєш, в тебе нічого не автоматизується. Проблема є, несистемна, але коли ти моніториш якісь точкові речі, воно може вплинути.
Інша історія, теж з коректності даних платежів. Той самий Харківський університет сплачує за тендер іншого університету. Бачите, він сплачував за тендер, який оголосила Національна академія державної прикордонної служби України імені Богдана Хмельницького. Зовсім інший ідентифікатор. Спеціально/не спеціально, – важко сказати в даному випадку. У попередньому випадку, скоріш за все, не спеціально, або помилилися. Людський фактор завжди є. Класична історія – англійська “І” не дорівнює “І” українській. Коли ти працюєш з масивами даних, особливо коли ти шукаєш по ключових словах, для тебе це важливо. Тому перед тим, як починаєш працювати, ти маєш це розуміти. Коли ти це не враховуєш, у тебе частина датасету просто вилітає. Це реальність. Тому, коли ти не знаєш цих особливостей, в тебе на вході виявляється не повна картинка або спотворена. І на виході теж виявляється спотворена картинка, тому що ти не враховуєш все.
Цього пана знаєте? На жаль, знають всі. У перший день він заснував таке агентство як DOGE, Департамент ефективності уряду. Це дослівно перекладена стенограма того, що він казав на камеру, підписуючи цей наказ. “Сьогодні ми підпишемо дуже важливий наказ. Це DOGE. Я попрошу Ілона трошки розповісти вам про нього і про деякі речі, які ми виявили, які шокують. Мільярди і мільярди доларів марнотратства, шахрайства, зловживань. Я вважаю, що саме тому ми виграли вибори”. Ілон Маск як провідний спеціаліст, в тому числі в IT-сфері, мав це виправити, він мав успішний досвід у бізнес-середовищі. Що пообіцяв Маск? “Я тут вам швидко 2 трильйони доларів зекономлю”, – перша заява. Пройшов певний період часу, каже: “Два не виходить, але трильйончик зроблю”. У фіналі вийшло 150 млн дол., менше 10-ї частини. Для чого я слайд навів? Його філософія дуже проста. В Україні така ситуація вже мала місце. Коли політики тиснуть на тебе і залучають великих спеціалістів, зокрема з IT-сфери, які не знають контексту, можуть виходити дуже неоднозначні результати.
Я не певен, що ви цього хлопчину знаєте, можливо, чули. Був певний скандал, в тому числі в українських ЗМІ. Це молодий хлопець, фантастичний IT-спеціаліст, який власне був драйвером у цьому Департаменті ефективного управління, але він був поза контекстом. У результаті обіцянки, дані Трампу, не виконані. Маск пішов звідти. Тепер цей кейс вивчають професіонали у сфері публічних фінансів — як приклад того, що трапляється, коли бракує системного підходу.
Які проблеми? Наприклад, декілька раз були враховані попередньо скасовані договори. Або договір на 8 мільйонів раптом відображається як 8 мільярдів. Я тому і починав з людей, які є професійні і поєднують в собі декілька сфер і середовище. Я не дарма цю картинку в презентації використав (з презентації DataX Українського Католицького Університету – T-shaped person), тому що тут формується ціннісне середовище з професійними знаннями. Я знаю, що коли в мене виникає якесь питання, пов’язане з реалізацією нашого проєкту, я можу завжди сюди звернутись і тут допоможуть, підкажуть, зорієнтують. А найкраще – забрати звідси людей =. Я, наприклад, зараз маю можливість взяти на платне стажування на 4 місяці студента для роботи з даними. Якщо комусь цікаво буде на майбутнє.
Інший кейс, феноменальний. Це Велика Британія. Можливо, це один з найбільших фейлів в історії, пов’язаний з IT і з державним сектором. Британці дуже хотіли все цифровізувати в сфері охорони здоров’я. Вартість кейсу за всі роки – понад 6 мільярдів фунтів. Закрився. Якість даних проти системи, бюрократії і не тільки. Ми маємо розуміти, з ким ми працюємо. Якщо ти хочеш поламати систему, ти її маєш розуміти. Ще один приклад – зовсім недавній, але дуже показовий. Це вже про інший формат роботи з даними – коли державні органи свідомо маніпулюють інформацією, щоб виграти. Йдеться про рейтинг відкритості міст, який веде Transparency International. Дані були підтасовані – спеціалісти це помітили, відповідно, реакція не забарилася: “б’ють по руках”.
Останній блок – візія. Візія – це ключове, що нас рухає вперед. У кожного є своя візія – професійна, робоча, особиста Я поділюсь своєю робочою візією. Великого слона, як ви знаєте, треба їсти по невеликих частинах. І ми його їмо невеликими частинами.
Розкажу про три наші проєкти: відновлення Київської області, Фонд ліквідації наслідків збройної агресії і реформа шкільного харчування.
Що ми робимо? Коли ми створили громадську організацію, виникло ключове питання: чим ми будемо займатися, де ми є професійні? Ми розуміємо, що ми професійні в публічних фінансах. Ми розуміємо, що зараз велика проблема в тому, щоб в одному місці була інформація, скільки у нас коштує війна, хто ці гроші отримує, на що вони витрачаються і т.п. Ми виступили з ініціативою зібрати в одному місці і верифікувати дані про видатки, пов’язані з війною. Є різні блоки. Якщо це сектор безпеки і оборони – це тільки загальна інформація. А якщо це відновлення, фізичне, то це дуже деталізована інформація аж до компанії і об’єкту, за який заплачено. Ми почали допомагати Київській обласній військовій адміністрації. Чому їм? Тому що там працювали наші колеги. Говорю чесно. І вони були дуже зацікавлені. Кажуть: “Ось для нас ключова історія, особливо після скандалів, про які писали Наші гроші, Юрій Ніколов тощо, ми готові надавати всі дані. Що тобі треба – все дамо, допоможемо зібрати”.
Цей слайд ми зробили через 9 місяців спільної роботи, коли вони їхали на URC – це міжнародна щорічна конференція, пов’язана з відновленням. Вони його показували іноземним партнерам з таким посилом: все, що відбудовується в Київській області, можна побачити онлайн. Ви можете побачити, хто отримав кошти, які об’єкти. Прозорість – наше все.
Це був невеликий проєкт. Чому? Тому що ми показали одну область, тільки видатки з одного джерела. Водночас він був складний, тому що ми думали, шо багато знаємо. Наприклад, ми зрозуміли, що в нас на той момент не було чітко прописаних алгоритмів, що робимо, як робимо, які проблеми тощо. Коли ми зробили Київську область, з якими проблемами ми стикнулись. Ключова – дані ОДА знаходились в різних департаментах, інституціях, вони були розрізнені, вони часом були відсутні.
Наша ціль була верифікувати все. Що ми для себе зробили? У нас єдиний підхід до всього. Ось це ключова історія, з якою зараз ми маємо велику перевагу порівняно з іншими, в тому числі державними ресурсами. І ми почали використовувати різноманітні елементи штучного інтелекту, щоб це спрощувало нашу роботу. Чесно скажу, Київську область ми робили вручну. Ми мали зрозуміти дані, щоб потім це оптимізувати.
Сектор безпеки і оборони, критичну інфраструктуру ми не враховуємо. Наслідки війни теж поки не робили. Уже зробили верифікацію видатків на відновлення з державного бюджету й почали роботу над видатками, здійсненими за кошти міжнародних партнерів. Зараз збираємо дані. В 2025 році вже є 6,5 мільйонів платіжок. Ми щоденно викачуємо. Наприклад, за 6 травня – майже 93 000 платіжок. Ми вибрали одну. Нам потрібна була лише одна. За існуючими алгоритмами з масиву даних ми вибираємо тільки те, що нам треба, і собі окремо формуємо базу. У 2025 році – 1,3 мільйони закупівель. За 2 травня – майже 20 тис закупівель. 77 закупівель підпало під нашу оцінку. Тобто ми розуміємо, що вони пов’язані з інституціями, які їх проводять, які ми моніторимо, але жодна не класифікована, не відібрана до тих закупівель, які нас цікавлять.
Ми дуже часто звертаємося до уряду, говоримо: “Дайте дані”. Або звертаємося до органів місцевого самоврядування, говоримо: “Дайте дані, бо у нас щось не сходиться”. Ми звертаємося до державного ресурсу (OpenBudget), який дає публічну звітність про виконання бюджету. Це один з наших ключових бенчмарків, тому що тут дані Казначейства. Ми одні дані Казначейства порівнюємо з іншими даними казначейства і розуміємо, якщо чогось бракує, значить, ми йдемо туди і туди, і кажемо: “Друзі, у вас по такому об’єкту чогось немає, або дайте платіжки, або поясніть, що за нюанси”. Тому, коли ми показуємо дані, ми готові показувати до кожної копієчки.
У нас є ще такий певний «black box» для тих інституцій, які дуже не хочуть відповідати. Тоді ми запускаємо різноманітні запити, злісні звернення, щоб дали дані. Особливо ефективно працює електронне звернення через Урядовий портал – тоді часто дані таки надають. Зібрали, обробили, перевірили, структурували, поширили, дослідили, написали аналітику і даємо можливість всім скачати.
Я вже про це говорив – це сайт Київської області, на якому розміщений наш аналітичний дашборд. Я покажу усім, як він виглядає. Що на ньому можна побачити? У принципі все, куди пішли гроші. Є декілька блоків інформації. Можна подивитися видатки Фонду ліквідації, це видатки з державного бюджету. Дуже зручна система, ти можеш вибрати те, що тебе цікавить або по карті, або по фільтру. Або ти можеш вибрати компанію, яка безпосередньо тебе цікавить, і подивитися, де вона будує. І таким чином дійти до конкретного об’єкта, який відбудований, і подивитися, скільки коштів на нього пішло. І тут їх описова статистика об’єкта. Є державний бюджет, є місцеві бюджети. У Київській області все зібрано, в тому числі і видатки, здійснені за кошти наших міжнародних партнерів. Буде бажання – запрошую користуватися.
І ключове. Це для нас було принципово – ми ділимося даними. Ми, напевне, єдині з громадських організацій в Україні, хто так робить. Я хочу, щоб так робили всі. Тому це тебе дуже систематизує, плюс змушує максимально відповідально ставитись до даних.
Чи можемо ми робити помилки? Можемо, ми живі люди. Якщо зробили помилку, нам вказали, ми подякуємо. Визнали, вибачились, зрозуміли, чому так зробили, більше намагаємося не робити. Це наша відповідальність перед іншими. Зроблена велика робота. Беріть, користуйтеся. У першу чергу я запрошую наукові інституції, тому що це гарне джерело даних для того, щоб з ними щось робити.
3-й наш проєкт – про харчування дітей у школі. Це проєкт першої леді, направлений на модернізацію шкільного харчування у навчальних закладах. Логіка була така. Є три команди, не пов’язані між собою, яких залучила до реалізації цього проєкту Європейська антикорупційна ініціатива. І їх треба було склеїти. Кожна команда займається своїм. Є професійна команда львівських експертів, які дуже детально досліджують закупівлі. Вони дивляться майже 200 закупівель, оцінюють за 34 критеріями, ризиковані/не ризиковані, відбуваються/не відбуваються. І є команда, яка займається технаглядом, і вона дивиться кошториси, зокрема, чи завищені ціни чи не завищені. І на першому етапі завдяки цим двом командам вдалось зекономити або направити на інші школи майже 140 млн грн з 1,5 млрд грн, тобто 10%. Чому? Тому що подивилися і сказали: тут ціни завищені, а це обладнання сюди не потрібно, воно не підлягає держфінансуванню тощо.
Чому я хотів показати саме цей проєкт? Тут ми зробили щоденний моніторинг. 180 проєктів щоденно. З оновленням інформації на 9:00 ранку. Вночі скачується інформація, ми запускаємо наші алгоритми, вони оцінюють, ранком людина перевіряє і на 9:00 йде оновлення інформації, а люди, які це моніторять, зокрема Міністерство охорони здоров’я, вже можуть бачити, що відбувається і приймати певні управлінські рішення. Ми зробили також щотижневе оновлення для всієї команди з інформацією про те, що відбулося.
Тепер цікаві історії, пов’язані з якістю даних. На що я хотів звернути вашу увагу? Оце кількість тендерів, пов’язаних з нашим проєктом. Ми почали моніторити у серпні. У нас змінилась трошки технологія і фактично за новими технологіями ми почали моніторити з середини вересня. Моніторимо-моніторимо і бачимо, що третини об’єктів в нашому моніторингу немає взагалі. Це проблема, а ти не розумієш, у чому. А ми вже моніторимо 3 місяці. Ми починаємо розбиратися в ситуації, а дані про компанії, які здійснюють закупівлі, ми беремо з реєстрів, які веде держава. І ми розуміємо, що там дані некоректні по тих компаніях, які проводять ці закупівлі. Коли ми це з’ясували, ми вручну все перебрали і наблизились до чогось плюс-мінус адекватного в моніторингу.
Чому держава в своїх проєктах не завжди успішна? Тому що до введення даних в бази даних долучені дуже багато людей, які мають різний досвід спілкування з комп’ютером. І це безпосередньо впливає. Якщо ти просто береш дані держави, не думаючи, не знаючи ці особливості, ти будеш мати неповний датасет.
Друга історія – держава може змінювати правила гри. Що я маю на увазі? Вона може сказати: а ось у цієї школи ми забираємо фінансування, а ось цій даємо. І ти маєш перебирати датасет. На кінець року ми вже вийшли на повний постійний моніторинг всього, що нам досяжно. Коли до внесення даних в органах влади дотичні багато людей – епікфейл.
Я не вірю в державні проєкти, які не мають команд, що займаються верифікацію даних. Ми зараз маємо декілька величезних проєктів. Не хотів технічної складової, але буквально два слайди. Оцінка різних моделей. Ми пробували, тестували. Тестували і складні моделі, але нам найбільш якісно прогнозує і оцінює простіша модель.
Інший блок. Ми маємо верифіковані дані. Ми взяли наші верифіковані дані і взяли дані з державного реєстру по кожному об’єкту. Ось така картинка виходить. Все червоне. Чим більше червоного, тим більше відхилення. Як можна на основі таких даних робити будь-які управлінські рішення? Ніяк. Проблема в чому? Раз завантажити забули, хтось оновив, хтось не оновив. Оце велика проблема державного сектору, про яку не говорять.
Далі про повноту даних. Враховуючи, що ми самі трекаємо закупівлі, в нашій базі даних по реформі шкільного харчування майже 1100 закупівель, ми робимо класифікацію по різних типах закупівель, а в державному ресурсі – 600.
Тепер алгоритм нашої діяльності. Ми збираємо дані. Робимо відбір тих, які нам потрібні. Ми збираємо дані в нашу інфраструктуру, будуємо свою інфраструктуру. Дані обробляємо. Маємо свою модель, яка ідентифікує закупівлі, чи належать вони до об’єкту, який ми трекаємо, чи ні. Ми маємо невеличку класифікаційну модель, яка робить класифікацію типів закупівель. Нічого складного. Маємо низку дуже пророблених алгоритмів, яким чином ми трекаємо платежі, особливо, коли немає даних або дані неповні.
Верифікація. Трекаємо повноту даних в розрізі загалом всього великого проєкту, і в розрізі кожного окремого об’єкту. Якщо треба, збираємо додаткові дані, щоб наповнити все. І візуалізуємо.
Ми робимо повний дублікат, як я вже показував, англійською мовою. Є два ідентичних проєкти. Другий можна показувати міжнародним партнерам.
І ми працюємо активно з перевіркою задвоєнності, коректності даних маркувань і робимо підсумок за тиждень. Це не складно.
Моя візія – я хочу видатки капітального будівництва, які йдуть з державного бюджету, бачити у себе на дашборді, я хочу їх розуміти. Я хочу їх щоденно моніторити. Це так звана реформа PIM, яку підтримують наші міжнародні партнери. Там велика частина коштів наших міжнародних партнерів. Тобто, незважаючи на те, що я дивлюся видатки нашого бюджету, я дивлюся видатки, гроші на які нам дали наші міжнародні партнери. Я хочу це бачити в щоденному режимі. Якщо я зробив один проєкт, як ви думаєте, мені дуже сильно треба буде ускладнити, щоб зробити 5, 10 чи 50? Ну треба буде враховувати, звичайно, свої особливості, але в принципі не дуже сильно.
Останній слайд. Це QR-код на наш подкаст. Підписуйтеся, слухайте і ставте запитання.
Дякую!