Гендерний розподіл керівників юридичних осіб та фізичних осіб–підприємців в Україні

В Україні відсутня система збору і публікації гендерних даних щодо керівників бізнесу. Втім, відкриття даних та нові можливості використання інноваційних підходів до обробки даних дозволяють зробити ...

гендер
Гендерний розподіл керівників юридичних осіб та фізичних осіб–підприємців в Україні

В Україні відсутня система збору і публікації гендерних даних щодо керівників бізнесу. Втім, відкриття даних та нові можливості використання інноваційних підходів до обробки даних дозволяють зробити певні висновки щодо гендерного розподілу керівників бізнесу, державних підприємств, ФОП-ів.

В рамках проекту Програми розвитку ООН в Україні «Зміцнення бізнес-об’єднань малих і середніх підприємств», експерти Українського центру суспільних даних у співпраці з Лігою ділових та професійних жінок України провели дослідження гендерного розподілу серед керівників підприємств та ФОП-ів в України, розглянувши ситуацію в цілому, а також у розрізі регіонів та видів діяльності.

Дослідження було проведено на основі відкритих даних – Єдиного державного реєстру юридичних осіб, фізичних осіб – підприємців та громадських формувань (ЄДРПОУ), що його публікує Міністерство юстиції України, починаючи з квітня 2016 року на порталі відкритих даних (data.gov.ua). В аналізі були використані дані, опубліковані 5 травня 2017 року.

Хоча у публічно доступних файлах Мінюсту і відсутнє окреме поле «стать», вони містять прізвище, ім’я та по-батькові керівників та фізосіб-підприємців. Таким, чином, спеціальними програмними засобами можна ідентифікувати стать особи в реєстрі, виходячи із закінчення по-батькові («-івна», «-ївна» для жінок).

Всього записів у масиві даних: 6 003 695

Проаналізовано лише тих юридичних осіб та ФОП-ів, що є діючими (зареєстрованими станом на 5 травня 2017 року, не припинено діяльність, не порушено справу про банкрутство, тощо). Таких серед усього реєстру є 2 767 403. Серед них теж було чимало керівників, чию стать визначити було неможливо (переважно, неслов’янські імена, відсутність по-батькові), серед юросіб: 15 828, фізосіб: 20 420.

Відповідно до реєстраційних даних Мінюсту, розподіл серед усіх суб’єктів господарської діяльності зараз – 60%/40% на користь чоловіків.

chart1

При цьому, серед фізичних осіб – підприємців, розподіл чоловіків і жінок стає вже майже 50/50, а серед керівників юридичних осіб гендерний розрив суттєво зростає (70% керівників юридичних осіб в Україні, відповідно до даних ЄДРПОУ, є чоловіками).

chart2chart3

 

Для визначення регіональних особливостей, з адрес реєстрації виокремили назву області. На жаль, якість даних в ЄДРПОУ є неідеальною, і не у всіх записах можна визначити регіон (область) реєстрації. Для 1259 (0.02%) об’єктів область не визначено.

chart4-region

map-ukraine

Для гендерного аналізу за галузями використовувалися КВЕДи – коди видів економічної діяльності. Так само, не для усіх записів у базі можна було ідентифікувати основний КВЕД. (поле порожнє, вказано 00.00.0 або 88.88.8). Тобто, 0.04% від діючих СГД – або 1241 із 2 767 403 не мають КВЕД, придатного до аналізу.

На діаграмі нижче видно, що жінки переважають серед керівників юридичних осіб та ФОП-ів, основний КВЕД яких належить до розділу “Роздрібна торгівля, крім торгівлі автотранспортними засобами та мотоциклами”. Також майже абсолютно “жіночим” є розділ КВЕД “Надання інших індивідуальних послуг”, розділ КВЕД “Освіта”.

KvedUkraine

Наявні дані дозволяють робити більш детальні аналізи у гендерному плані – в регіональному розрізі, чи у розрізі деталізованих видів економічної діяльності. Втім, важливо розуміти обмеження цих даних, некоректність екстраполяції висновків, аналізу на основі цих даних щодо явищ, які безпосередньо не зафіксовані показниками ЄДРПОУ.

Низька якість даних ЄДРПОУ

Відкриття даних є надзвичайно важливим процесом, і наш аналіз, що став можливим завдяки відкриттю Мінюстом даних ЄДРПОУ, є ще одним підтвердженням. Втім, під час роботи з наборами даних ЄДРПОУ експерти Українського центру суспільних даних виявили, що дані ЄДРПОУ – доволі низької якості, і не відповідають стандартам «охайних даних».

Місцезнаходження. Для адреси у наборі даних – лише одне поле, нема розбивки на область, район, і тд. Відповідно, для аналізу даних за регіонами необхідно було спеціальними програмнимxи засобами обробляти масив даних, створювати окремі змінні, і приводити до уніфікованого вигляду. Назви містять латинську літеру «і», топоніми іноді містять латинську «с». На жаль, в масиві відсутні коди КОАТУУ, які б дозволили суттєво спростити пошук інформації та аналіз в регіональному вимірі.

Види діяльності. В масиві бувають записи, в яких відсутні види діяльності (КВЕДи). Таких у базі – 5%.

Стать. Як уже згадували вище, у реєстрі відсутній параметр стать (особи, що вказана керівником юридичної особи, або ФОП-а). Аналіз за статтю ми здійснювали за закінченнями в по-батькові.

Імена. З іменами керівників теж не все так просто. В реєстрі далеко не у всіх слов’янських іменах присутні по-батькові – що не дає в автоматизованому режимі визначити стать – відповідно до нашого алгоритму. Є певний відсоток іноземних імен в масиві – що так унеможливлює однозначно визначити їх стать.  Окрім того, для близько 4% записів у масиві імена взагалі відсутні. Бувають і такі варіанти:

Capture

КВЕДи. Дотепер в Україні змінили одна одну три системи класифікації видів економічної діяльності — ДК 009-96, КВЕД-2005 та КВЕД-2010 (діє зараз). Відповідно, в реєсті наявна різна класифікація кодування видів економічної діяльності, що також ускладнює процес дослідження, оскільки потребує приведення  кодів ДК 009-96 та  КВЕД-2005 до КВЕД-2010.

Наші рекомендації щодо вдосконалення масиву відкритих даних ЄДРПОУ:

  • Додати поле «стать» (керівника юрособи або ФОП)
  • Додати поле «КОАТУУ» (для однозначної ідентифікації населеного пункту, і його регіону)
  • Розділити поле «Місцезнаходження» на окремі поля (індекс, область, район, населений пункт, тощо)
  • Додати поле «Форма власності» / організаційно-правова форма
  • Привести коди ДК 009-96 та  КВЕД-2005 до КВЕД-2010.
  • Виправити наявні помилки та одруківки

Окремо слід відзначити, що формат оприлюднення даних Реєстру в даному випадку не є оптимальним вибором для оприлюднюваних даних. Формат XML є надто складним для даних Реєстру, які по суті являють собою просту прямокутну таблицю і не вимагають таких можливостей, як підтримка складних типів даних, або ж підтримки ієрархії даних.

Такий підхід ускладнює парсинг (розбір) даних, що негативно впливає на швидкість розробки відповідного програмного забезпечення, і згодом на швидкість обробки файлів XML, які до того ж і великі за розміром. Крім цього, файли XML мають незрозумілі порожні рядки між вузлами.

Отже, використання формату CSV дозволяє зменшити розмір файлів з даними реєстру в середньому у 2 рази, не кажучи вже про простоту синтаксичного розбору.

 

Дослідження підготовлено в рамках проекту Програми розвитку ООН в Україні «Зміцнення бізнес-об’єднань малих і середніх підприємств», що впроваджується за фінансової підтримки Державного секретаріату Швейцарії з економічних питань.

Джерело – Український центр суспільних даних


Тематика публікації:      

Останні публікації цього розділу:

Рух відкритих даних: досвід Великобританії для транспарентності місцевої влади на Харківщині та в Україні

ZDOROVI отримали від МОЗ статус критично важливого підприємства у військовий час для функціонування економіки та забезпечення життєдіяльності населення

ІДІ розпочинає проєкт спрямований на людей з інвалідністю в постраждалій від війни Україні

Як Ківерцівська громада впровадила інструмент публічних онлайн-консультацій з жителями

Завершується відбір на участь у форумі «Нові громадські організації: від ідеї до дії»

Мистецтво без бар'єрів: у Тернополі людей з інвалідністю залучатимуть до громадських активностей