Thank you points: мережевий аналіз соціальних зв'язків усередині DataArt

5 лютого
Святослав Зборовський, Data Analyst
Thank you points: мережевий аналіз соціальних зв'язків усередині DataArt
Святослав Зборовський з BI-команди DataArt дослідив, кому з колег найчастіше дякують за допомогою корпоративної системи. Він розповів, як швидко побудувати й оптимізувати граф та які кластери йому вдалося на ньому виділити.

DataArt — досить велика IT-компанія, у 22 наших офісах в 11 країнах працює понад 4000 осіб. Багато проектних команд розподілені по різних містах, взаємодія між колегами і до початку пандемії COVID-19 часто відбувалась онлайн. Ще дев'ять років тому в компанії придумали спосіб дистанційно подякувати колезі за допомогою TYPs — Thank you points. Це аналог внутрішньої валюти, не прив'язаний до бонусів, зарплат або стажу. Їх можна надсилати тим, хто вам допоміг, отримувати від тих, для кого щось хороше зробили ви самі, та обмінювати на сувеніри: кружки, рюкзаки, павербанки, гумових качечок тощо. Докладніше про те , як працює система TYPs, можна почитати тут.

image

Ілюстрація зі статті про тіпсову систему в DataArt (жовтень 2019)

Я влаштувався у компанію рік тому. Розібравшись із внутрішніми системами, зокрема інститутом тіпсів, я зацікавився, кому колеги зазвичай дякують. Чи багатьом людям надсилають “дякую” (адже кількість балів кожен колега має обмежену)? Які зв'язки і групи всередині системи можна побачити, оцінивши обмін тіпсами? Усі дарують усім? Чи компанія розбита на невеликі кластери — гуртки за інтересами? Щоб відповісти на ці запитання, я вирішив побудувати мережевий граф.

Одразу обмовлюся, що тіпси, які нараховуються колегам від імені компанії (щомісяця кожному та додатково за участь у конференціях і внутрішніх івентах, написання статей тощо), у дослідженні я не брав до уваги. Адже це не класичне “дякую” від одного колеги іншому.

На графіку нижче можна побачити динаміку кількості подяк колег за останні чотири роки. Вгадайте причину пікових значень наприкінці кожного року (спойлер: співробітники вітають один одного з Новим роком).

Важливе зауваження: протягом останніх чотирьох років кількість співробітників компанії постійно зростає, відповідно, кількість подарованих тіпсів теж збільшується. Тому на графіку я показав метрику, що показує відношення кількості подарованих тіпсів протягом місяця до кількості колег. Так можна побачити дійсний показник частоти дарування тіпсів.

Graphics

Динаміка кількості подарованих Thank you points на одну людину

Як інструмент я вибрав Gephi. Використовувати його зручніше, ніж вручну писати власну програму мовою R/Python чи будь-якою іншою, яка дозволяє досліджувати мережі. По-перше, у Gephi простіше налаштовувати укладку мережі, по-друге, в ній передбачене зручне регулювання розміру і кольору тексту, що дозволяє без зайвих зусиль полегшити читання графа.

Початковий датасет мав формат таблиці зв'язків і складався з 46 896 рядків — окремих фактів дарування тіпсів. З 2011 року саме стільки разів колеги офіційно подякували один одному всередині системи обліку робочого часу. Виглядає це приблизно так:

black

Тому для полегшення графа я застосував фільтр degree > 50, інакше кажучи, залишив на ньому лише колег, у яких виявлено понад 50 зв'язків (фактів дарування та/або отримання тіпсів).

Поекспериментувавши з укладанням, я зупинився на Fruchterman Reingold. Виглядало це так:

black chaos

До відфільтрованого графа я додав статистику модулярності для виявлення кластерів. Їх виявилося вісім. Далі змінив розмір вузлів так, щоб великі точки відповідали людям, які отримують особливо багато тіпсів. Це дозволило виявити головних героїв у кожному кластері.

Фінальна візуалізація виглядає так:

coloured chaos

Але хто всі ці люди? Яка логіка об'єднує їх у кластери? Щоб розібратись у цьому, я додав таблицю вузлів, яка відображає на графі імена колег. На жаль, із міркувань конфіденційності, до статті такі дані я додати не можу, проте можу розповісти, що вдалося встановити за їхньою допомогою.

Блакитним кольором (20,61 % усіх спостережень) представлені колеги з невеликого центру розробки, розташованого у порівняно невеликому місті. DataArt там є дуже сильним гравцем на ринку праці, водночас професійна спільнота загалом невелика. У цих умовах місцевий офіс посідає у житті колег значне місце, між собою вони спілкуються дуже тісно, ​​навіть будучи зайнятими в різних проектах. Це наочно відображається в частих “дякую”. Лідери — HR-менеджери, сисадміни, бухгалтери та найдосвідченіші інженери, які виступають менторами для практикантів та активно беруть участь у житті локального центру розробки: проводять вебінари, представляють в офісі результати своєї роботи і цікаві кейси, виступають на конференціях з доповідями, які подобаються колегам. Центральний великий вузол — інженер хелпдеска.

Зелений (18.88 %) — навпаки, колеги з найбільшого (дивно!) офісу, розташованого в нестоличному місті середнього розміру. Проте, тут картина інша: загалом люди рідше відправляють один одному тіпси, а яскраво виражених “улюбленців” взагалі не мають. Найімовірніше, у колег просто хороші горизонтальні стосунки.

Фіолетовий (18,88 %) — менеджери, які допомагають планувати відрядження і рахувати бюджети, та учасники внутрішньої BI-команди. Вони мають виражену категорію “шанувальників”, до якої входять менеджери проектів, делівері менеджери, тімліди і синьорні розробники, що частіше за інших виїжджають в офіси клієнтів.

Чорний (15,45 %) — це “хороші люди”, яким однаково часто дякують колеги найрізноманітніших рівнів і спеціалізацій. Найбільші чорні точки — системні адміністратори, крім них, до категорії потрапляють офіс-менеджери і викладачі англійської.

Помаранчевий (11,59 %) об'єднує топ-менеджмент, HR-менеджерів і тих, хто займається просуванням компанії на ринках праці. Всі ці люди розвивають бренд DataArt як роботодавця та, хоча працюють у різних командах і департаментах, регулярно спілкуються та дякують один одному. Ця тенденція простежується протягом усіх дев'яти років роботи системи, тому об'єднати таких колег в один кластер цілком логічно.

Червоним кольором (6,87 %) позначена ще одна невелика локація. Найбільші точки — два системні адміністратори і головний HR, який дійсно багато часу приділяє спілкуванню з колегами і багато в чому об'єднує їх між собою.

Темно-зелений (3,86 %) — знову сисадміни, проте не прив'язані до певного офісу. Вони допомагають налаштовувати віртуальні оточення, налагоджують роботу корпоративних систем та консультують колег з різних міст і країн. Тому й певної групи, представники якої дякували б їм частіше за інших, виявити неможливо. Їм рівною мірою вдячні всі співробітники компанії — за це вони й отримали окремий кластер.

Жовтий (3,86 %) — розробники внутрішніх систем PM і EDU, де ми ведемо облік робочого часу, стежимо за динамікою активності у проектах, акумулюємо навчальні курси та спілкуємось між собою. У цих системах відображене вся життя компанії, тому колеги з різних проектів і країн досить часто дякують тим, хто над ними працює.

Гадаю, що отриманий граф досить точно відображає горизонтальні зв'язки всередині компанії, але за межами окремих проектів і акаунтів. Не дуже дивно, що особливе місце на схемі посіли системні адміністратори, але вона ще раз доводить те, наскільки високо їх цінують колеги!

Граф будувався на історії тіпсових зв'язків протягом усього періоду існування інституту Thank you points. Якщо повторити таке саме дослідження на вибірці року чи півріччя, структура кластерів зміниться. Найбільшими кластерами будуть великі проекти, де в обраному проміжку часу стався успішний реліз. Решта кластерів сформують звичні локальні зв'язки та подяки менеджерам, сисадмінам і викладачам англійської.

Можу припустити, що досвід мого невеликого дослідження може стати у пригоді тим, хто хоче краще зрозуміти соціальну структуру всередині свого колективу. Чи справді колеги добре ставляться один до одного? Кому вони готові часто дякувати? До того ж таке дослідження допомагає виявити, здавалося б, непомітних героїв, яких варто заохотити не лише за допомогою звичайного “дякую”.