Не очень люблю методологические посты писать. Но в данной ситуации ситуация перезрела, поэтому хотел бы обозначить свою позицию на этом счет. Для нашего рынка важно, поскольку мы можем получить очередную лажу типа компетентностного подхода: связи с бизнес результатами нет, но рынок измерения компетенций в России десятки миллионов долларов. Деньги на ветер. Вот я бы и хотел предостеречь от подобной практики в отношении гендерного разнообразия.
В посте коснусь только гендерного разнообразия и в двух пластах:
Нужно ли нам гендерное разнообразие? (на примере Что?Где?Когда?)), то я с ними абсолютно согласен!
С точки зрения академических исследований это важно. Вопрос в том, что гендерное разнообразие чаще всего понимается не в академическом ключе, а вполне в бизнесовом, например, в политике рекрутинга.
Гендерное разнообразие в рекрутинге понимается как сочетание мужчин и женщин. Все! Без контроля других факторов. Давайте посмотрим на примеры:
Результат через diversity - это исследование компании McKinsey. Посмотрите и найдите, где компания контролирует какие то факторы кроме гендера? Опыт работы, компетенции, профессионализм? Нет, вот картинка корреляции между гендерным разнообразием и эффективностью компании.
Вот еще более откровенная статья McKinsey - Why diversity matters. Я просто процитирую несколько фраз из статьи:
У меня к сожалению, не такой уверенности.
Итого, возвращаясь к определению diversity, скажу, что для бизнеса гендерное diversity это % соотношение мужчин и женщин без требования контроля других факторов.
Понятно, что на словах будут требовать профессионализма, но по факту рекрутерам надо будет выдерживать, например, 30/70.
И опасность, о которой я хочу предупредить рынок (и это главный пафос моих постов про diversity): мы в практиках гендерного разнообразия опять получим лажу типа компетентностного подхода, когда не очень порядочные консалтеры будут осваивать бюджеты по diversity на российском рынке.
Но в реальных боевых условиях в отличие от лабораторных у нас нет возможности учесть и проконтролировать факторы, поэтому на примере ЧтоГдеКогда я предскажу, что мы получим.
В нашем кейсе мы с определенной долей уверенности можем выделить только пол игроков. Все остальное - под сильным вопросом, насколько это точно можно вытащить (я общался с админом сайта). Но если мы вытащим, например, опыт игры (сколько лет игрок выступает в лиге ЧтоГдеКогда), то сможем учесть этот фактор в модели.
И вот здесь возникает вопрос: а как мы с вами будем считать "влияние"?
Можно вытащить уровни опыта и по этажам посчитать связь гендера и успешности команды. Но правильно ли это будет? При преобразовании числовой переменной в категориальную мы теряем часть информации.
Поэтому в идеале стоило бы включить в уравнение две переменные: гендерное разнообразие (число женщин в команде) и разнообразие опыта (ну например, дисперсия стажа игры) плюс средний стаж игры команды.
Логика заключается в том, что если за выявленной связью различия в гендере команд (Влияние гендера команды на успешность в игре ЧТО ГДЕ КОГДА) стоит реально меньший стаж женщин в игре, то переменная "diversity" (в нашем случае число женщин) будет не значима. Проблема измерения в нашем случае заключается в том, что зависимая переменная не нормально распрелена, поэтому лучшим алгоритмом для уравнения будет какой-либо из непараметрических алгоритмов, и мы просто не получим значимости предиктора, в получим F scores на диаграмме Feature Importance.
Но по опыту построения подобных моделей могу сказать, что алгоритмы типа RandomForest или Xgboost смогут выжать из переменной "diversity" F баллы.
Будет ли это доказательством влияния гендерного разнообразия на эффективность? Не уверен. Но позволит ли в данном случае переменная "diversity" делать более точный прогноз? Да.
__________________________________________________________
На этом все, читайте нас в фейсбуке, телеграмме и вконтакте
В посте коснусь только гендерного разнообразия и в двух пластах:
- определение термина diversity или контекста использования diversity;
- о причинности / корреляции и проблеме измерения влияния diversity в моделях эффективности.
О термине diversity
Когда представители академического Мира возражают мне, что нельзя diversity измерять просто по соотношению мужчин и женщин, что необходимо проконтролировать и уравнять другие факторы, такие как, например, стаж игры в ЧтоГдеКогда (см. например Влияние гендера команды на успешность в игре ЧТО ГДЕ КОГДА или вот замечательная статья Александра ВечеринаНужно ли нам гендерное разнообразие? (на примере Что?Где?Когда?)), то я с ними абсолютно согласен!
С точки зрения академических исследований это важно. Вопрос в том, что гендерное разнообразие чаще всего понимается не в академическом ключе, а вполне в бизнесовом, например, в политике рекрутинга.
Гендерное разнообразие в рекрутинге понимается как сочетание мужчин и женщин. Все! Без контроля других факторов. Давайте посмотрим на примеры:
Результат через diversity - это исследование компании McKinsey. Посмотрите и найдите, где компания контролирует какие то факторы кроме гендера? Опыт работы, компетенции, профессионализм? Нет, вот картинка корреляции между гендерным разнообразием и эффективностью компании.
Вот еще более откровенная статья McKinsey - Why diversity matters. Я просто процитирую несколько фраз из статьи:
- We know intuitively that diversity matters.
- While correlation does not equal causation (greater gender and ethnic diversity in corporate leadership doesn’t automatically translate into more profit), the correlation does indicate that when companies commit themselves to diverse leadership, they are more successful.
- More diverse companies, we believe, are better able to win top talent and improve their customer orientation, employee satisfaction, and decision making, and all that leads to a virtuous cycle of increasing returns.
- Racial and ethnic diversity has a stronger impact on financial performance in the United States than gender diversity
Вот так: "know intuitively", "we believe", а потом уже откровенно пишут про "stronger impact" (!!!)
Поэтому я, кстати, ответил McKinsey своим постом Влияние гендера команды на успешность в игре ЧТО ГДЕ КОГДА . Но думаю, что в обоих случаях влияния нет. Если в случае ЧГК стоит, скорее всего, неравномерность стажа игры, то в случае McKinsey сыграла, скорее всего, мода на разнообразие: просто более "инновативные" компании типа Google позволяют себе следовать за модой и набирать больше женщин, и поэтому влияние в случае таких компаний, на мой взгляд, обратное: не компания более эффективная вследствие того, что туда набирают больше женщин, а больше женщин, потому что компания более эффективная и позволяет себе заниматься чудачествами типа подбора женщин, ассессмент центров, вовлеченности персонала и прочей ..... А нижний квартиль компаний по эффективности занят выживанием, ему некогда разбираться с diversity. Но это только моя гипотеза.
Проблема для бизнеса
Ничего бы страшного не случилось, если бы это было про исследования Академического Мира. Проблема в том, что вот такое понимание разнообразия переходит в бизнес. Рекрутингу отдается команда: обеспечиваем вот такое % соотношение мужчин и женщин.
Вы не думаете, что в этом месте возникает конфликт в процедуре отбора кандидатов, когда в угоду diversity будут отбрасывать более профессиональных кандидатов? Я задал вопрос в нашем телеграм канале:
Вот представьте, что Вы работаете в компании, которая провозгласила приверженной diversity.И Вы должны набирать 30 % дам разработчиков, 70 % мужчин (ситуация Google).Видите ли Вы конфликт в даной ситуации, когда в угоду политике diversity в некоторых ситуациях вместо профессионалов будут брать подходящих под определение diversity? Или этот конфликт легко обойти?
- Во-первых, у нас проголосовало всего 38 человек, что мало, и скорее всего, это говорит о том, что проблема не актуальна для наших HR.
- В-вторых, что важнее, бОльшая часть не видит в этом проблемы, или скорее, видит себя способными обойти эту проблему.
У меня к сожалению, не такой уверенности.
Итого, возвращаясь к определению diversity, скажу, что для бизнеса гендерное diversity это % соотношение мужчин и женщин без требования контроля других факторов.
Понятно, что на словах будут требовать профессионализма, но по факту рекрутерам надо будет выдерживать, например, 30/70.
И опасность, о которой я хочу предупредить рынок (и это главный пафос моих постов про diversity): мы в практиках гендерного разнообразия опять получим лажу типа компетентностного подхода, когда не очень порядочные консалтеры будут осваивать бюджеты по diversity на российском рынке.
Проблема измерения влияния diversity на эффективность
Строго говоря, пол (для меня пол и гендер - одно и тоже, уж простите. Если у человека висит пиписка, это М, если не висит - это Ж)в принципе не влияет, поскольку он лишь опосредует влияние других факторов, как, например, в данном кейсе- Что делает команду более умной? Больше женщин - за влиянием гендера стояла социальная сензитивность, поэтому с т.з. отбора более грамотно стоило ориентироваться на отбор по данному качеству.
- Отбираем "звезд" на этапе подбора с помощью тестов - или в данном кейсе, где за гендером стоит бОльшая доминантность мужчин, социальная уверенность и все такое.
Но в реальных боевых условиях в отличие от лабораторных у нас нет возможности учесть и проконтролировать факторы, поэтому на примере ЧтоГдеКогда я предскажу, что мы получим.
В нашем кейсе мы с определенной долей уверенности можем выделить только пол игроков. Все остальное - под сильным вопросом, насколько это точно можно вытащить (я общался с админом сайта). Но если мы вытащим, например, опыт игры (сколько лет игрок выступает в лиге ЧтоГдеКогда), то сможем учесть этот фактор в модели.
И вот здесь возникает вопрос: а как мы с вами будем считать "влияние"?
Можно вытащить уровни опыта и по этажам посчитать связь гендера и успешности команды. Но правильно ли это будет? При преобразовании числовой переменной в категориальную мы теряем часть информации.
Поэтому в идеале стоило бы включить в уравнение две переменные: гендерное разнообразие (число женщин в команде) и разнообразие опыта (ну например, дисперсия стажа игры) плюс средний стаж игры команды.
Логика заключается в том, что если за выявленной связью различия в гендере команд (Влияние гендера команды на успешность в игре ЧТО ГДЕ КОГДА) стоит реально меньший стаж женщин в игре, то переменная "diversity" (в нашем случае число женщин) будет не значима. Проблема измерения в нашем случае заключается в том, что зависимая переменная не нормально распрелена, поэтому лучшим алгоритмом для уравнения будет какой-либо из непараметрических алгоритмов, и мы просто не получим значимости предиктора, в получим F scores на диаграмме Feature Importance.
Но по опыту построения подобных моделей могу сказать, что алгоритмы типа RandomForest или Xgboost смогут выжать из переменной "diversity" F баллы.
Будет ли это доказательством влияния гендерного разнообразия на эффективность? Не уверен. Но позволит ли в данном случае переменная "diversity" делать более точный прогноз? Да.
__________________________________________________________
На этом все, читайте нас в фейсбуке, телеграмме и вконтакте
Комментариев нет:
Отправить комментарий