Идея банальна: я хотел проверить гипотезу о том, что активность группы влияет на число новых членов группы.
Новая дискуссия, новый коммент отображается в ленте того, кто постит, это видят друзья запостившего, соответственно, они могут пройти по ссылкам и принять решение присоединиться к группе.
В итоге я сегодня менее чем за 15 минут скачал инфо о количестве новых членах, количестве постов и комментов в трех группах на Линкедине.
Результаты посчитал по трем группам, выбрав по принципу максимального разброса по показателям активности и роста
Таблица средних значений по группам
Я посчитал по каждой группе линейную регрессию, где Y - новые члены группы за неделю, Х1 - количество комментов в неделю, а Х2 - количество новых дискуссий в неделю.
R^2 = 10, 08
Уравнение значимо, и значима только одна переменная: количество дискуссий - коэффициент 0,36 и константа 14, 88 (тоже значима)
Диаграмма 1.
График зависимости фактических значений (Y) и предсказанных значений (X)
Заметно некоторое нарушение гетероскедастичности - при низких показателях X
R^2 = 0,68
Значимы обе переменные, причем коэффициент комментов - 0, 4, по дискуссиям - 3, 2.
Если посмотреть на график, то заметно, что хвост слева явно оказывает влияние на показатели регрессии, поэтому я персчитал показатели для периода, когда группа начинает жить активно - с мая 2012 года
R^2 - 0, 31
Значимы обе переменные по прежнему, комменты с коэффициентом - 0, 2 и дискуссии - 3, 53
Вот как например выглядит график зависимости количества новых членов от числа дискуссий (я взял только часть периода - начиная с мая 2012 года, когда группа стала развиваться). Если исключить три верхних поинта, то линия регрессии сместится вниз и станет описывать распределение чуть лучше.
R^2 - 0, 46
В уравнении значима переменная комментов, но если сравнить отдельные года, то в 2012 году значимы обе перменные - и комменты, и дискуссии, а в 2013 не значимы обе переменные.
Но самое забавное возникает при анализе графиков зависимости
На графике очевидно, что зависимость числа новых членов подчиняется не линейной, а степенной зависимости: динамика роста числа новых членов снижается с ростом комментариев.
Что в общем вполне интуитивно ясно. Перtсчитанный R^2 степенной функции равен 0, 56, уравнение значимо
Но тем не менее, даже просто визуальный анализ графиков зависимости показывает, что результаты регрессии можно принять и констатировать взаимосвязь между активностью в группе и ростом числа новых членов. Взаимосвязь, а не влияние.
Полученные результаты не позволяют сделать вывод о влиянии количества комментов на число новых членов. В противном случае эффект был бы выявлен на всех группах. Ну или структура была бы примерно похожей. Поэтому взаимосвязь количества комментов и числа новых членов это, скорее, производная менеджмента группы.
И пример последней группы, SELL YOUR HEAD, достаточно четко демонстрирует это.
Модераторы и хозяева групп: вот вам маячок для подражания. Создайте свою степенную функцию)
Новая дискуссия, новый коммент отображается в ленте того, кто постит, это видят друзья запостившего, соответственно, они могут пройти по ссылкам и принять решение присоединиться к группе.
Благодарность
Прежде всего хочу выразить благодарность Кириллу Захарову - не знаю, как представить, наверное напишу, что профессия и призвание - аналитик. Кирилл несколько часов подарил мне, чтобы объяснить, как скачивать информацию с Dashboard группы в Линке информацию. И без него этот пост просто не появился бы.В итоге я сегодня менее чем за 15 минут скачал инфо о количестве новых членах, количестве постов и комментов в трех группах на Линкедине.
Результаты
Результаты неоднозначные, прошу помощи в интерпретации: если есть какие-то идеи, буду благодаренРезультаты посчитал по трем группам, выбрав по принципу максимального разброса по показателям активности и роста
Таблица средних значений по группам
новые члены
|
комменты
|
дискуссии
|
|
HR Professionals
Network Russia, CIS countries and Eastern Europe
|
18,7
|
2,8
|
10,0
|
HRM.RU
|
45,1
|
53,1
|
8,4
|
SELL YOUR HEAD
|
253,6
|
318,5
|
36,5
|
HR Professionals Network Russia, CIS countries and Eastern Europe
можно охарактеризовать как мертвую: достаточно посмотреть на количество комментов и дискуссий. При этом группа имеет давнюю историю, создавалась иностранцем, но видимо он потерял интерес и теперь в группе постят в основном рекламуR^2 = 10, 08
Уравнение значимо, и значима только одна переменная: количество дискуссий - коэффициент 0,36 и константа 14, 88 (тоже значима)
Диаграмма 1.
График зависимости фактических значений (Y) и предсказанных значений (X)
Заметно некоторое нарушение гетероскедастичности - при низких показателях X
HRM.RU
Группа достаточна жесткая в плане цензуры: в некотором смысле можно сказать, что количество дискуссий и комментов - есть управляемый показатель. Очень высока содержательная роль модератора / хозяина - сам участвует почти во всех дискуссиях.R^2 = 0,68
Значимы обе переменные, причем коэффициент комментов - 0, 4, по дискуссиям - 3, 2.
Если посмотреть на график, то заметно, что хвост слева явно оказывает влияние на показатели регрессии, поэтому я персчитал показатели для периода, когда группа начинает жить активно - с мая 2012 года
R^2 - 0, 31
Значимы обе переменные по прежнему, комменты с коэффициентом - 0, 2 и дискуссии - 3, 53
Вот как например выглядит график зависимости количества новых членов от числа дискуссий (я взял только часть периода - начиная с мая 2012 года, когда группа стала развиваться). Если исключить три верхних поинта, то линия регрессии сместится вниз и станет описывать распределение чуть лучше.
SELL YOUR HEAD
Группа, где роль модератора тоже высока, но именно как модератора: создаются все условия для промоушена группы, группа раскручена, но при этом модератор практически не вмешивается содержательно в сами дискуссии. И сами дискуссии во многом - вакансии.R^2 - 0, 46
В уравнении значима переменная комментов, но если сравнить отдельные года, то в 2012 году значимы обе перменные - и комменты, и дискуссии, а в 2013 не значимы обе переменные.
Но самое забавное возникает при анализе графиков зависимости
На графике очевидно, что зависимость числа новых членов подчиняется не линейной, а степенной зависимости: динамика роста числа новых членов снижается с ростом комментариев.
Что в общем вполне интуитивно ясно. Перtсчитанный R^2 степенной функции равен 0, 56, уравнение значимо
Обсуждение результатов
Думаю, что часть результатов можно объяснить масштабами измерения: т.е. если мы меряем корреляцию между весом и ростом людей, то эта корреляция будет меньше, чем если бы мы в выборку добавили слонов (с последними корреляция возрастет).Но тем не менее, даже просто визуальный анализ графиков зависимости показывает, что результаты регрессии можно принять и констатировать взаимосвязь между активностью в группе и ростом числа новых членов. Взаимосвязь, а не влияние.
Полученные результаты не позволяют сделать вывод о влиянии количества комментов на число новых членов. В противном случае эффект был бы выявлен на всех группах. Ну или структура была бы примерно похожей. Поэтому взаимосвязь количества комментов и числа новых членов это, скорее, производная менеджмента группы.
И пример последней группы, SELL YOUR HEAD, достаточно четко демонстрирует это.
Модераторы и хозяева групп: вот вам маячок для подражания. Создайте свою степенную функцию)
А сможете провести анализ влияния на результат поиска работы (если безработный) или смены работы благодаря линкедину, или просто изменение занятости членов группы, было бы интересно. Максим.
ОтветитьУдалитьэто как? поясните
Удалить