Есть замечательный сайт с зарплатами игроков NHL - NHL Salary Rankings.
Зарплаты игроков даны в разрезе команд, амплуа, годов. Я скачал данные 2019 года - просто ради прикола и хочу поделиться.
Здесь по оси X - зарплата в миллионах долларов, по оси Y - количество игроков, которые получают зарплату в таком размере. Т.е. например, зарплату от 5 до 6 миллиона долларов получают 75 игроков. Описательные статистики такие
Т.е. 3/4 игроков получают менее 4 343 750 $! Я думал, они там побогаче будут.
Здесь также зарплата в миллионах долларов $, прикол в том, что несмотря на видимые различия (медиана зарплаты правого нападающего почти 2 мил $, а левого края - чуть выше 1 миллиона долларов), значимых различий нет! Следовательно, у нас нет данных, чтобы сказать о связи амплуа и уровня зарплаты.
Самая высокая медиана зарплата в Каролине харрикейнс, но значимость различий выше 0, 05, поэтому мы делаем вывод: если вы хотите играть в NHL, то не выбирайте команду по уровню зарплаты, они все примерно одинаковы.
Зарплаты игроков даны в разрезе команд, амплуа, годов. Я скачал данные 2019 года - просто ради прикола и хочу поделиться.
Здесь по оси X - зарплата в миллионах долларов, по оси Y - количество игроков, которые получают зарплату в таком размере. Т.е. например, зарплату от 5 до 6 миллиона долларов получают 75 игроков. Описательные статистики такие
- Min. 569355
- 1st Qu. 792500
- Median 1475000
- Mean 2829389
- 3rd Qu. 4343750
- Max. 16000000
Т.е. 3/4 игроков получают менее 4 343 750 $! Я думал, они там побогаче будут.
В разрезе амплуа
Здесь также зарплата в миллионах долларов $, прикол в том, что несмотря на видимые различия (медиана зарплаты правого нападающего почти 2 мил $, а левого края - чуть выше 1 миллиона долларов), значимых различий нет! Следовательно, у нас нет данных, чтобы сказать о связи амплуа и уровня зарплаты.
В разрезе команд
Самая высокая медиана зарплата в Каролине харрикейнс, но значимость различий выше 0, 05, поэтому мы делаем вывод: если вы хотите играть в NHL, то не выбирайте команду по уровню зарплаты, они все примерно одинаковы.
Код
Если кто-то хочет скачать данные и провести свой анализ, делюсь кодом (а еще лучше приходите на Он-лайн курс "Введение в R для HR")library(rvest) team = c('anaheim-ducks' , 'arizona-coyotes', 'boston-bruins', 'buffalo-sabres', 'calgary-flames', 'carolina-hurricanes', 'chicago-blackhawks', 'colorado-avalanche', 'columbus-blue-jackets', 'dallas-stars', 'detroit-red-wings', 'edmonton-oilers', 'florida-panthers', 'los-angeles-kings', 'minnesota-wild', 'montreal-canadiens', 'nashville-predators', 'new-jersey-devils', 'new-york-islanders', 'new-york-rangers', 'ottawa-senators', 'philadelphia-flyers', 'pittsburgh-penguins', 'san-jose-sharks', 'st-louis-blues', 'tampa-bay-lightning', 'toronto-maple-leafs', 'vancouver-canucks', 'vegas-golden-knights', 'washington-capitals', 'winnipeg-jets') y = NULL; for(i in team) { k=html_table(html_nodes(read_html(paste0('https://www.spotrac.com/nhl/rankings/cash/',i,'/')), "table")[[1]], header = TRUE) k$team = i y = rbind(y, k) } y obj = strsplit(as.character(y$Player), "\n\t\t" ) y$Player = sapply(obj, '[', 1) y$amplua = trimws(lapply(obj, '[', 2)) y$cash = as.numeric(gsub("[^0-9]", "", y$cash))Кстати, если вы знаете более простой способ скачивания данных - поделитесь! Спасибо!
Комментариев нет:
Отправить комментарий