.

Сделать репост в соц сети!

вторник, 17 декабря 2019 г.

Зарплаты игроков NHL 2019

Есть замечательный сайт с зарплатами игроков NHL - NHL Salary Rankings.
Зарплаты игроков даны в разрезе команд, амплуа, годов. Я скачал данные 2019 года - просто ради прикола и хочу поделиться.

Зарплаты игроков NHL 2019




Здесь по оси X - зарплата в миллионах долларов, по оси Y - количество игроков, которые получают зарплату в таком размере. Т.е. например, зарплату от 5 до 6 миллиона долларов получают 75 игроков. Описательные статистики такие

  • Min.   569355   
  • 1st Qu.  792500   
  • Median     1475000  
  • Mean   2829389  
  • 3rd Qu.     4343750 
  • Max.  16000000

Т.е. 3/4 игроков получают менее 4 343 750 $! Я думал, они там побогаче будут.

В разрезе амплуа

Зарплаты игроков NHL 2019

Здесь также зарплата в миллионах долларов $, прикол в том, что несмотря на видимые различия (медиана зарплаты правого нападающего почти 2 мил $, а левого края - чуть выше 1 миллиона долларов), значимых различий нет! Следовательно, у нас нет данных, чтобы сказать о связи амплуа и уровня зарплаты.

В разрезе команд 

Зарплаты игроков NHL 2019

Самая высокая медиана зарплата в Каролине харрикейнс, но значимость различий выше 0, 05, поэтому мы делаем вывод: если вы хотите играть в NHL, то не выбирайте команду по уровню зарплаты, они все примерно одинаковы.

Код

Если кто-то хочет скачать данные и провести свой анализ, делюсь кодом (а еще лучше приходите на Он-лайн курс "Введение в R для HR")
library(rvest)
team = c('anaheim-ducks' , 'arizona-coyotes', 'boston-bruins', 'buffalo-sabres',
         'calgary-flames', 'carolina-hurricanes', 'chicago-blackhawks', 'colorado-avalanche',
         'columbus-blue-jackets', 'dallas-stars', 'detroit-red-wings', 'edmonton-oilers',
         'florida-panthers', 'los-angeles-kings', 'minnesota-wild', 'montreal-canadiens',
         'nashville-predators', 'new-jersey-devils', 'new-york-islanders', 'new-york-rangers',
         'ottawa-senators', 'philadelphia-flyers', 'pittsburgh-penguins',
         'san-jose-sharks', 'st-louis-blues', 'tampa-bay-lightning', 'toronto-maple-leafs',
         'vancouver-canucks', 'vegas-golden-knights', 'washington-capitals',
         'winnipeg-jets')
y  = NULL;
for(i in team) {
  
  k=html_table(html_nodes(read_html(paste0('https://www.spotrac.com/nhl/rankings/cash/',i,'/')), "table")[[1]], header = TRUE)
  k$team = i
  y = rbind(y, k)
}
y

obj = strsplit(as.character(y$Player), "\n\t\t" ) 
y$Player = sapply(obj, '[', 1)
y$amplua = trimws(lapply(obj, '[', 2))
y$cash = as.numeric(gsub("[^0-9]", "", y$cash))
Кстати, если вы знаете более простой способ скачивания данных - поделитесь! Спасибо!

Комментариев нет:

Отправить комментарий