У меня есть данные с указанием состояний, месяца и года, когда люди умирают. Мне нужно рассчитать среднее число людей, умерших за каждый месяц (по годам). Итак, первый шаг - вычислить число ...

2
scalamardo 17 Мар 2021 в 19:31

1 ответ

Лучший ответ

После суммирования first по умолчанию отбрасывается последняя группировка, т.е. год. Итак, второе обобщение основано на «состоянии» и «месяце» (если это желаемый результат ОП). В этом случае два summarise имеют смысл. Может быть лучше указать параметр .groups, чтобы убедиться, что то, что нам нужно, например drop_last, отбросит последнюю группу, а во второй summarise удалит группировку с помощью drop

library(dplyr)
data %>% 
  group_by(state, month, year) %>%
  summarise(n = n(), .groups = 'drop_last') %>%
  summarise(median = median(n), .groups = 'drop')
0
akrun 17 Мар 2021 в 16:34