Используйте этот тег для вопросов, касающихся функций из пакета dplyr, таких как group_by, summaze, filter и select.

Подробнее про dplyr...

Я выщипываю глаза, чтобы понять это в пятницу вечером. Мои данные выглядят так df <- data.frame(teamA=c("Italy","Italy","England","England"), teamB=c("Germany","Greece","Germany","Greece"), win=c(0,1,1,1)) df teamA teamB win 1 Italy Germany 0 2 Italy Greece 1 3 Engla....
10 Июл 2021 в 00:51
Мой фрейм данных выглядит так df <- data.frame(id=c(1,1,2,2), mean=c(0.5,0.6), sd=c(0.1,0.2)) id mean sd 1 1 0.5 0.1 2 1 0.6 0.2 3 2 0.5 0.1 4 2 0.6 0.2 Я хочу создать столбец, результат, в котором я суммирую (mean + sd) для id == 1 и нахожу разницу между mean-sd для id == 2. Желаемый р....
7 Июл 2021 в 16:13
У меня есть набор данных, который выглядит так (но с данными за больше лет): dat <- data.frame(date = as.Date(c("2000-01-01","2000-03-31","2000-07-01","2000-09-30", "2001-01-01","2001-03-31","2001-07-01","2001-09-30")), value = c(0.8,1,0.2,0,0.7,....
7 Июл 2021 в 02:01
В этом фиктивном наборе данных я хотел бы изменить столбец «значение» для каждого сайта на значение, где «тип» - «дом». a <- structure(list(site = c("a", "a", "b", "b", "c", "c"), value = c(1, 2, 3, 4, 5, 6), type = c("home", "away", "home", "away", "home", "away")), row.names = c(NA, -6L), class ....
6 Июл 2021 в 16:01
Мой фрейм данных выглядит так df <-data.frame(col1=c(1,2,3,4), col2=c(5,6,7,8), time=rep(c("0h","72h"),2)) col1 col2 time 1 1 5 0h 2 2 6 72h 3 3 7 0h 4 4 8 72h Я хочу использовать mutate_across или любую другую функцию dplyr (желательно) для вычитания значений 72h со....
6 Июл 2021 в 15:56
У меня есть набор данных, который выглядит как набор данных радужной оболочки глаза. Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 ....
6 Июл 2021 в 13:59
Я хочу иметь возможность сначала объединить строки с похожим атрибутом в одну (например, одну строку для каждого города / года), а затем найти конкретные подсчеты для типов категорий для каждой из этих строк. Например, с исходными данными: City Year Type of Death NYC 1995 Homicide NY....
5 Июл 2021 в 18:17
У меня есть этот фреймворк mydf <- structure(list(POS = c("1", "2", "3", "4"), A = c("10", "10", "6", "1"), C = c("1", "8", "2", "7"), T = c("6", "2", "10", "8" ), G = c("0", "0", "2", "11"), Ref = c("A", "A", "T", "C")), class = "data.frame", row.names = c(NA, -4L)) Что выглядит так POS A ....
5 Июл 2021 в 12:24
У меня есть действительно большая таблица Excel со множеством «проверок» наблюдений (более 300 столбцов). Проверки состоят из логических операторов (больше, равно) и некоторого суммирования / вычитания: df <-data.frame(checkID = c(1,2,3,4), checkpart1 = c(50, 70, 111, 320), checkpa....
4 Июл 2021 в 16:23
У меня есть большой набор данных из 70 000 строк, с которым я хочу выполнить некоторые операции, но не могу найти подходящего решения. bib sta run course finish comment day 1 42 9 1 SG 19.88 99 1 2 42 17 2 A 19.96 11 1 3 42 27 3 B 20.92 22 ....
4 Июл 2021 в 15:09
Я знаю, что это может быть простая операция, но я не могу найти решения. Я знаю, что это должна быть какая-то форма group_by и sum или cumsum, но я не могу понять, как это сделать. Я хочу построить кумулятивный подсчет чего-либо по группе с течением времени. У меня есть несколько строк на группу ....
2 Июл 2021 в 17:22
Я ищу способ сделать имена столбцов и имена фреймов данных из списка фреймов данных в один фрейм данных. У них неодинаковая длина столбиков. Как лучше всего это сделать? список....
2 Июл 2021 в 14:24
У меня есть следующие данные: library(dplyr) group_1 <- c(1,1,2,2,1,1,2,2) group_2 <- c("A","A","A","A","B","B","B","B") val <- c(sample(8)) xyz <- c(sample(8)) abc <- c(sample(8)) def <- c(sample(8)) ab23 <- c(sample(8)) df <- data.frame(group_1,group_2,val,xyz,abc,def,ab23) df <- df %>% group_by....
28 Июн 2021 в 14:10
Я уже задавал этот вопрос здесь (Карта Purrr поверх разделенного кадра обучающих данных, чтобы получить auroc для каждой модели), но данные были действительно плохими, и вопрос может немного сбивать с толку. Вдобавок я нашел способ решить эту проблему, но это не похоже на хороший способ. Итак, проб....
28 Июн 2021 в 11:11
Некоторые данные: webdata%>% dput structure (list (`2021-01-01` = c (9769.77145143346, 240.374021734625),` 2021-01-02` = c (9747.83506410782, 205.305063093191), `2021-01-03` = с (10244.2824708895, 253 ........
26 Июн 2021 в 18:09
Я хочу сопоставить 2 controls для каждого case с двумя условиями: ① разница age должна быть в пределах ± 2; ②разница income должна быть в пределах ± 2. Если для случая больше 2 controls, мне просто нужно выбрать 2 controls случайным образом. Вот пример: ПРИМЕР ДАННЫЕ dat = structure(list(id = c(1, ....
26 Июн 2021 в 12:41
Я хочу преобразовать строку в число с помощью оператора умножения. В моем фрейме данных mydf есть столбец ESPAC, и моя идея заключается в преобразовании первой строки, например: «2,70x2,20» в 5,9 с использованием операции 2.70*2.20. Есть простой способ сделать это? Мой желаемый окончательный резу....
26 Июн 2021 в 04:45
У меня есть следующий набор данных с идентификаторами и числовым значением для каждого идентификатора. Мне нужно показать 10 самых больших идентификаторов, а остальные сгруппировать в категорию «Другое». Я исследовал этот вопрос / .......
24 Июн 2021 в 17:23
Как я могу использовать их в конвейере dplyr? Например, с помощью mydata я хочу извлечь строки по крайней мере с одним TRUE. mydata = data.frame(V1=c(FALSE,NA,FALSE,TRUE), V2 = c(NA,TRUE,FALSE,TRUE), V3 = c(FALSE,FALSE,FALSE,TRUE)) mydata V1 V2 V3....
24 Июн 2021 в 15:04
Я пытаюсь использовать функцию pivot_longer из пакета dplyr, чтобы преобразовать мои данные в длинный формат. Текущие обширные данные включают 3 повторных измерения возраста пациентов, их систолического артериального давления и того, применяли ли они препараты для снижения артериального давления (m....
24 Июн 2021 в 13:32
Допустим, у меня есть набор данных с 6 столбцами, и я хочу заменить строки в именах столбцов, включая строку «like_comment», на строку «number_likes». .......
24 Июн 2021 в 13:00
У меня есть такой фрейм данных: set.seed(123) df <- data.frame(A = sample(LETTERS[1:5], 50, replace = TRUE), B = sample(LETTERS[1:5], 50, replace = TRUE)) Я хочу отфильтровать фрейм данных по двум параметрам: (i) строки target , которые соответствуют определенному критерию, и (ii....
23 Июн 2021 в 16:52
У меня есть фрейм данных со столбцами, содержащими NA, которые я заменяю с помощью replace_na. Проблема в том, что эти имена столбцов могут измениться в будущем, поэтому я хотел бы поместить эти имена столбцов в вектор, а затем использовать вектор в функции replace_na. Я не хочу изменять весь фрей....
23 Июн 2021 в 15:53
Рассмотрим фрейм данных в R, где я хочу отбросить строку 6, потому что в нем отсутствуют наблюдения для переменных var1: var3. Но в кадре данных есть действительные наблюдения для идентификатора и года. См. Код ниже. В .......
23 Июн 2021 в 09:10
Я пытаюсь использовать dplyr::mutate для изменения динамического столбца с условиями, динамически использующими другие столбцы. У меня есть такой код: d <- mtcars %>% tibble fld_name <- "mpg" other_fld_name <- "cyl" d <- d %>% mutate(!!fld_name := ifelse(!!other_fld_name < 5,NA,!!fld_name)) Которы....
22 Июн 2021 в 17:24