Используйте этот тег для вопросов, касающихся функций из пакета dplyr, таких как group_by, summaze, filter и select.

Подробнее про dplyr...

Любые идеи о том, как создать новый столбец B, используя значения столбца A, при использовании значения строки выше нового созданного столбца B? Значение B должно соответствовать: A0 = value of the row above. A1 = 1. A2 = value of the row above + 1. Текущий фрейм данных + желаемый результат ....
26 Ноя 2021 в 21:33
Я попытался изменить исходный набор данных следующим образом. db%>% mutate(GROUP = fct_recode(GROUP, CONTROL = "CONTROLLO")) %>% to_long(keys = c("tests0", "tests7"), values =c("score0", "score7"), grep("T0$", names(.), value = TRUE), grep("T7$....
26 Ноя 2021 в 17:44
Я пытаюсь написать функцию, передав имя переменной в качестве аргумента. Затем это используется в нисходящем трубопроводе для изменения переменной. Используя более классический, но, возможно, немного неуклюжий подход, я могу сделать это: var = "Sepal.Width" scale_fun1 = function(dat,var) { da....
26 Ноя 2021 в 12:56
Я пытаюсь классифицировать просто по первым и последним десяти строкам данных, используя функции head и tail: Мой фрейм данных: df <- structure(list(x = c(21, 21, 22.8, 21.4, 18.7, 18.1, 14.3, 24.4, 22.8, 19.2, 17.8, 16.4, 17.3, 15.2, 10.4, 10.4, 14.7, 32.4, 30.4, 33.9, 21.5, 15.5, 15.2, 13.3, 1....
26 Ноя 2021 в 02:52
Мне нужно получить коэффициент корреляции, используя два фрейма данных. Первый кадр данных ## ML generate1 <- seq(ymd_h("2021-11-01-00"), ymd_h("2021-11-01-03"), by = "hours") datex1 <- date(generate1) generate2 <- seq(ymd_h("2021-11-02-00"), ymd_h("2021-11-02-03"), by = "hours") datex2 <- date(gene....
25 Ноя 2021 в 14:28
Я пытаюсь вычислить разницу между measure car с учетом date1 и side, т.е. я хотел бы получить разницу между стороной A и стороной B для того же car в том же date1. Вот пример игрушки (в моей реальной задаче несколько машин и свиданий ...) test = data.frame(date1= c("20-09-2020", "25-10-2020", "26-1....
24 Ноя 2021 в 23:09
У меня есть фрейм данных, который выглядит так: df1 <- data.frame( Group = c('A', 'B', 'Total: AB', 'C', 'D', 'Total: CD'), Value1 = c(12, 88, 100, 76, 23, 99), Value2 = c(10, 82, 92, 71, 21, 92) ) И еще один, который выглядит так: df2 <- data.frame( Group = c('A', 'B', 'Total: AB', 'C', 'D....
24 Ноя 2021 в 19:19
У меня есть фреймворк с двумя столбцами: PathGroupStage, ClinGroupStage. Я хочу создать новый столбец OutputStage, который выбирает более высокий уровень. Допустимое значение стадии: I, IA, IB, II, IIA, IIB, III, IIIA, IIIB, IIIC, IV, IVA, IVB, IVC, Неизвестно. Если обе ступени имеют значения, испо....
24 Ноя 2021 в 18:51
Я хочу отфильтровать фрейм данных радужной оболочки, чтобы возвращать только те строки, где значение больше 2 в полях sepal.length, sepal.width, petal.length и petal.width с использованием фильтра и между функциями. У меня есть код ниже: iris%>% filter(across(c(Sepal.Length, Sepal.Width , Petal.L....
24 Ноя 2021 в 16:54
У меня гораздо больший набор данных. Это всего лишь небольшой пример. Я собираюсь заменить НП. В частности, я хочу заменить их значением, которое уже существует для того же идентификатора. Я бы предпочел трубное решение от dplyr. ID <- c(1, 1, 1, 2, 2, 3, 3) var <- c(NA, NA, 'M', 'F', NA, NA, 'M....
24 Ноя 2021 в 16:50
У меня есть фрейм данных из нескольких столбцов, которые мне нужно отфильтровать по одному значению столбца (назовем его col1), но мне нужно выбрать строку, которая имеет наименьшее значение в другом столбце (например, col2). Я знаю, как брать отдельные строки по значению столбца (в основном, dplyr....
24 Ноя 2021 в 16:48
У меня есть такие данные: df <- data.frame( Sequ = c(NA, 8, 8, NA, 1, 1, 1, NA, NA, NA, 22, 22, NA), Q = c(NA, "q_x", "", NA, "q_2", "", "", NA, NA, NA, "q_xyz", "", NA) ) Что я хотел бы сделать, так это ввести правильный идентификатор длины прогона в Sequ, где он не NA. То, что я пробовал до ....
24 Ноя 2021 в 13:57
Как легче комбинировать фреймы данных? У меня есть три фрейма данных (table_base / table_a / table_b). Я хочу объединить их по строкам, чтобы получить результат как table_final. Ниже приведен код, который у меня есть, он работает, но немного сложнее. Как я могу это упростить? На самом деле, мне....
24 Ноя 2021 в 12:36
Я изо всех сил пытаюсь написать простой код dplyr для этой проблемы. Если значения для id равны и timeslot следует последовательной и возрастающей последовательности для day, я хотел бы создать столбец t, который является счетчиком длины последовательности. Например, в случае id 1 существует возра....
24 Ноя 2021 в 11:48
Основываясь на других сообщениях, я вижу, что «нормальный» способ расчета наклона бега, похоже, использует функцию и команду rollapplyr. Неужели у нас для этого нет более простой встроенной команды? У меня есть длинный набор данных, в котором значения x являются временными метками, а значения y - т....
24 Ноя 2021 в 11:47
У меня есть следующий рабочий код: test_hierarchie <- tribble(~child, ~parent, "A", "B", "B", "C", "D", "E" ) test_hierarchie_transformed <- test_hierarchie %>% left_join(test_hierarchie, by = c("parent" = "child"), suffix = c("", ....
24 Ноя 2021 в 11:25
У меня есть такой фрейм данных: day device delta 2021-01-01 A 1.3 2021-01-02 A 2.56 2021-01-03 A -1.72 2021-01-04 A 4.09 2021-01-05 A 6.99 2021-01-06 A 3.23 2021-01-07 A 1.12 2021-01-08 A 4.56 2021-0....
24 Ноя 2021 в 02:18
Я пытаюсь добавить новый столбец (цвет) в свой фрейм данных. Значение в строке зависит от значений в двух других столбцах. Например, когда значение класса равно 4, а значение Metro_status равно Metro, я хочу, чтобы конкретное значение возвращалось в соответствующей строке нового столбца. Я пробов....
24 Ноя 2021 в 02:02
Я написал следующий код out %>% group_by(tests0, GROUP) %>% summarise( mean0 = mean(score0, na.rm = T), stderr0 = std.error(score0, na.rm = T), mean7 = mean(score7, na.rm = T), stederr7 = std.error(score7, na.rm = T), diff.std.mean = t....
23 Ноя 2021 в 23:51
Я изо всех сил пытаюсь вычислить количество дней между событиями, так как мне нужно рассчитать, сколько дней проходит между техобслуживанием оборудования. У меня есть фреймворк с большим количеством оборудования и дат, указывающих на техническое обслуживание, тогда мне нужно рассчитать дни между тех....
23 Ноя 2021 в 19:21
Я изо всех сил пытаюсь написать простой код dplyr для этой проблемы. Если values на id равны от day 1 до day 7, я хотел бы создать столбец n и вставить 7 из day 1 до day 7. В противном случае, если values на id не равны, вставьте 0. Как я могу это сделать? Пожеланная выходная мощность: Пример да....
23 Ноя 2021 в 17:21
Если 'value' равно (или одинаково) от day1 до day7 в dplyr, как я могу сложить столбец n? Кроме того, как я могу filter иметь только n, которые равны 7 Предпочтительный выход: Пример данных: structure(list(id = c(1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3), day = c(1, 2, 3, 4, 5, ....
23 Ноя 2021 в 16:16
Мне было интересно, есть ли у кого-нибудь эффективный способ удаления отдельных строк на основе значения столбца из того же фрейма данных. Я хочу сохранить строку, в которой значение этого столбца является ближайшим от 0. Например, у меня есть этот фреймворк: df = data.frame(cond1=c("a","a","a","b"....
23 Ноя 2021 в 13:40
Я хотел бы рассчитать максимальное значение от первой строки до текущей строки df <- data.frame(id = c(1,1,1,1,2,2,2), value = c(2,5,3,2,4,5,4), result = c(NA,2,5,5,NA,4,5)) Я пробовал группировать по идентификатору с помощью dplyr и использовать функцию rollmax из зоопарка, но безуспешно.....
23 Ноя 2021 в 11:39
У меня есть набор данных в «длинном формате», который я перечислил ниже. Моя цель - преобразовать эти данные в более короткий формат. У меня есть этот код, но я продолжаю получать NA в столбце Sum. data %>% group_by(Month, Year, Status) %>% summarise(Sum = sum(Count)) Данные data <- struct....
23 Ноя 2021 в 02:55