Tidyr - это пакет R от Hadley Wickham для очистки и изменения формы данных, разработанный для использования трубы magrittr (%>%), чтобы хорошо взаимодействовать с dplyr и аналогичными конвейерными пакетами, которые подчеркивают аккуратные данные. Tidyr является преемником Reshape2.

Подробнее про tidyr...

У меня есть данные: set.seed(2021) sales <- round(runif(672, 10, 50), 0) Я хочу добавить данные о продажах в фрейм данных в виде нового столбца. мой фреймворк выглядит так: library(lubridate) library(tidyr) gen_month <- function(first_datex){ first_datex <- as.Date(first_datex) last_datex <- c....
9 Окт 2021 в 16:17
Я хочу создать функцию для создания даты и часа на основе первой даты месяца. В качестве образца я использую сентябрь. first_datex <- "2021-09-01" gen_month <- function(first_datex){ # Need solution } Результат, который я хочу, выглядит следующим образом: library(lubridate) gen_date <- seq(ymd_h("....
9 Окт 2021 в 06:33
У меня есть такие данные: library(lubridate) library(dplyr) set.seed(2021) gen_date <- seq(ymd_h("2021-01-01-00"), ymd_h("2021-09-30-23"), by = "hours") hourx <- hour(gen_date) datex <- date(gen_date) sales <- round(runif(length(datex), 10, 50), 0)*100 mydata <- data.frame(datex, hourx, sales) Как....
8 Окт 2021 в 07:35
У меня есть огромный набор данных временных рядов (более 500 переменных), состоящий из ежемесячных наблюдений за несколько лет. См. Упрощенный пример входных данных ниже (в Excel): Теперь то, что мне нужно сделать (в R), - это транспонировать этот набор входных данных так, чтобы дата переменной за....
6 Окт 2021 в 12:53
У меня есть такие данные. library(lubridate) set.seed(2021) gen_date <- seq(ymd_h("2021-01-01-00"), ymd_h("2021-09-30-23"), by = "hours") hourx <- hour(gen_date) datex <- date(gen_date) sales <- round(runif(length(datex), 10, 50), 0)*100 mydata <- data.frame(datex, hourx, sales) head(mydata) # ....
6 Окт 2021 в 05:39
У меня есть такой фрейм данных: df = data.frame("subjectID" = c("S1","S2","S2","S1","S1","S2","S2","S1","S1","S2","S1","S2"), "treatment" = c("none","none","none","none","drug1","drug1","drug1","drug1","drug2","drug2","drug2","drug2"), "protein" = c("proteinA","proteinA","proteinB","proteinB","prote....
5 Окт 2021 в 15:12
У меня есть фрейм данных с большим количеством NaN в различных столбцах. df <- data.frame( Data1 = c(3,2,1,NaN, NaN, NaN), Data2 = c(NaN, NaN, NaN, 3,5,3), Data3 = c(NaN, NaN, 7,5,1, NaN) ) Я пытаюсь избавиться от значений NaN, используя pivot_longer, filter используя значения NaN и использу....
4 Окт 2021 в 14:31
По сути, мне нужно изменить каждую строку, которая появляется после выполнения определенного условия. Хотя мне также нужен цикл, чтобы подчиняться группирующей переменной. Упрощенная версия моих данных (показанная ниже) - это группирующая переменная (Группы), за которой следует значение (N), а зат....
4 Окт 2021 в 02:56
У меня есть большой широкоформатный набор данных, который содержит множество переменных, измеренных на нескольких волнах, для которых есть один столбец на комбинацию переменных волн (например, age1, age2, age3, age4), а также несколько переменных с фиксированным временем (например, ID, пол). После....
2 Окт 2021 в 09:02
Не могли бы вы помочь мне настроить мою переменную Sumpk? К сожалению, при запуске выдает ошибку. library(dplyr) library(tidyverse) library(lubridate) df1 <- structure( list(date1 = c("2021-06-28","2021-06-28","2021-06-28","2021-06-28"), date2 = c("2021-04-02","2021-04-02","2021-04-08","2....
1 Окт 2021 в 11:43
Я пытался найти способ построить фрейм данных только с двумя столбцами: один для значения, а другой для метки. Тогда график может иметь 3 разных цвета (по одному для каждой метки). Вот часть моего фрейма данных: dN Label 0.0293 S 0.0273 S 0.0041 S ... 0.3070 E 0.3070 E ... Поэтому я использую....
28 Сен 2021 в 16:09
Я хотел бы создать новый столбец, описывающий, какие двоичные атрибуты присутствуют в данном образце, используя соответствующие имена категорий. Вот образец моих данных sample_id type_1 type_2 type_3 1 0 0 1 2 1 1 0 3 1 1 1 В идеале я хотел бы создать столбец type, который суммировал бы все перемен....
28 Сен 2021 в 10:49
Я хотел бы использовать цикл для создания перекрестных таблиц одного столбца с каждым другим столбцом в df. Я начал с этого кода (заменив его на iris df), который отлично работает с двумя переменными: iris <- iris tbl <- iris %>% tabyl(Species, Sepal.Length, show_missing_levels = FALSE, show_na ....
28 Сен 2021 в 00:34
Имея фрейм данных, я хочу создать новый столбец списка, содержащий именованные векторы (по одному вектору на строку). Каждый вектор получает свои имена и значения из 2 других столбцов фрейма данных. Но я застрял, потому что хочу это сделать: по группе как можно более эффективный с точки зрения в....
27 Сен 2021 в 16:33
Я пытался использовать library(dplyr) library(tidyr) library(stringr) # Dataframe has "Date" column and date in the format "dd/mm/yyyy" or "dd/m/yyyy" df <- data.frame(Date = c("10/1/2001", "15/01/2010", "15/2/2010", "20/02/2010", "25/3/2010", "31/03/2010")) # extract into three columns df %>% ext....
24 Сен 2021 в 07:43
Как объединить строки фрейма данных R в отдельный новый столбец в виде пар ключ-значение. Я пробовал несколько вещей, но пока безуспешно. city rev qty zip 1 Atlanta 63.0 1 45987 2 New York 10.6 1 12686 3 Atlanta 12.0 1 74268 4 Tampa 3.0 1 33684 Преобразовать вышеуказанный фр....
24 Сен 2021 в 06:01
У меня есть фрейм данных из почти 5000 столбцов. вот фрагмент фрейма данных df= data.frame(a=c(13,17,19,7,9), b=c(1,3,50,NA,3), c=c(NA,NA,NA,NA,9)) Я хочу ранжировать значения ячеек фрейма данных относительно. ряды ОЖИДАЕМЫЙ ВЫХОД df= data.frame(a=c(1,1,2,1,1), ....
20 Сен 2021 в 19:19
У меня есть столбец в df, который состоит из таких значений: ID 2 NA 1 3 4 5,7 9,6,10 12 15 16 17 NA 19 22,23 Я хотел бы изменить порядок каждой строки в порядке возрастания. Примечание. Этот столбец является символьным полем, и некоторые строки уже расположены в правильном порядке. Оттуда я хочу ....
18 Сен 2021 в 10:26
Мне было интересно, почему мой вызов pivot_longer() ниже возвращает вложенный вывод в столбце value? foo <- function(){ n_subj = 5 n_trials = 20 subj_intercepts = rnorm(n_subj, 0, 1) slope = .6 mx = 30 data = data.frame(subject = rep(1:n_subj, each=n_trials), intercept = re....
10 Сен 2021 в 01:17
Проблема: Есть ли простой способ получить все комбинации двух (или более) одинаковых векторов. Но показывать только уникальные комбинации. Воспроизводимый пример: library(tidyr) x = 1:3 expand_grid(a = x, b = x, c = x) # A tibble: 27 x 3 a b c <int....
9 Сен 2021 в 08:20
У меня есть фрейм данных, содержащий различное количество точек данных в одном столбце: library(tidyverse) df <- tribble(~id, ~data, "A", "a;b;c", "B", "e;f") Я хочу получить одну строку для каждой точки данных, разделяя содержимое столбца data и распределяя его по ....
8 Сен 2021 в 00:28
Я пытаюсь извлечь как букву (должно быть K или Y), так и все цифры между этой буквой и шаблоном (XO44_TMT6) и поместить извлеченные значения в два отдельных столбца (Mod.residue и Mod.position.in.pep) , но не получил то, что хочу. Ниже мои коды и фрейм данных. Может ли кто-нибудь объяснить, почему....
7 Сен 2021 в 19:37
Не совсем уверен, как сформулировать заголовок, но у меня есть список имен в фрейме данных, и я хотел бы добавить пять элементов из списка к каждому имени, чтобы каждое имя и один элемент были строкой. Так, Name 1, Item1 Name 1, Item2 Name 1, Item3 Name 1, Item4 Пример данных: testdata<-as_tib....
1 Сен 2021 в 22:22
У меня есть данные опроса, которые требуют нескольких перекодировок для конкретных случаев, которые мне нужно выполнить, но я хочу избежать создания новой строки кода для каждого перекодирования (потому что их будут десятки). Я надеюсь, что есть способ перекодировать данные, используя переход, кото....
30 Авг 2021 в 23:00
Вот это мои данные datex <- c(rep("2021-01-18", 61), rep("2021-01-19", 139)) hourx <- c(0,1,2,3,3,4,4,5,5,6,6,7,7,8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,16,10,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,11,0,0,0,0,0,0,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3,4,4,4,4,4....
30 Авг 2021 в 05:06