Используйте этот тег для вопросов, касающихся функций из пакета dplyr, таких как group_by, summaze, filter и select.

Подробнее про dplyr...

У меня есть следующий набор данных: data.frame(trait = c("Холестерин", "Холестерин", "ApoB", "ApoA", "TRI", "TRI"), ID = c(1,2,2,1,1,2)) trait ID Cholesterol 1 Cholesterol 2 ApoB 2 ApoA 1 TRI 1 TRI 2 Я хочу создать дополнительный кадр ...
28 Май 2023 в 19:01
У меня есть онлайн-объявления о вакансиях, и в столбце описание работы некоторые компании указывают необходимое количество лет для каждой опубликованной вакансии. Мне удалось извлечь информацию о зарплате из столбца описание работы, но я изо всех сил пытаюсь извлечь ту же информацию о количестве ле...
28 Май 2023 в 18:13
У меня есть столбец DuchenneMarker со значениями 0 и 1. Я хочу найти не менее 10 последовательных 1s и отметить их в новом столбце DuchenneSmiles следующим образом: DuchenneMarker DuchenneSmiles 0 0 0 0 0 0 1 0 1 0 0 ...
27 Май 2023 в 19:26
У меня есть фрейм данных с номерами транзакций и категориями, приобретенными в каждой транзакции. Это выглядит примерно так: trxn_num = c(1,2,3,3,3,4,5,5,6,7,7,7,7) categories = c("pants","boots","boots","shirts","socks","pants","pants","socks", "shorts", "pants", "socks","boots","shirts") df = cbi...
27 Май 2023 в 01:10
Отказ от ответственности: это очень элементарный вопрос. Я буду использовать пример, чтобы было проще, но вопрос не имеет ничего общего с самим примером. Предположим, у вас есть кадр данных df: # A tibble: 5 × 4 index a b c <int> <int> <dbl> <dbl> 1 1 0 0 1 2 2 ...
26 Май 2023 в 23:40
Я адаптировал этот код для создания следующей тепловой карты. Я хотел бы переставить рисунок так, чтобы данные за разные месяцы одного и того же года выровнялись в ряд, а один и тот же месяц из разных лет выровнялся в одном столбце. Мой эксперимент проводился в четыре разных года, начиная с 2014–...
26 Май 2023 в 22:16
Как с помощью dplyr получить для каждого акта_id со статусом «Отправлено» дату создания из предыдущего акта_ид со статусом «Автоматически» или «Получено»? В каждой группе по ссылке каждый статус «Отправлено» должен найти дату создания первого «Получено» или «Автоматически», обнаруженного в той же ко...
26 Май 2023 в 20:12
Можно ли создавать метки столбцов при передаче в R с помощью dplyr? Например. что-то вроде: df <- mtcars %>% some_lovely_function_for_labels(mpg = 'Miles per gallon') Возможно, решение могло бы работать для списка пар переменных-меток. Я исследовал помеченный пакет безрезультатно....
26 Май 2023 в 17:12
Я хочу создать векторы из значений, присутствующих в строке фрейма данных. Например- Структура фрейма данных выглядит следующим образом: Item Category [1] Apple Fruit [2] Onion Vegetable [3] Potato Vegetable [4] Grapes Fruit [5] Cabbage Vegetable [6] Orange Fruit [7] Peach F...
26 Май 2023 в 16:06
Предположим, у меня есть подключение к базе данных и ссылка на большую таблицу, созданную следующим образом: library(tidyverse) conn <- ROracle::dbConnect(drv, dbname = "IPIAMPR2.WORLD") patients <- tbl(conn, "patients") Я могу сделать следующий запрос: young <- patients %>% filter(age < 18) А зат...
26 Май 2023 в 15:03
У меня есть две таблицы данных, dt1 и dt2, где первые два столбца представляют хромосому и положение, а остальные столбцы представляют значения генотипа (0, 1, 2) для разных образцов. Структура столбцов одинакова в обеих таблицах (dt1 и dt2 имеют одинаковую выборку), но позиции могут не совпадать. d...
26 Май 2023 в 12:39
У меня есть набор данных, который выглядит примерно так data <- data.frame(GameNum = c(1,2,3,4,5,6,7,8), Team1 = c("TeamA", "TeamA", "TeamA", "TeamA", "TeamB", "TeamB", "TeamB", "TeamC"), Team2 = c("TeamB", "TeamC", "TeamD", "TeamD"...
26 Май 2023 в 06:47
У меня есть такой фрейм данных: df<- data.frame( "Col1" = c("P1", "P1", "P1", "P2", "P2", "P2", "P3", "P3", "P3", "P3"), "Col2" = c("L", "L&R", "R", "V", "V&N", "N", "M", "I", "I&M", "I&M&G"), "Value" = c("20", "5", "75", "30", "7", "63", "10", "80", "2","8")) df Я ...
26 Май 2023 в 05:46
Мой фрейм данных выглядит следующим образом: df <- data.frame( Group = c("A","A","A","B","B","C","C","C"), Date = as.Date(c("2023-01-01","2023-01-02","2023-01-03","2023-01-01","2023-01-02","2023-01-01","2023-01-02","2023-01-03")), B = c(1,1,0,1,0,1,1,1) ) Для каждой группы я хочу суммировать ...
26 Май 2023 в 02:17
Описание Я пытаюсь извлечь три цифры из каждого значения в столбце Pitcnt. (См. таблицу выходных данных). Первое значение (1 или 2 цифры) находится в начале строки, второе значение — перед тире, а третье значение — после тире. Второе и третье значения всегда представляют собой только одну цифру...
25 Май 2023 в 22:11
У меня есть фрейм данных с датами/временем (временные ряды), сайтом (группировка var) и значением. Я определил время начала различных «всплесков», определяемых как изменение значений> = 2 за 15 минут. Для каждого времени всплеска я пытаюсь определить дату/время, когда значение падает до (или ниже)...
25 Май 2023 в 14:22
У меня есть data.frame с несколькими событиями по отдельным лицам (id). Duplicated rows ранее были удалены. df <- data.frame(id=as.integer(c(123,123,123,124,124,124,125,125,125,126,126,126)), date=as.Date(c("2014-03-12", "2014-03-12", "2015-09-16", ...
25 Май 2023 в 12:07
Я не могу с этим разобраться. Я опубликовал вчера вопрос как применить which.max построчно в dplyr. Я получил отличный ответ, который решил мою проблему. Однако, как это часто бывает, ответ на один вопрос порождал другой. Выложу задачу с некоторыми игрушечными данными Вот фрейм данных с тремя пе...
25 Май 2023 в 00:18
Я относительно новичок в анализе данных в R, поэтому прошу прощения, если использую неправильную терминологию. Я огляделся здесь, но не смог найти этот конкретный вопрос. Я использую пакет dplyr для вычисления среднего значения, стандартного отклонения и стандартной ошибки моих переменных в наборе ...
24 Май 2023 в 23:09
Я хотел бы, чтобы функция могла принимать табличку и вектор символов, указывающий имена столбцов переменного количества столбцов в этой табличке, и выполнять над ней некоторые операции, такие как group_by. Вот пример, который делает это для 0, 1 или 2 столбцов: library(tidyverse) ex = crossing(abc=...
24 Май 2023 в 22:49
У меня есть переменная, которая увеличивается на 1 единицу каждый день (назовем ее cumulative date). Вы вычисляете это cumulative date для дней с 1 по 10. Я хочу создать вторую переменную, которая называется phase. Фазы: «фаза 1», «фаза 2» и «фаза 3». Эти фазы достигаются, когда cumulative date с...
24 Май 2023 в 22:40
У меня есть набор данных, в котором есть группы «gr1», «gr2» и «оба». По сути, я хотел бы сгруппировать столбец «gr» по c("gr1", "both") и c("gr2", "both"). Здесь я предлагаю решение с простым фреймом данных, но я хотел бы знать, есть ли способ сделать «сложную» группировку, такую ​​как group_by(gr...
24 Май 2023 в 21:37
Цель состоит в том, чтобы взять некоторые данные графика, а затем поместить последние точки в заголовок в виде строки. Данные моей игрушки: df <- data.frame (state=c("buy", "sell"), freq=c(0.102, .801)) Так это выглядит так: > df state freq 1 buy 0.102 2 sell 0.801 Я хочу получить строку: my...
24 Май 2023 в 18:40
У меня есть онкологические данные, и у каждого пациента было 1-4 измерения. В одних измерениях была проведена цитология, в других — патология, в некоторых — и то, и другое. library(dplyr) library(tibble) data<-tribble( ~record_number, ~tool, ~cytology, ~pathology, 114, "forceps", "Indeterminat...
24 Май 2023 в 17:27
Я хочу написать функцию R, используя dplyr, для суммирования набора данных, который принимает различное количество группирующих переменных для оператора group_by, включая полное отсутствие группировки. Я нашел ответы на похожие вопросы, в которых используется «group_by_», но это устарело (версия dp...
24 Май 2023 в 16:43