Используйте этот тег для вопросов, касающихся функций из пакета dplyr, таких как group_by, summaze, filter и select.
У меня есть следующий набор данных:
data.frame(trait = c("Холестерин", "Холестерин", "ApoB", "ApoA", "TRI", "TRI"), ID = c(1,2,2,1,1,2))
trait ID
Cholesterol 1
Cholesterol 2
ApoB 2
ApoA 1
TRI 1
TRI 2
Я хочу создать дополнительный кадр ...
У меня есть онлайн-объявления о вакансиях, и в столбце описание работы некоторые компании указывают необходимое количество лет для каждой опубликованной вакансии. Мне удалось извлечь информацию о зарплате из столбца описание работы, но я изо всех сил пытаюсь извлечь ту же информацию о количестве ле...
28 Май 2023 в 18:13
У меня есть столбец DuchenneMarker со значениями 0 и 1. Я хочу найти не менее 10 последовательных 1s и отметить их в новом столбце DuchenneSmiles следующим образом:
DuchenneMarker DuchenneSmiles
0 0
0 0
0 0
1 0
1 0
0 ...
У меня есть фрейм данных с номерами транзакций и категориями, приобретенными в каждой транзакции. Это выглядит примерно так:
trxn_num = c(1,2,3,3,3,4,5,5,6,7,7,7,7)
categories = c("pants","boots","boots","shirts","socks","pants","pants","socks", "shorts", "pants", "socks","boots","shirts")
df = cbi...
Отказ от ответственности: это очень элементарный вопрос. Я буду использовать пример, чтобы было проще, но вопрос не имеет ничего общего с самим примером.
Предположим, у вас есть кадр данных df:
# A tibble: 5 × 4
index a b c
<int> <int> <dbl> <dbl>
1 1 0 0 1
2 2 ...
Я адаптировал этот код для создания следующей тепловой карты.
Я хотел бы переставить рисунок так, чтобы данные за разные месяцы одного и того же года выровнялись в ряд, а один и тот же месяц из разных лет выровнялся в одном столбце. Мой эксперимент проводился в четыре разных года, начиная с 2014–...
26 Май 2023 в 22:16
Как с помощью dplyr получить для каждого акта_id со статусом «Отправлено» дату создания из предыдущего акта_ид со статусом «Автоматически» или «Получено»?
В каждой группе по ссылке каждый статус «Отправлено» должен найти дату создания первого «Получено» или «Автоматически», обнаруженного в той же ко...
26 Май 2023 в 20:12
Можно ли создавать метки столбцов при передаче в R с помощью dplyr? Например. что-то вроде:
df <- mtcars %>%
some_lovely_function_for_labels(mpg = 'Miles per gallon')
Возможно, решение могло бы работать для списка пар переменных-меток.
Я исследовал помеченный пакет безрезультатно....
Я хочу создать векторы из значений, присутствующих в строке фрейма данных. Например-
Структура фрейма данных выглядит следующим образом:
Item Category
[1] Apple Fruit
[2] Onion Vegetable
[3] Potato Vegetable
[4] Grapes Fruit
[5] Cabbage Vegetable
[6] Orange Fruit
[7] Peach F...
Предположим, у меня есть подключение к базе данных и ссылка на большую таблицу, созданную следующим образом:
library(tidyverse)
conn <- ROracle::dbConnect(drv, dbname = "IPIAMPR2.WORLD")
patients <- tbl(conn, "patients")
Я могу сделать следующий запрос:
young <- patients %>% filter(age < 18)
А зат...
У меня есть две таблицы данных, dt1 и dt2, где первые два столбца представляют хромосому и положение, а остальные столбцы представляют значения генотипа (0, 1, 2) для разных образцов.
Структура столбцов одинакова в обеих таблицах (dt1 и dt2 имеют одинаковую выборку), но позиции могут не совпадать.
d...
26 Май 2023 в 12:39
У меня есть набор данных, который выглядит примерно так
data <- data.frame(GameNum = c(1,2,3,4,5,6,7,8),
Team1 = c("TeamA", "TeamA", "TeamA", "TeamA",
"TeamB", "TeamB", "TeamB", "TeamC"),
Team2 = c("TeamB", "TeamC", "TeamD", "TeamD"...
26 Май 2023 в 06:47
У меня есть такой фрейм данных:
df<- data.frame(
"Col1" = c("P1", "P1", "P1", "P2", "P2", "P2", "P3", "P3", "P3",
"P3"),
"Col2" = c("L", "L&R", "R", "V", "V&N", "N", "M", "I", "I&M",
"I&M&G"),
"Value" = c("20", "5", "75", "30", "7", "63", "10", "80", "2","8"))
df
Я ...
Мой фрейм данных выглядит следующим образом:
df <- data.frame(
Group = c("A","A","A","B","B","C","C","C"),
Date = as.Date(c("2023-01-01","2023-01-02","2023-01-03","2023-01-01","2023-01-02","2023-01-01","2023-01-02","2023-01-03")),
B = c(1,1,0,1,0,1,1,1)
)
Для каждой группы я хочу суммировать ...
Описание
Я пытаюсь извлечь три цифры из каждого значения в столбце Pitcnt. (См. таблицу выходных данных). Первое значение (1 или 2 цифры) находится в начале строки, второе значение — перед тире, а третье значение — после тире. Второе и третье значения всегда представляют собой только одну цифру...
У меня есть фрейм данных с датами/временем (временные ряды), сайтом (группировка var) и значением. Я определил время начала различных «всплесков», определяемых как изменение значений> = 2 за 15 минут. Для каждого времени всплеска я пытаюсь определить дату/время, когда значение падает до (или ниже)...
25 Май 2023 в 14:22
У меня есть data.frame с несколькими событиями по отдельным лицам (id). Duplicated rows ранее были удалены.
df <- data.frame(id=as.integer(c(123,123,123,124,124,124,125,125,125,126,126,126)),
date=as.Date(c("2014-03-12", "2014-03-12", "2015-09-16",
...
25 Май 2023 в 12:07
Я не могу с этим разобраться.
Я опубликовал вчера вопрос как применить which.max построчно в dplyr. Я получил отличный ответ, который решил мою проблему. Однако, как это часто бывает, ответ на один вопрос порождал другой. Выложу задачу с некоторыми игрушечными данными
Вот фрейм данных с тремя пе...
Я относительно новичок в анализе данных в R, поэтому прошу прощения, если использую неправильную терминологию. Я огляделся здесь, но не смог найти этот конкретный вопрос.
Я использую пакет dplyr для вычисления среднего значения, стандартного отклонения и стандартной ошибки моих переменных в наборе ...
Я хотел бы, чтобы функция могла принимать табличку и вектор символов, указывающий имена столбцов переменного количества столбцов в этой табличке, и выполнять над ней некоторые операции, такие как group_by.
Вот пример, который делает это для 0, 1 или 2 столбцов:
library(tidyverse)
ex = crossing(abc=...
У меня есть переменная, которая увеличивается на 1 единицу каждый день (назовем ее cumulative date). Вы вычисляете это cumulative date для дней с 1 по 10. Я хочу создать вторую переменную, которая называется phase. Фазы: «фаза 1», «фаза 2» и «фаза 3». Эти фазы достигаются, когда cumulative date с...
У меня есть набор данных, в котором есть группы «gr1», «gr2» и «оба». По сути, я хотел бы сгруппировать столбец «gr» по c("gr1", "both") и c("gr2", "both").
Здесь я предлагаю решение с простым фреймом данных, но я хотел бы знать, есть ли способ сделать «сложную» группировку, такую как group_by(gr...
Цель состоит в том, чтобы взять некоторые данные графика, а затем поместить последние точки в заголовок в виде строки.
Данные моей игрушки:
df <- data.frame (state=c("buy", "sell"), freq=c(0.102, .801))
Так это выглядит так:
> df
state freq
1 buy 0.102
2 sell 0.801
Я хочу получить строку:
my...
У меня есть онкологические данные, и у каждого пациента было 1-4 измерения. В одних измерениях была проведена цитология, в других — патология, в некоторых — и то, и другое.
library(dplyr)
library(tibble)
data<-tribble(
~record_number, ~tool, ~cytology, ~pathology,
114, "forceps", "Indeterminat...
Я хочу написать функцию R, используя dplyr, для суммирования набора данных, который принимает различное количество группирующих переменных для оператора group_by, включая полное отсутствие группировки. Я нашел ответы на похожие вопросы, в которых используется «group_by_», но это устарело (версия dp...