Подмножество состоит из элементов, выбранных из большего набора элементов, по их положению в большем наборе или другим элементам, таким как их значение.

Подробнее про subset...

Если это мой набор данных Id Weight Category 1 10.2 Pre 1 12.1 Post 2 11.3 Post 3 12.9 Pre 4 10.3 Post 4 12.3 Pre 5 11.8 Pre Как мне избавиться от повторяющихся идентификаторов, которые также являются Category = Pre. Мой последний ожидаемый набо....
10 Окт 2021 в 10:27
У меня длинный фрейм данных pandas, и я хотел бы выбрать одну строку из подмножества, если применяется критерий (в моем случае min of 'value'). У меня есть фрейм данных, который начинается так: time name_1 name_2 idx value 0 0 A B 0 0.927323 1 0 A B 1 0....
6 Окт 2021 в 17:14
Пока у меня есть: my_list = ['hello', 'oi'] comparison_list = ['this hellotext', 'this oitext'] for w in my_list: if w in comparison_list: print('yes') Однако ничего не печатается, потому что ни один элемент в my_list не равен ни одному элементу в comparison_list. Итак, как мне сделать эту про....
29 Сен 2021 в 15:08
У меня есть следующий вектор с датами в R Dates <- structure(list(Date = structure(c(18109, 18140, 18170, 18201, 18231, 18262, 18293, 18322, 18353, 18383, 18414, 18444, 18475, 18506, 18536, 18567, 18597, 18628, 18659, 18687, 18718, 18748, 18779, 18809, 18840, 18871, 18901, 18932, 18962, 18993, 19....
28 Сен 2021 в 23:24
В R я могу использовать .subset2, чтобы действовать как [[ или $ без отправки. > a <- new.env() > a$foo <- 3 > .subset2(a, "foo") [1] 3 Однако я не могу найти эквивалент для операции настройки без отправки: > .subset2(a, "foo") <- 5 Ошибка в .subset2 (a, "foo") Как я могу что-то установить без н....
24 Сен 2021 в 15:47
Фиктивные данные: set.seed(4) name <- sample(LETTERS[1:8], 500, replace = T) id <- round(runif(500, min=1, max=200)) df <- data.frame(name, id) Я хочу проверить процент уникальных id из B, которые есть для других оставшихся name Ожидаемый результат будет примерно таким: name count pct_common <c....
19 Сен 2021 в 19:54
Я пытаюсь изменить определенные значения в столбце, где при модификации используются значения из другого столбца. Например, скажем, у меня есть df: A B C 1 3 8 1 6 8 2 2 9 2 6 1 3 4 5 3 6 7 Где я хочу df['B'] = df['B'] + df['C'] только для подмножества df.....
14 Сен 2021 в 11:19
Возьмите список вроде as.list(rep(c(NA, 4, NA), times = c(5, 1, 2))) т.е. [[1]] [1] NA [[2]] [1] NA [[3]] [1] NA [[4]] [1] NA [[5]] [1] NA [[6]] # index of non-NA list element, 6 [1] 4 # ...and its corresponding value, 4 [[7]] [1] NA [[8]] [1] NA Я хочу извлечь индекс элемента, отличного от....
11 Сен 2021 в 20:09
У меня есть фрейм данных, который выглядит так: Name Activity John ViewReport John UploadData John ViewDashboard Ted ViewReport Ted DownloadData Amanda ViewReport Amanda ViewDashboard Lee ViewDashboard Kathy ViewDataset Я хочу отфильтровать эту таблицу, чтобы в ней отображались то....
9 Сен 2021 в 22:03
У меня есть набор данных с уникальным идентификатором для групп пациентов под названием match_no, и я хочу подсчитать, сколько пациентов заболели за два разных года, запустив функцию цикла для подсчета случаев в большом наборе данных. for (i in db$match_no){(with(db, sum(db$TBHist16 == 1 & db$match_....
9 Сен 2021 в 17:54
У меня есть набор панельных данных со значениями 15 переменных для 120 стран за период 1789-2020 гг. Единица анализа - страна-год. Вот упрощенная версия набора данных, чтобы показать, как он выглядит. set.seed(42) n <- 20 Data <- data.frame(Country=rep(LETTERS[1:5], n/5),date=sample(1789:2020, n, ....
4 Сен 2021 в 01:05
Давайте image, чтобы иметь фрейм данных, такой как df<-data.frame(Steps=1:10, Value=20:29) > df Steps Value 1 1 20 2 2 21 3 3 22 4 4 23 5 5 24 6 6 25 7 7 26 8 8 27 9 9 28 10 10 29 Что бы я хотел сделать: Взятие разных ....
3 Сен 2021 в 15:59
Я хотел бы проверить количество рабочих на данную неделю или месяц. Переменная месяца в браузере данных выглядит как «Январь 2018», а переменная недели - как «06январь2018». Чтобы подсчитать количество рабочих за данную неделю, я запустил следующий код: preserve keep if week==06jan2018 dist....
30 Авг 2021 в 16:14
В настоящее время я хочу разделить фрейм данных, если он содержит какие-либо числа от 01 до 12 в позиции 11-12 (если мы также рассмотрим - как символ, тогда позиция будет 14-15-й позицией). Я попробовал grepl, но не смог. Пример данных: x <- data.table(c('ACCN-NJ-A55O-01A-11D-A25L-08','ACCN-NJ-A55O....
22 Авг 2021 в 16:10
У меня около 20 флажков в графическом интерфейсе, над которым я работаю, и в зависимости от того, какие из них отмечены, определяет нужные мне входные данные. Я знаю, как проверить, установлен ли флажок, и таким образом могу определять ввод. Но я не хочу делать это для всех 20+ флажков. Есть ли спос....
20 Авг 2021 в 22:30
У меня есть такие данные: И я хочу удалить столбец, содержащий «rico», а также удалить все следующие столбцы. Я хочу получить это: Это то, что я сделал, но это не работает: mydata = data.frame( X1 = c("john", "max", "jay", "douglas"), X2 = c("alexia", "miguel", "vince", "gary"), X3 = c("pe....
17 Авг 2021 в 11:16
Скажем, мои df1 и df2 следующие: df1: [,1] [,2] [,3] [1,] "n" "11" "13" [2,] "a" "18" "14" [3,] "b" "13" "10" Df2: [,1] [,2] [,3] [1,] "n" "11" "13" [2,] "a" "ll" "kk" [3,] "b" "jj" "ii" Мне нужен дубликат df2, чтобы он содержал только те строки df2, которые имеют те же знач....
16 Авг 2021 в 18:33
Недавно я спросил, как использовать файлы словарей для перекодирования значений в наборе данных (Работа со значениями данных (словарь). кадры данных и перекодирование в R) У меня более простая проблема, но это решение не работает. Предположим, у меня есть следующий набор данных, каждая строка котор....
13 Авг 2021 в 01:41
Я пытался написать функцию для удаления повторяющихся столбцов (с одинаковым содержимым), в частности, сравнивая попарно только те, которые имеют одно и то же имя плюс суффикс. Например: сравните, если "col1" и "col1_suffix" имеют одинаковое содержание. Я написал код, но, может быть, есть альтернати....
11 Авг 2021 в 00:25
У меня есть фрейм данных data, который имеет 6 строк и 6 столбцы. data <- data.frame( Unit = c("A", "A", "B", "B", "C", "C"), P1 = c(1:6), P2 = c(1:6), P3 = c(1:6), P4 = c(1:6), P5 = c(1:6), stringsAsFactors = FALSE) Мне нужно сохранить только первые вхождения уникальных значений в unit < / a> ....
10 Авг 2021 в 18:22
Я хочу изолировать строку в моем фрейме данных, которая содержит минимальное значение в столбце Price, но также хочу изолировать строку чуть выше этого. Вот мой код, чтобы изолировать строку, содержащую минимальную цену в фрейме данных: pZ = df[df.Price == df.Price.min()] Как изолировать строку с ....
9 Авг 2021 в 22:33
У меня есть фрейм данных df, который имеет 5 строк и 6 столбцы. df <- data.frame( Hits = c("Hit1", "Hit2", "Hit3", "Hit4", "Hit5"), category1 = c("a1", "", "b1", "a1", "c1"), category2 = c("", "", "", "", "a2"), category3 = c("a3", "", "b3", "", "a3"), category4 = c("", "", "", "", ""), ....
9 Авг 2021 в 13:30
Я пытаюсь создать фильтр dplyr на основе некоторых условий, скажем, есть три условия: condition1, condition2 и condition3. Я хочу, чтобы в целом он оценивался как ИСТИНА, если ЛЮБЫЕ два или более условия ИСТИННЫ, Есть идеи, как это легко сделать в R? Я могу очень долго выражаться с каждой комбинац....
5 Авг 2021 в 15:00
Вернуть верхние 20% наивысшего значения в столбце в 1, а остальные числа сделать 0 DF dat1 = data.frame(a = c(0.1,0.2,0.3,0.4,0.5), b = c(0.6,0.7,0.8,0.9,0.10), c = c(0.12,0.13,0.14,0.15,0.16), d = c(0.6,0.7,0.8,0.5,0.9), ID=c("Albert", "Bia", "Carla", "Duda", "Elisa")) ЖЕЛАЕМЫЙ DF dat1 = data.fram....
5 Авг 2021 в 14:08
df <- data.frame(PatientID = c("0002" ,"0002", "0005", "0005" ,"0009" ,"0009" ,"0018", "0018" ,"0039" ,"0039" , "0043" ,"0043", "0046", "0046" ,"0048" ,"0048"), Timepoint= c("A", "B", "A", "B", "A", "B", "A", "B", "A", "B", "A", "B", "A", "B", "A", "B"), sex= c("F....
30 Июл 2021 в 18:14