Фрейм данных представляет собой табличную структуру данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.

Подробнее про dataframe...

У меня есть DF data.frame. Я хотел бы добавить еще один column (i.e., call it station_no), где он будет extrac в number после underscore от Variables column. library(lubridate) library(tidyverse) set.seed(123) DF <- data.frame(Date = seq(as.Date("1979-01-01"), to = as.Date("1979-12-31"), by = "day....
14 Сен 2020 в 21:31
У меня есть список, например, список X, в котором 26 членов говорят A ... Z? Как создать фрейм данных с одним столбцом, чтобы A приходило 100 раз, чем B - 100 раз, и так далее ...? Затем мне придется соединить этот фрейм данных с 2600 значениями в другом фрейме данных, в котором нет ссылок на алфави....
14 Сен 2020 в 21:26
У меня есть DataFrame, который выглядит так: Df1 : A | B | C ----|-----|---- 2T | 3K | 0.0None 3K | 7K | 4T 0.0N| 4T | 3T Что мне нужно, так это отделить и добавить значения, в которых есть T и K, и вернуть только число без текста. Также полностью игнорировать 0.0Nonne. Итоговый стол до....
14 Сен 2020 в 19:12
Я написал следующий сценарий для получения данных в longer format. Как я могу получить data.frame arrange до variables, а не до Date ?. Это означает, что сначала я должен получить данные для Variable A для всех dates, а затем Variable X. library(lubridate) library(tidyverse) set.seed(123) DF <- da....
14 Сен 2020 в 18:53
Предположим, у меня есть фрейм данных Python, который выглядит примерно так: Factor_1 Factor_2 Factor_3 Factor_4 Factor_5 A B A Nan Nan B D F A Nan F A D B A Примерно так....
14 Сен 2020 в 17:40
У меня df 4400 строк. Создал этот df при чтении файла xlsx. Чтобы прояснить мой вопрос, я создал пример df. Это дает следующий результат (упрощенная версия моей истинной проблемы): shop amount 0 shop A 15 1 product 1 4 2 product 2 5 3 product 3 6 4 BBBB 19 5 pr....
14 Сен 2020 в 16:50
Я пытаюсь выполнить простую функцию применения к кадру данных следующим образом: titanic = pd.read_csv("/home/myuser/Downloads/titanic_train.csv") X_train = titanic.drop(["Survived", "PassengerId"], axis=1) Y_train = titanic["Survived"] X_test = titanic_test.drop(["PassengerId"], axis=1) def calc_....
14 Сен 2020 в 15:38
У меня проблема с вычислением процента в фрейме данных. У меня есть следующий фрейм данных под названием dfGender: age gender impressions 0 13-17 female 234561 1 13-17 male 34574 2 25-34 female 120665 3 25-34 male 234560 4 35-44 female 51....
14 Сен 2020 в 15:11
Это мой фрейм данных: cardio variable value 0 0 cholesterol 0 1 1 cholesterol 1 2 1 cholesterol 1 3 1 cholesterol 0 4 0 cholesterol 0 ... ... ... ... 419995 0 overweight ....
14 Сен 2020 в 12:55
У меня есть ~ 250 000 строк годовых данных по конкретным фирмам (2000-2019) с отраслевым кодом SIC для каждой фирмы. Цель состоит в том, чтобы суммировать значение в каждом столбце переменных для каждого отдельного кода SIC на основе года. Данные для первых двух строк выглядят так: >head(compustat) ....
14 Сен 2020 в 12:37
Я работаю с фреймом данных, где каждый столбец представляет компанию. Индекс представляет собой индекс datetime с дневной периодичностью. Моя проблема заключается в следующем: для каждой компании я хотел бы заполнить месяц NaN, если в этом месяце меньше 20 значений. В приведенном ниже примере это бу....
14 Сен 2020 в 12:03
У меня есть столбец, в котором у меня есть интервалы глубины в некоторых ячейках: Столбец выглядит так depth 0 0 1 1 2 2 3 0_1 4 1_2 Я хочу знать, есть ли код, который я могу использовать, чтобы найти среднее значение ячеек, которые являются интервалами в Pandas. Фрейм данных очень бо....
14 Сен 2020 в 09:43
Есть 48 файлов, которые я хочу прочитать с GitHub в Python, и я хочу использовать для этого цикл. Есть ли способ назвать фрейм данных, используя номер из цикла? number = 1 while number < 48 : gameweek[number] = pd.read_csv("https://raw.githubusercontent.com/vaastav/Fantasy-Premier-League/ma....
14 Сен 2020 в 09:20
Мне нужно создать плотный ранг на основе значения столбца. В этом столбце есть некоторое нулевое значение и несколько значений с плавающей запятой. Мне нужно пропустить нулевое значение и сосредоточиться на значениях с плавающей запятой. Я не знаю, как это сделать? Не могли бы вы помочь мне в этом? ....
14 Сен 2020 в 08:10
У меня есть единственный столбец в моем фрейме данных, который называется «данные». Я пытаюсь заменить каждое значение с помощью цикла For Loop на номер первого появившегося экземпляра. Например BatchID -> BatchID Lot 11 1 Lot 11 1 Lot 11 1 Lot 11 1 Lot 12....
14 Сен 2020 в 07:53
У меня есть такой DataFrame; df = pd.DataFrame([ ['A1', ['Long Sleeves', 'Jacket'], 85], ['B1', 'Shoes', 55], ['A2', 'Skirt', 40] ], columns=['PRDS_ID', 'CAT', 'PRICE']) Я хочу выбрать строки типа list из столбца "CAT". Поэтому я попробовал следующие коды; df[df.CAT.astype(list) == Tru....
14 Сен 2020 в 06:10
У меня есть следующие два фрейма данных pandas: Фрейм данных №1: user_id animals 0 1 'dog' 1 1 'cat' 2 1 'cow' 3 2 'dog' 4 2 'cat' 5 2 'cow' ... Dataframe # 2: (column_D не важен в этой зад....
14 Сен 2020 в 03:27
Предположим, у меня есть фрейм данных Python, который выглядит примерно так: Factor_1 Factor_2 Factor_3 Factor_4 Factor_5 A B A Nan Nan B D F A Nan F A D B A Примерно так....
13 Сен 2020 в 22:57
У меня df из 6 столбцов: Time A_1 A_2 A_3 mean SEM 1 3.474000 0.000000 42.22222 46.29630 0.000000 0.000000 2 3.538333 0.000000 42.22222 46.29630 0.000000 0.000000 3 3.602667 0.0....
13 Сен 2020 в 16:45
Я создаю инструмент анализа данных надежности в R Shiny. Я новичок в R (использовал его один раз несколько лет назад) и новичок в Shiny. Мне не удалось решить эту проблему с помощью руководств или форумов :( По сути, я хочу, чтобы пользователь загрузил файл .csv с таблицей событий сбоя. Эта таблица ....
13 Сен 2020 в 16:14
У меня есть список телефонных номеров phone_numbers = [000-000-0000, 000-000-0000, 000-000-0000] for number in phone_numbers: x = list(filter(str.isdigit, number.strip())) t = "".join(x) Дает мне желаемый результат 0000000000 Можно ли использовать для этой цели понимание списка или я полнос....
Предположим, у меня есть датафрейм: df = pd.DataFrame(np.random.randint(0, 100, size=(100, 7)), columns=list('ABCDEFG')) Что мне нужно извлечь подмножество df на основе ряда условий для выбранных столбцов, но столбцы должны быть настроены. С учетом сказанного, условия являются "динамическими", кото....
13 Сен 2020 в 04:13
Мне было интересно, есть ли способ подмножества одной из каждой строки с уникальным sch.id в моем data ниже (например, первая строка каждого sch.id)? Поскольку имеется 160 уникальных sch.id, я ожидаю, что в окончательном выводе будет 160 строк. library(tidyverse) hsb <- read.csv('https://raw.github....
13 Сен 2020 в 02:32
Учитывая данные кадра {'id': {0: 100, 1: 100, 2: 101, 3: 101, 4: 102}, 'A': {0: True, 1: False, 2: True, 3: False, 4: True}, 'B': {0: False, 1: True, 2: False, 3: True, 4: False}, 'C': {0: False, 1: False, 2: False, 3: False, 4: False}} Который выглядит так Как нам объединить строки так, чтобы ....
12 Сен 2020 в 19:21
Как я могу быстро удалить строки, в которых A, B и C ложны? Я попытался: df3 = df[~(~(df['A'])& ~(df['B']) & ~(df['C']) )] df3 com A B C 0 as TRUE FALSE FALSE 1 da TRUE FALSE FALSE ....
12 Сен 2020 в 19:05