Рамка данных представляет собой 2D табличную структуру данных. Обычно он содержит данные, в которых строки представляют собой наблюдения, а столбцы являются переменными и могут быть различными типами (в отличие от массива или матрицы). В то время как «кадр данных» или «DataFrame» является термином, используемым для этой концепции на нескольких языках (R, Apache Spark, Deedle, Maple, библиотеку Pandas в Python и библиотеке данных данных в Джулии), «Таблица» - это термин, используемый в MatLab и SQL.

Подробнее про dataframe...

Иметь фрейм данных с двумя столбцами, как показано ниже. Один столбец — это дата и время, а другой — чисто числа. Я хотел бы суммировать все положительные числа за последние 5 минут. Пробовал. Df['positive'] = df['number'].rolling('5T').sum() Но не сработало. Каким-то образом получение ошибки 「Va...
30 Окт 2023 в 01:53
У меня есть огромный файл CSV с данными различных экспериментальных испытаний. Всякий раз, когда начинаются данные для нового испытания, индексы перезапускаются с 0. Таким образом, мой фрейм данных pandas будет выглядеть примерно так: a b c 0 .. .. .. 1 . . n 0 1 . . m 0 1 . . . Тепе...
26 Сен 2023 в 06:21
Вот примеры наборов данных: id <- c("aaa1", "aaa1", "bbb1", "aaa2", "b1","a3", "a1", "b1", "a1", "b1" ) data <- data.frame(id) head(data) # id # 1 aaa1 # 2 aaa1 # 3 bbb1 # 4 aaa2 # 5 b1 # 6 a3 # 7 a1 # 8 b1 # 9 a1 # 10 b1 И я могу добавлять строки в переменную «id». (А1....
26 Сен 2023 в 06:08
Я пытаюсь создать 10 или более псевдокадров данных. Размер кадра данных должен состоять из 9 столбцов и 5 строк (понедельник, вторник, среда, четверг, пятница), а сумма каждой строки должна быть 9., как показано ниже. Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 Factor7 Factor8 Factor9 M...
26 Сен 2023 в 02:30
У меня есть фрейм данных (автомобильная авария в Нью-Йорке), и в этом фрейме данных есть два столбца: ['LATITUDE', 'LONGITUDE']. Итак, в блокноте Jupyter я создал тепловую карту сбоев со следующей информацией: Первая тепловая картаИ я хочу создать три новых кадра данных с тремя красными кругами на...
25 Сен 2023 в 21:47
Мне нужно назначить DataFrame в качестве значения ячейке в другом DataFrame. Я пробовал это тремя разными способами: import pandas data = { 'A': [ 1 ] } frame = pandas.DataFrame(data) frame['B'] = None frame.loc[0]['B'] = pandas.DataFrame() print(frame) frame.loc[0, 'B'] = pandas.DataFrame() p...
25 Сен 2023 в 21:31
У меня есть таблица данных R со столбцом «X», значение которого обозначает соответствующие столбцы, которые я хочу выбрать. Итак, если X=5, мне нужны столбцы 1:5, а затем я хочу их просуммировать. Я могу сделать это с помощью фреймов данных и dplyr следующим образом: df %>% rowwise() %>% mutat...
25 Сен 2023 в 20:32
Когда я присоединяюсь к двум своим фреймам данных, я сталкиваюсь с проблемой с выходными данными. Функция pd.concat добавляет строки моего второго фрейма данных к моему первому фрейму данных, хотя столбцы также появляются в первом фрейме данных. Фреймы данных: df1 = pd.DataFrame([ ['A1', 'B2',...
25 Сен 2023 в 19:14
У меня есть кадр данных с двумя столбцами Rt1 и Rt2. df<-data.frame(Subject = c(rep(1,15), rep(2,15)), RT1=rep(seq(100,1500,100),2), RT2 = rep(seq(200,3000,200),2)) По разным причинам я хочу подсчитать количество/частоту точек данных, попадающих в каждую ячейку сетки 4*4 для каждого субъекта. Здес...
25 Сен 2023 в 17:38
У меня есть кадр данных (dset), в котором содержатся сведения о многих участниках исследования (studynr). При каждом посещении исследования записывалась дата (med_dt) и общее количество лекарств, которые участнику прописали (TOTAL). См. фиктивные данные ниже: dates <- seq(c(ISOdate(2010,1,1)), c(I...
25 Сен 2023 в 17:10
У меня есть очень большой массив данных, содержащий ежемесячные индексы цен на 400 товаров за 20 лет. Для моего анализа мне нужно связать индексы по годам, чтобы обеспечить согласованный базовый отчетный период. По сути, январский индекс рассчитывается относительно предыдущего января. На этом рис...
25 Сен 2023 в 16:05
У меня есть входной файл, формат которого выглядит следующим образом (input.txt) Предположим, что этот формат представляет собой случайные шестнадцатеричные данные следующим образом: 20 3h 4f 57 56 37 4a 2d 33 45 10 2a 23 47 4c И я хочу преобразовать этот файл в другой формат следующим образом: (ou...
25 Сен 2023 в 15:38
У меня есть кадр данных pyspark (df1) со столбцом, который выглядит следующим образом: +---------------+ | fruit | +---------------+ | apple, orange | | apple, banana | | banana, grape | +---------------+ И еще один фрейм данных (df2) со столбцом, который выглядит следующим образом: +------...
25 Сен 2023 в 13:27
У меня есть пандас dataframe, который выглядит как Date Race_ID Student_ID win? 18/10/2023 5 1 0 18/10/2023 5 2 1 17/9/2022 4 1 0 17/9/2022 4 2 1 16/5/2021 3 1 1 16/5/2021 3 2 0 15/4/202...
25 Сен 2023 в 13:20
Допустим, у меня есть этот df (но намного больше) library(lubridate) df = data.frame(id=1:5,date1 = c("2023/01/02","2023/08/03","2023/09/09","2023/11/05","2023/04/03"), date2 = c("2023/02/02","2023/09/03","2023/10/09","2023/12/05","2023/05/03")) Я пробовал использовать lapply с фу...
25 Сен 2023 в 12:44
У меня есть строка кода pandas, которая выдает мне предупреждение об устаревании в будущем, как указано в заголовке, и я не могу найти в документации pandas, как изменить ее, чтобы удалить предупреждение. Строка кода следующая: df['temp_open']=df['temp_open'].replace('',method='ffill') Любая помощ...
У меня есть простой df: a=pd.DataFrame({'a': [1, 2, 3], 'b': [2, 3, 4], 'c': [3, 4, 5]},index=["type1","type2","type3"]) a b c type1 1 2 3 type2 2 3 4 type3 3 4 5 Несмотря на то, что pivot_table предназначен для более сложных данных, я могу использовать его для быстрого создания ...
25 Сен 2023 в 07:15
У меня есть некоторые данные, которые выглядят так Я хочу рассчитать скорость роста каждой опухоли (см/месяц), а затем в конечном итоге рассчитать среднюю скорость роста. Ранее я делал это вручную для каждого периода времени, а затем усреднял все скорости роста на опухоль вместе. Например, показат...
25 Сен 2023 в 05:55
У меня есть словарь, который имеет два значения для каждого ключа: dic = { 'AR': ['Arkansas', 804], 'CA': ['California', 223] } Я пытаюсь сопоставить значения словаря с новым столбцом в моем фрейме данных под названием count. Однако мне нужен только числовой элемент, то есть 804, 223. Я хочу, чтоб...
25 Сен 2023 в 04:11
В пакете dplyr R есть опция .keep = "unused" при создании новых столбцов с помощью функции mutate() (которая является их эквивалентом assign). Пример, для тех, кто не пользовался: > head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 ...
25 Сен 2023 в 01:47
Я пишу веб-приложение для возврата ноутбука в конце года, чтобы облегчить нашу жизнь. У меня есть файл .csv, содержащий серийные номера устройств, а также имя и фамилию соответствующего пользователя, код пользователя и т. д. Я использую колбу в качестве основы, и все идет хорошо. Я могу использов...
25 Сен 2023 в 01:47
Я пытаюсь извлечь основной файл преступлений на почве ненависти за 2021 год из обозревателя данных о преступлениях в R. https://cde.ucr.cjis.gov/LATEST/webapp/ #/pages/downloads (прокрутите до главного файла, выберите «Преступление на почве ненависти», затем «2021») Файл представляет собой текстов...
25 Сен 2023 в 01:22
Я пытаюсь разобрать столбец «Выбор инвесторов» на отдельные столбцы (например, инвестор1, инвестор2, инвестор3) в этом наборе данных: https://www.cbinsights.com/research-unicorn-companies Я пробовал этот код: df_worldunicorns[['tier1','tier2','tier3']] = df_worldunicorns['Select Investors'].str.spli...
24 Сен 2023 в 18:41
У меня есть этот объект anndata: ldata1x ldata2x ldata3x ldata4x И я бы хотел объединить их в один df. ldata1x.obs.index Index(['KO_d6_r1_AAACCGGCACCTCGCT-1', 'KO_d6_r1_AAAGCCGCAAGGATTA-1', 'KO_d6_r1_AAACCGCGTTAGCTGA-1', 'KO_d6_r1_AAAGCGGGTGTTTGTC-1', 'KO_d6_r1_AACAGATAGCAGCTAT-1', 'K...
24 Сен 2023 в 15:47
Лямбда-функции работают отлично: funct = (lambda a,aa,aaa: (a-aa)/aaa if aa>0 else a/aaa) print(funct(200,100,2)) Я хочу применить это в кадре данных: df[['a','aa','aaa']], используя .apply() Error: <lambda> missing 2 required positional arguments: aa and aaa ...
24 Сен 2023 в 13:26