Фрейм данных представляет собой табличную структуру данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.

Подробнее про dataframe...

У меня есть пустышка df: data = {'numerator_en':[11, 113, 53], 'denominator_en':[91, 982, 298], 'numerator_fr':[6, 232, 58], 'denominator_fr':[63, 1278, 389], 'numerator_th':[14, 652, 231], 'denominator_th':[416, 3835, 1437], ....
8 Июн 2021 в 23:46
У меня есть фрейм данных с двумя столбцами, мне нужно разделить эти два столбца (столбец A и B) на N последовательных строк (например, 100 строк). так что на выходе будет 100 строк в столбцах A и B, еще 100 строк в столбцах C и D, ..... есть ли какая-то конкретная функция, которая может справиться ....
8 Июн 2021 в 23:21
Мне нужно создать словарь, в котором каждый элемент представляет собой строку. Ключ представляет конкретный столбец, а значения будут списком оставшихся записей столбца. Простой пример ниже: Пример df: Col_A Col_B Col_C Col_D Roger 5 blue house Kim 2 green ....
8 Июн 2021 в 21:20
У меня есть приложение, в котором я пытаюсь преобразовать Pandas DataFrame в объект JSON и обратно, и у меня возникает проблема, когда df содержит объект Timedelta. Я использую Pandas 1.2.4. Вот образец df, который я использовал: >>> timedelta_df = pd.DataFrame({'datetime': pd.Series(['2013-12-31T0....
8 Июн 2021 в 21:18
Я делаю личный проект по практике панд и Beautiful soup, я скопировал эту информацию и сохранил ее в pandas df вот так: 0 €8.5M 1 €0 2 €9.5M 3 €2M 4 €21M ... 16534 €1.8M 16535 €1.1M 16536 €550K 16537 €650K 16538 €1.1M Name: Value, Le....
8 Июн 2021 в 20:12
У меня есть столбец возраста: df.age, в котором существуют некоторые значения, не имеющие смысла в данном контексте. Как я могу преобразовать значения, выходящие за пределы диапазона 18–100, в NA? Я знаю, как это сделать в R, поскольку для этого есть функция, но есть ли что-то подобное в Python?....
8 Июн 2021 в 17:56
У меня есть pd Dataframe cooc_all (симметричная матрица), из которого я хотел бы создать список, содержащий все значения из DataFrame. В настоящее время я сделал это следующим образом: pd_list = [] for i in range(0,40): for j in range(i, 40): pd_list.append(cooc_all[j][i]) Это лучший с....
8 Июн 2021 в 16:55
У меня есть следующие дф: values_list = [[15, {'num':[0]}, 100], [20, {'num':[0]}, 50], [25, {'num':[0]}, 80], [45, {'num':[0], 'option':[1]}, 48], [40, {'num':[0]}, 70], [41, {'num':[0]}, 90], [51, {'num':[0]}, 111]] df = pd.DataFrame(values_list, columns=['Field_1....
8 Июн 2021 в 12:43
Я хочу перемешивать столбцы без порядка; полностью псевдослучайно, на одной строчке кода. Перед: A B 0 1 2 1 1 2 После: B A 0 2 1 1 2 1 Мои попытки до сих пор: df = df.reindex(columns=columns) df.sample(frac=1, axis=1) df.apply(np.random.shuffle, axis=1) ....
8 Июн 2021 в 10:28
У меня есть датафрейм: df = pd.DataFrame({"id": [1, 1, 1, 2, 2, 3], "city": ['abc', 'abc', 'abc', 'def10', 'def10', 'ghk'] ,"year": [2008, 2009, 2010, 2008, 2010,2009], "value": [10,20,30,10,20,30]}) id city year value 0 1 abc 2008 10 1 1 abc 2009 20 2 1 abc ....
8 Июн 2021 в 09:59
У меня есть два фрейма данных df1 и df2 df1 = pd.DataFrame({'name': ['A', 'B', 'C'], 'value': [100, 300, 150]}) df2 = pd.DataFrame({'name': ['A', 'B', 'D'], 'value': [20, 50, 7]}) Я хочу объединить эти два фрейма данных в новый фрейм данных df3, чтобы получить следующий резу....
8 Июн 2021 в 02:36
У меня есть следующий фрейм данных в R. X1 <- c(451,2,6,2,7) X2 <- c(0,1,6,3,4) df <- data.frame(X1, X2) Я хотел бы добавить два дополнительных столбца (X3 и X4), где первая строка является зеркальной (X3 = X2 и X1 = X4), а начиная со второй строки и далее, X3 равно X4 из предыдущей строки плюс оди....
8 Июн 2021 в 00:55
У меня есть большое значение DataFrame, и я заинтересован в трех основных колоннах: индивидуальный идентификатор, образование и год. Я хотел бы создать новую переменную под названием Education1985, где я назначаю всем людям образованию, которое они имели в 1985 году, независимо от того, какой год на....
8 Июн 2021 в 00:04
У меня есть два данных DataFrames: Первый DataFrame DF содержит данные: df = pd.DataFrame({'Standort': ['Vereinigte Staaten', 'Australien', 'Belgien'], 'value': [100, 300, 150]}) Второе dataframe lookup_country - это таблица поиска, чтобы связать столбец «стандартной» для столбца «з....
7 Июн 2021 в 23:34
Я использую Python 3.9 с Pandas и Numpy. Каждый день я получаю df с заказами от компании, в которой я работаю. Каждый день этот df поступает из другой страны, языка которой я не знаю, и у этих фреймов данных нет шаблона. В данном случае я не знаю ни имя столбца, ни индекс . Я просто знаю, что зак....
7 Июн 2021 в 22:37
У меня такой df: id date 1 01-02-2013 2 01-06-2013 3 05-31-2013 4 07-06-2013 И я хочу построить матрицу, которая показывает мне для каждого идентификатора, время, прошедшее время между конкретным удостоверением до всех остальных (в дни). то есть что-то вроде этого: 1 2 3 4 1 ....
7 Июн 2021 в 21:29
Jupyter Notebook. Вызов Batch API возвращает массив JSON объектов. Таблица требует петлей (странно). Мне нужно добавить определенную информацию о объекте JSON в PandaFrame PandaS. import numpy as np import pandas as pd import xlsxwriter import requests from scipy import stats from pandas_datareader ....
7 Июн 2021 в 21:19
У меня есть два фрейма данных: Df1: ID Goal 1 5 2 10 3 1 Df2: Lower Upper 2 10 1 7 3 5 Я пытаюсь создать новый столбец в DataFrame 1, где: если значения столбца целей падают в нижней и верхней границе df2, мы выбираем значение цели. Если значение ниже нижней грани....
7 Июн 2021 в 20:36
У меня есть датафрейм: Model A C Neg Exp 3 2 Power Model 2 1 Log 2 7 Я хочу выполнить некоторые уравнения на них, основанные на столбце модели. Если столбец модели содержит exp, выполните A + C, если столбец модели содержит POW, выполните a * c, если ст....
7 Июн 2021 в 19:38
Вот панда DataFrame: dt name type City 05-10-2021 MK [PQRRC, MNXYZ, AYPIC, KLUYT, GFTBE, BYPAC] NYC 05-10-2021 MK [GFTBE, AYPIC, MNXYZ, BYPAC, KLUYT, PQRRC] NYC 05-12-2021 MK [KLUYT, PQRRC, BYPAC, AYPIC, GF....
7 Июн 2021 в 18:32
У меня есть две наборы данных, которые я хотел бы объединиться. Упрощенная версия: DF1 ---- name age country joe 25 uk jim 24 usa jill 46 spain DF2 --- name age country joe 25 uk jim 24 usa sam 27 france Я хотел бы объединить две наборы данных для производства DF3 --- name age country j....
7 Июн 2021 в 18:28
введите здесь описание изображения Перед сортировкой: Если мы посмотрим на файл, столбцы не отсортированы. Примеры заголовков столбцов: L0_S0_F0, L0_S0_F4, L0_S0_F2, L0_S0_F10, L0_S0_F6, L0_S0_F8 и L0_S0_F12 соответственно. Файл после слияния введите здесь описание изображения: После правильной с....
7 Июн 2021 в 17:27
У меня есть две кадры данных, df1 и df2, и хотите знать, может ли что-то вроде следующее (легко) возможно: Для каждого df1$id, которые соответствует df2$id, я хочу сравнить df1$day против df2$day, и либо классифицирует их как MATCH, либо NO MATCH в новом столбце (df1$matched) В зависимости от того, ....
7 Июн 2021 в 16:58
У меня длинный набор данных, которые я хотел бы сделать широко, и мне интересно, есть ли способ сделать это все за один шаг, используя Reshape Reshape. Рамка данных DF выглядит так: Date Time value <chr> <time> <dbl> 1 Wednesday 16:09 10.7 2 Wednesday 16:10 8.86 3 Wednesday....
7 Июн 2021 в 16:52
У меня есть фреймворк, состоящий из почасовых данных о ценах на электроэнергию. Я пытаюсь найти способ вычислить среднее значение n почасовых периодов с самой низкой ценой в день. Данные охватывают многие годы и направлены на получение среднего значения за n периодов с самыми низкими ценами за каж....
7 Июн 2021 в 15:26