Фрейм данных представляет собой табличную структуру данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.

Подробнее про dataframe...

У меня есть фрейм данных, как показано ниже td = {966: [('Feat1', -0.04), ('Feat2=True ', -0.02), ('Feat3 <= 20000.00', 0.01), ('Feat4=Power Supply', -0.01), ('Feat5=dada', -0.0)], 879: [('Feat8=Rare', 0.02), ('Feat11=HV', -0.01), ('Feat21=Power Supply', -0.01), ('20000.00 < Feat3 <= ....
4 Фев 2022 в 13:06
У меня есть образец данных df. Я хотел бы знать, есть ли способ вернуть все значения, начинающиеся со специального символа. В настоящее время у меня есть только возвращаемые значения со знаком «@», но мне нужны все специальные символы. Или, по крайней мере, как перечислить несколько вариантов с пом....
4 Фев 2022 в 07:24
У меня есть следующий фрейм данных: df= product_name 0 1 2 0 laptop 1200 1000 100 1 printer 150 10 100 2 tablet 300 30 560 3 desk 450 40 640 4 chair 200 20 207 Я хочу добавить сумму столбцов 1 и 2, но с у....
4 Фев 2022 в 06:29
У меня есть Dataframe выглядит следующим образом. import pandas as pd import numpy as np # Create data set. present = 12 died = 20 dataSet = {'id': ['A', 'A', 'A','A','B','B','B','C'], 'id_2': [1, 2, 3, 1, 1,2,3,1], 'start' : [9,13,12,11,9,20,22,13], 'end' : [14,22,....
4 Фев 2022 в 06:06
У меня есть кадр данных df со следующими данными: df <- structure(list(group = c("cluster2", "cluster2", "cluster1", "cluster2", "cluster2", "cluster2", "cluster2", "cluster1", "cluster1", "cluster2" ), One = c(-0.614639315096381, 0.88834977627436, 0.0832368160901144, 0.00321829065579383, -1.0418....
3 Фев 2022 в 23:35
У меня есть кадр данных, который содержит такие столбцы - ['labels', 'labels.1', 'labels.2'] это продолжается до некоторого числа labels.n Один из этих столбцов содержит нужное мне значение. Я хочу получить это значение и добавить его в df['final_label']. Если значение отсутствует в столбцах меток....
3 Фев 2022 в 22:53
Я изо всех сил пытаюсь найти правильный способ достижения относительной доходности в течение месяца, используя последнее наблюдение в предыдущем месяце. Данные для справки: set.seed(123) Date = seq(as.Date("2021/12/31"), by = "day", length.out = 90) Returns = runif(90, min=-0.02, max = 0.02) mData ....
3 Фев 2022 в 20:16
В приведенном ниже df мне нужно заменить COST A и COST B для E на 0 и заменить комментарий на Un reported cost, когда выполняются следующие условия: E и F имеют одинаковую стоимость для «СТОИМОСТИ A». E и F имеют одинаковую стоимость для «СТОИМОСТИ B». Как вы можете видеть, 20 и 0,5 для E заменяются....
3 Фев 2022 в 19:06
Учитывая этот словарь dataframe и word_index: import pandas as pd df = pd.DataFrame(data={'text_ids': [ [1, 2, 3, 2, 7, 2, 8, 2, 0], [1, 2, 4, 2, 7, 2, 8, 2, 0], [1, 2, 5, 2, 6, 2, 8, 2, 0....
3 Фев 2022 в 18:58
import pandas as pd import numpy as np df = pd.DataFrame(np.random.choice([np.nan,1], p=(0.8,0.2),size=(10,10))) print (df) 0 1 2 3 4 5 6 7 8 9 0 NaN NaN 1.0 NaN NaN NaN NaN NaN NaN NaN 1 NaN NaN NaN NaN NaN NaN NaN NaN 1.0 NaN 2 NaN NaN NaN NaN NaN N....
3 Фев 2022 в 18:22
Я уже задавал аналогичный вопрос, но понял, что недостаточно конкретен. В настоящее время я анализирую данные, извлеченные из твиттера, в R. Твиты написаны разными пользователями в разные периоды времени (сбор данных в течение одного года для каждого пользователя). Я хочу отображать данные с помощ....
3 Фев 2022 в 17:59
Я хочу взглянуть на распределение данных. Проблема в том, что я хочу сделать цикл, который отображает каждый столбец данных отдельно. При таком подходе гистограмма каждого столбца строится в одной графической области. for x in df.columns.to_list(): df[x].hist(bins=120) Как разделить эти гистог....
3 Фев 2022 в 17:17
Я хочу вернуть веса в гистограмму, но с именами, появляющимися только один раз. df = pd.DataFrame({'Name': ['Bob', 'Simon', 'Bill', 'Mary', 'Mary', 'Bob'], 'Weight': [70, 72, 71, 67, 67, 70]}) Этот: Bob 70 Simon 72 Bill 71 Mary 67 ....
3 Фев 2022 в 16:39
У меня есть следующие два кадра данных df1 и df2 final raw st abc 12 10 abc 17 15 abc 14 17 А также final raw abc 12 abc 14 Мой ожидаемый результат final raw st abc 17 15 Я хотел бы удалить строки на основе общего значения столбца. Моя попытка: ....
3 Фев 2022 в 16:25
У меня есть A <- rep(list(data.frame(a=c(1,2,3,2,1,4),b=c(7,3,1,2,2,1),c=c(2,3,7,2,2,8))),10) B <- c(2,1,3,2,5,5) И я хотел бы поместить B в качестве столбца каждого data.frame в списке A Что-то типа [[1]] a b c d 1 1 7 2 2 2 2 3 3 1 3 3 1 7 3 4 2 2 2 2 5 1 2 2 5 6 4 1 8 5 [[2]] a b c d 1 1 7 ....
3 Фев 2022 в 15:19
В сегодняшнем году, если разница в году соответствующего столбца составляет 5 или более, он предназначен для вывода 1, но выходит значение NaN. import pandas as pd from datetime import datetime today = datetime.today() def time(x): if today.year - x.year > 5: x = 1 return x else: x....
3 Фев 2022 в 13:22
У меня есть следующий кадр данных df = pd.DataFrame({'id': ['b', 'b', 'b', 'b', 'a', 'a'], 'y': [1,2,3,4,1,2], 'v': [10, 8, 12, 18, -5, 10]}) Я определил две пользовательские функции, скажем, func1 и func2 с df в качестве входных данных. Обе функции возвращают фрейм данных с двумя столбцами x1 и x2....
3 Фев 2022 в 13:02
У меня есть панды DataFrame, как это: data = {'ID_1':['A', 'A','A', 'B', 'B', 'B'], 'ID_2':[1, 2, 2, 1, 1, 2], 'DATE':['2021-11-21', '2021-12-19', '2021-09-05', '2021-11-07', '2021-12-05','2021-12-26'], 'VALUE': [0.5, 0.5, 0.5, 0.6, 0.6, 0.6]} df = pd.DataFrame(data) И я х....
3 Фев 2022 в 12:20
У меня есть список mylist, в котором его элементы должны быть извлечены из разных файлов, и он доступен в формате ниже. mylist = [[{'id':2,'name':"Ted"},{'id':7,'name':"Jack"}], [{'id':13,'name':"Jim"},{'id':19,'name':"Tom"}], [{'id':73,'name':"Sid"},{'id':89,'name':"Harry"}]] К....
3 Фев 2022 в 10:59
В настоящее время у меня есть следующая проблема, когда я хочу удалить строки в кадре данных pandas до того, как будет выполнено условие. Я хотел бы удалить каждую строку до того, как будет выполнено условие 10 или более в столбце «Число», в зависимости от столбца «Имя». Предположим, что кадр данн....
3 Фев 2022 в 10:39
У меня есть столбец текстов из столбца под названием «внутренние заметки» из CRM, и я пытаюсь использовать pandas для извлечения дат в новый столбец в виде массива. Все загружено, я хотел бы привести несколько примеров кодирования, которые я пробовал, но все, что я пробовал, далеко не так. Вот неск....
3 Фев 2022 в 10:27
Я использую блокнот Jupyter и получаю данные с помощью API. У меня есть список имен. names = ['a','b','c','d'] for name in names: df=library.function(name) print(df) Затем я получаю несколько словарей. {'name':'a', 'level':2, 'quality': 12} {'name':'b', 'level':3, 'quality': 14} {'name':'c'....
3 Фев 2022 в 10:15
Я хочу объединить столбцы на основе одинаковых идентификаторов и убедиться, что строки объединены в одну строку (для каждого идентификатора). Может ли кто-нибудь помочь мне объединить столбцы для дубликатов и не дубликатов? Данный: ID Name Degree AM_Class PM_Class Online_Clas....
3 Фев 2022 в 09:43
Предположим, у нас есть этот фрейм данных: > data ID Period_1 Values 1 1 2020-03 -5 2 1 2020-04 25 3 2 2020-01 35 4 2 2020-02 45 5 2 2020-03 55 6 2 2020-04 87 7 3 2020-02 10 8 3 2020-03 20 9 3 2020-04 30 data <- data.frame( ID = c(1,1,2....
3 Фев 2022 в 08:35
Я создаю шаблон для обработки опросов SurveyMonkey в готовом формате Tableau. Я разбиваю опросы на типы вопросов. Я хочу максимально автоматизировать сценарий, поэтому я пытаюсь использовать цикл for для каждого типа вопроса. Для наших целей давайте остановимся на вопросе о типе рейтинга. Скажем, ....
3 Фев 2022 в 07:42