Фрейм данных представляет собой табличную структуру данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.

Подробнее про dataframe...

У меня есть фреймворк с двумя индексами: group и class . У меня есть словарь, содержащий дополнительные уровни, которые нужно добавить в оба этих индекса. В частности, я хочу добавить E в индекс group . И я хочу, чтобы все g1, g2 и g3 присутствовали в индексе class для каждой группы (поэт....
15 Окт 2021 в 14:55
У меня есть фреймворк с предметами и годами, на каждый год есть только один предмет. Я хочу создать временные интервалы из категорий, когда даты непрерывны: cat <- c("Cat1","Cat1","Cat2","Cat2","Cat2","Cat3","Cat2","Cat2","Cat2") year <- c(2010,2011,2012,2013,2014,2015,2016,2017,2018) df <- data.....
15 Окт 2021 в 14:25
Я использовал это, чтобы найти первое ненулевое значение строки: def get_first_non_null_values(df): first_non_null_values = [] try: kst = df['kst'].loc[df['kst'].first_valid_index()] first_non_null_values.append(kst) except: kst = df['kst22'].loc[df['kst22'].first....
15 Окт 2021 в 11:38
Мой DF выглядит так: column1 column2 2020-11-01 1 2020-12-01 2 2021-01-01 3 NaT 4 NaT 5 NaT 6 Результат должен быть таким: column1 column2 2020-11-01 1 2020-12-01 2 2021-01-01 3 2021-02-01 4 2021-03-01 5 2021-04-01 6 Я не могу создать следующу....
15 Окт 2021 в 11:36
У меня есть строковый столбец в моей таблице df, как показано ниже: d = {'col1': ['1.2', '3.4', '1.99', '0.14', '2.9', '', '2.3']} df = pd.DataFrame(data=d) df Я хотел бы преобразовать этот столбец так, чтобы все значения содержали два десятичных знака, но без изменения типа этого столбца на числ....
15 Окт 2021 в 10:51
В DataFrame «рейтинги» есть два столбца, представляющих интерес: User-ID и Book-Rating. Я пытаюсь создать гистограмму, показывающую количество книг, прочитанных одним пользователем в этом наборе данных. Другими словами, я хочу подсчитать Книжные Рейтинги на User-ID. Я включу набор данных на случай....
15 Окт 2021 в 09:57
Я хочу объединить информацию из нескольких источников, чтобы нарисовать различные аспекты серии диаграмм. Различные диаграммы представляют разные элементы, но для каждой диаграммы я пытаюсь объединить коробчатую диаграмму, диаграмму рассеяния, линию наилучшего соответствия с уравнением, линию для с....
15 Окт 2021 в 09:32
Setup: df_input = pd.DataFrame(data={'Session': [0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2], 'Action': ['Start', 'Action1', 'Action2', 'Action3', 'Pause', 'Action4', 'Action5', 'Resume', 'Finish', 'Start', 'A....
15 Окт 2021 в 07:00
Я пытался изменить значения всех столбцов моего df. Что происходит, так это то, что мой df имеет разные столбцы с одинаковыми значениями, но я хочу изменить их по-разному в зависимости от столбца (например, я хочу, чтобы 1 в столбце «SEXO» было «Varón», а 1 в столбце "NIVEL_EDUCATIVO" будет "Непол....
15 Окт 2021 в 05:07
Просто скажите, что я хочу продолжить количество букв «а» и «р» в слове «яблоко», я могу: library(stringr) sum(str_count("apple", c("b", "k"))) Но когда я пытаюсь применить эту логику для подсчета количества «a» и «p» в нескольких разных словах в переменной в фреймворке данных, это не работает, нап....
14 Окт 2021 в 16:18
У меня есть такая серия панд: LIST 0 ITEM1 1 Element1 2 Element2 3 Element3 4 Element4 5 Element5 6 Element6 7 Element7 8 ITEM2 9 Element8 10 ELEMENT9 11 ELEMENT10 12 ....
14 Окт 2021 в 15:55
Я действительно не уверен, есть ли технический термин для того, что я пытаюсь сделать, поэтому я постараюсь быть как можно более ясным. Сейчас у меня 18 таблиц размером 2x9 = 18 ячеек. Это наборы токенов, которые я собираюсь использовать в эксперименте. Каждая из этих таблиц характеризуется разным ....
14 Окт 2021 в 15:18
В моем фрейме данных есть 2 столбца, которые выглядят примерно так: a b NA NA yes NA no NA yes NA NA yes NA no NA NA Na yes То, что я хотел бы получить в качестве вывода: ab NA yes no yes yes no NA yes Обратите внимание, что: В исходных столбцах всегда будет NA в любой данной ....
14 Окт 2021 в 12:35
Скажите, что у меня есть df вот так: Value 0 True 1 True 2 False 3 False 4 False 5 True 6 True 7 False 8 True 9 True И скажем, что я хочу назначить каждой группе значений True метку, чтобы последовательные значения True получали одну и ту же метку, потому что они составляют кластер, т....
14 Окт 2021 в 12:28
Мой df выглядит так, как показано ниже id number 123 1 256 2 879 3 132 4 3215 5 216 6 Результат должен быть таким: id number 123 1 256 2 879 3 132 4 3215 5 216 6 ....
14 Окт 2021 в 12:01
Я пытаюсь имитировать поведение R mutate(across()) с помощью Pandas, и однострочный способ сделать это - через понимание словаря. Например, если у меня есть DataFrame, который выглядит так: df.head() >>> jam_cpi_eop bah_cpi_eop >>> 1980-01-01 3.038 38.714 >>> 1981-01-01 ....
У меня возникли проблемы с исправлением следующей проблемы: у меня есть фрейм данных с токенизированным текстом в каждой строке, который выглядит (что-то) следующим образом index feelings 1 [happy, happy, sad] 2 [neutral, sad, mad] 3 [neutral, neutral, happy] И списки слов ....
14 Окт 2021 в 10:50
Думаю, это следует задать раньше, но по ключевым словам я не смог найти ответа на этот простой вопрос. У меня есть dataframe df и clf вывода классификатора. Я хотел бы, чтобы результат был n-м элементом строки, как указано n-м элементом классификатора, для всех строк фрейма данных. поэтому вывод в....
14 Окт 2021 в 07:08
У меня есть пара столбцов "car_model" и "year", которые мне нужно отправить функции как tuple, и она вернет мне цену (float). Как перебирать строки фрейма данных, отправлять значения "car_model" и "year" функции и добавлять возвращаемое значение в новый столбец "price"? Я думал о: model_year = CAR[[....
14 Окт 2021 в 04:48
Я пытаюсь перебрать некоторые неструктурированные текстовые данные в Python. Конечная цель - структурировать его в фреймворке данных. На данный момент я просто пытаюсь получить соответствующие данные в массиве и понять функциональность line, readline () в python. Вот как выглядит текст: Title: ti....
14 Окт 2021 в 04:22
Вот фиктивный DataFrame моих данных, у меня есть категориальные строки (представленные наличием значения NaN для 'Price') и строки данных (представленные не - NaN значение 'Price'). gear = [('Baseball', None), ('Bat', 1), ('Glove', 2), ('Soccer', None), ('Shoes', 3), ('Ball', 4), ('Football', None)....
13 Окт 2021 в 21:09
У меня есть следующий фрейм данных DATETIME,TYPE 2021-10-13 18:04:52,NaN 2021-10-13 18:04:53,NaN 2021-10-13 18:04:54,NaN 2021-10-13 18:04:55,NaN 2021-10-13 18:04:56,NaN 2021-10-13 18:04:57,NaN 2021-10-13 18:04:58,Defect 2021-10-13 18:04:59,NaN 2021-10-13 18:05:00,NaN 2021-10-13 18:05:01,NaN 2021-10-....
13 Окт 2021 в 16:12
У меня такой df: d = {'label':['A','B','G','O'] ,'label2':['C','D','O','Z']} df = pd.DataFrame(d) print(df) label label2 0 A C 1 B D 2 G O 3 O Z Что я хочу сделать, так это избавиться от повторяющихся строк с label = label2 (оставить только первую). Итак, я хочу получить....
13 Окт 2021 в 16:11
У меня есть DataFrame, где я пытаюсь добавить новый столбец «ранг», чтобы определить ценовой рейтинг относительно столбцов «имя» и «страна» путем сравнения цен (столбец «цена»). Если цена одного товара одинакова, при использовании df['rank'] = df.groupby('name')['price'].apply(lambda x: x.sort_valu....
13 Окт 2021 в 13:26
У меня есть столбец кадра данных, который выглядит так: Chr1 Chr14 Chr19 Chr2 Chr8 Chr7 Я хочу создать новый столбец, который выглядит следующим образом: 1 14 19 2 8 7 Я пробовал этот код, но у меня он не работал: New $ CHR_1 % as.integer....
13 Окт 2021 в 13:26