Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

У меня есть следующий Pandas DataFrame, но у меня возникают проблемы с обновлением значения заголовка столбца или с легким доступом к значениям заголовка (например, для отображения времени в местоположении (lon, lat) из заголовка). df = pd.DataFrame(columns = ["id0", "id1", "id2"]) df.loc[2012]= [24....
22 Май 2016 в 03:18
Итак, я пытаюсь получить данные об акциях, цене закрытия и скользящих средних 50, 100, 200. У меня есть другой массив, который затем является меткой, которая является покупкой или продажей. Он был разработан на базе данных вместе со всеми другими массивами. Но проблема в том, что когда я пытаюсь о....
Предположим, у меня есть фрейм данных pandas, столбцы которого ['a', 'b', 'c']. Все они имеют целые числа типа. Я хочу найти количество уникальных значений в столбце «b», соответствующих каждому уникальному значению в столбце «c», и сохранить его в новом кадре данных. Как мне это сделать с помощью п....
21 Май 2016 в 23:12
Используя приведенный здесь пример, Удалите все повторяющиеся строки в Python Pandas Допустим, я не хочу отбрасывать дубликаты, а меняю значение данных в одном из столбцов подмножества. Итак, согласно примеру, если мы используем subset = ['A', 'C'] для идентификации дубликатов, тогда я хочу изменить....
21 Май 2016 в 23:12
У меня есть два кадра данных DF и DF2 и список List1. Для простоты я буду использовать пример ввода. DF и DF2 содержат элементы, которые находятся в List1. DF имеет случайное расположение этих элементов с некоторыми значениями NaN, а в DF2 эти элементы связаны с числом. Вот что я собираюсь сделать: ....
21 Май 2016 в 23:05
В настоящее время индекс в моем фрейме данных имеет значения по умолчанию 0,1,2 .. n-1, где n - количество строк в фрейме данных. Есть ли простой способ изменить значения индекса на 0,, 1,,, 2 ,, ... n-1, где к каждому значению индекса добавляется запятая. Таким образом, 0 становится 0,, а 1 станови....
21 Май 2016 в 22:09
Я пытаюсь распечатать или получить список имен столбцов с пропущенными значениями. Например. data1 data2 data3 1 3 3 2 NaN 5 3 4 NaN Я хочу получить ['data2', 'data3']. Я написал следующий код: print('\n'.join(map( lambda x : str(x[1]) ,(filter(lambda z: z[0] !....
21 Май 2016 в 21:37
Как отфильтровать сводные таблицы для возврата определенных столбцов. В настоящее время мой фрейм данных таков: print table sum Sex Female Male All Date (Intervals) April 166 191 357 August 212 263 ....
21 Май 2016 в 20:43
У меня есть pandas Dataframe, в котором также есть столбец с именем файла изображения. Как я могу отобразить изображение внутри DataFrame? Я пробовал следующее: import pandas as pd from IPython.display import Image df = pd.DataFrame(['./image01.png', './image02.png'], columns = ['Image']) df['Ima....
21 Май 2016 в 20:06
Учитывая следующие таблицы из файлов CSV: CSV 1: A B C AA BB1 BB2 CC 0 1 text 5 7 1 2 text2 6 8 2 3 text3 7 9 В пандах: import pandas as pd mi=pd.read_csv('csv_to_mi.csv',header=[0,1],encoding='latin-1') mi = mi.rename(columns={....
21 Май 2016 в 19:41
Я пытаюсь отфильтровать несколько лет в моем очень большом массиве данных. Это очень короткая и простая версия моих данных: Year Value Symbol 2001 0.1 ABC 2002 0.1 ABC 2003 0.2 ABC 2002 0.4 ZZZ 2003 0.8 ZZZ 2000 0.9 ASD 2001 0.1 ASD 2002 0.3 ASD 200....
21 Май 2016 в 19:25
Учитывая следующий фрейм данных: d2=pd.DataFrame({'Item':['y','y','z','x'], 'other':['aa','bb','cc','dd']}) d2 Item other 0 y aa 1 y bb 2 z cc 3 x dd Я хотел бы добавить строку вверху, а затем использовать ее как уровень 1 заголовка multiIndex....
21 Май 2016 в 18:32
У меня есть два фрейма данных с несколькими столбцами. df_1 = pd.DataFrame({'A': ['x', '-', 'z'], 'B': [1, 6, 9], 'C': [2, 1, '-']}) > df_1 A B C 0 x 1 2 1 - 6 1 2 z 9 - df_2 = pd.DataFrame({'A': ['w', 'y', 'y'], 'B': [5, 6, 9], 'C': [2, 1, 8]}) > df_2 A B C 0 w 5 2 1 y 6 ....
21 Май 2016 в 16:30
ipdb> df["input"] datetime 2011-01-01 2.577163 2011-01-02 0.579833 2011-01-03 -0.191187 2011-01-04 0.430754 ipdb> df["input"].pct_change() datetime 2011-01-01 NaN 2011-01-02 -0.775011 2011-01-03 -1.329728 2011-01-04 -3.253050 Я хочу, чтобы значение 2011-01-04 -3.253050 б....
21 Май 2016 в 15:26
У меня есть очень большой набор данных, которые в настоящее время хранятся в старинной базе данных. Я хочу извлечь их в удобочитаемый формат (YAML или JSON). Основная цель здесь - избежать избыточности путем группирования похожих записей. Мои данные можно резюмировать так: raw = [{'a': 1, 'b': 2, ....
21 Май 2016 в 14:51
Я пытался импортировать данные из Yahoo Finance через panda, а затем преобразовывать их в массивы через .as_matrix (), а затем, когда я вводил данные в классификатор для обучения, он выдает ошибку. ValueError: Found array with dim 4. Estimator expected <= 2. Вот мой код: from sklearn import tree im....
21 Май 2016 в 12:26
Проблема Я объединил две серии типа int, а фрейм данных, который я получаю взамен, имеет тип float. Это происходит потому, что индексы ряда не выровнены, и когда происходит конкатенация, панды заполняют пробелы с помощью NaN. Однако NaN считается float и, к сожалению, конвертирует все мои int в fl....
21 Май 2016 в 12:05
Есть ли способ установить l2-Penalty для модели логистической регрессии в statsmodel через параметр или что-то еще? Я только что нашел l1-Penalty в документации, но ничего не l2-Penalty.....
21 Май 2016 в 09:44
У меня есть фрейм данных, который выглядит следующим образом: df Date Hr CO2_resp 0 5/1/02 600 0.000889 1 5/2/02 600 0.000984 2 5/4/02 900 0.000912 Как мне создать столбец Ind, представляющий числовой индекс часов, прошедших с полуночи 1 января 2002 года....
21 Май 2016 в 07:08
Учитывая следующий фрейм данных: d2=pd.DataFrame({'Item':['items','y','z','x'], 'other':['others','bb','cc','dd']}) d2 Item other 0 items others 1 y bb 2 z cc 3 x dd Я хотел бы создать многоиндексированный набор заголовков, чтобы текущие заголовки ....
21 Май 2016 в 06:12
Мне нужно переформатировать свои данные для генетического программного обеспечения, которое требует разделить каждый столбец на два, например 0-> G G; 1-> A G; 2 -> A A;. Выходной файл должен быть разделен табуляцией. Я пытаюсь сделать это в пандах: import csv import pandas as pd import numpy as n....
21 Май 2016 в 03:35
У меня есть фреймворк. Я хочу взять внутренний продукт каждого столбца с собой и подвести итог. Пока что я сделал это: import pandas as pd import numpy as np np.random.seed([3, 1415]) df = pd.DataFrame(np.random.rand(10, 3).round(2), columns=['one', 'two', 'three']) inner_df = df.T.dot(df) print ....
21 Май 2016 в 01:14
Учитывая следующий фрейм данных: df = pd.DataFrame({'A' : ['1','2','3','7'], 'B' : [7,6,5,4], 'C' : [5,6,7,1], 'D' : [1,9,9,8]}) df=df.set_index('A') df B C D A 1 7 5 1 2 6 6 9 3 5 7 9 7 4 1....
21 Май 2016 в 00:12
Я новичок в Python и фреймах данных. Мне было интересно, есть ли лучший способ сделать что-то вроде этого: df['Datetime'] = df.index df.reset_index(inplace=True, drop=True) df['id'] = df.index df.index = df['Datetime'] df.drop('Datetime', axis=1, inplace=True) Мне нужен столбец идентификатора / ин....
20 Май 2016 в 23:47
У меня есть DataFrame pandas с 4 столбцами, первый из которых «ID NUMBER». Я пытаюсь отфильтровать «ИДЕНТИФИКАЦИОННЫЙ НОМЕР» и получить те же значения, объединенные вместе. После этого я хочу извлечь каждый из них с одинаковыми значениями в другой файл csv с их уважаемым именем. DataFrame : I....
20 Май 2016 в 23:27