Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

У меня есть два строковых столбца в кадре данных Pandas. Столбец 1 имеет тысячи различных значений, но столбец 2 имеет одну из пяти строк, скажем, A, B, C, D и E. Я хотел бы проверить, имеет ли column2 то же значение, если значения совпадают в column1, и определить индекс строки, если они различны.....
25 Ноя 2021 в 10:28
Data = {"mark": [1,2,3,4,5,6,7,8,9,10,11,12], "month": ['jan', 'feb', 'mar', 'апр', 'май', 'июн', 'июл', 'август', 'sep', 'oct', 'nov', 'dec']} df2 = pd.DataFrame (данные) До сих пор я пробовал ниже, но не получал, как указано выше: ` for i in df2['month']: if (i=='jan' or i=='feb' or i=='mar')....
25 Ноя 2021 в 10:11
У меня такой JSON: {'57333310': {'3179138607': {'clicks': 0, 'spent': 0, 'cpc': 0, 'qualityFactor': 1.5}, '0': {'clicks': 0, 'spent': 0, 'cpc': 0, 'qualityFactor': 1.5}}, '57335920': {'4001223651': {'clicks': 0, ....
25 Ноя 2021 в 09:30
У меня есть два строковых столбца в кадре данных Pandas. Я хотел бы проверить, если две строки имеют одинаковое значение в одном столбце, то они имеют одинаковое значение в другом столбце. idx col1 col2 1 A X 2 B Y 3 B Y 4 A X 5 C Z В приведенном выше примере co....
25 Ноя 2021 в 09:24
Учитывая 2 DataFrames: DF1 (серия): Col_Name_1 [['A, B'] ['B'] ['A, C'] ['B, C']] DF2: Col_Name_X, Col_Name_Y [['A', 'Paris'] ['B', 'London'] ['C', 'Mexico']] В DF1 мне нужно заменить все значения A, B, C, используя DF2, который является соответствующей таблицей. Критическим моментом является то....
25 Ноя 2021 в 08:46
Используя образец данных и код ниже, я пытаюсь сгруппировать по годам и месяцам и найти верхних K столбцов с наименьшими значениями std внутри всех столбцов, оканчивающихся на _values: import pandas as pd import numpy as np from statistics import stdev np.random.seed(2021) dates = pd.date_range('....
25 Ноя 2021 в 07:32
У меня есть DataFrame, содержащий MyMonth, и я хочу использовать эту переменную для создания других столбцов, таких как StartDate, EndDate и т. Д., Как указано ниже. У меня есть другой сценарий, который использует эти переменные в качестве фильтра, и я не люблю жестко кодировать StartDate, EndDate ....
25 Ноя 2021 в 07:31
Используя pandas, я превратил свой CSV-файл в фрейм данных и назвал его data_A data_A = pd.read_csv("D:/power.csv") data_A имеет столбец time Я хочу преобразовать его в целочисленный тип. Например, с 2020-01-01 00:00:00 на 20200101000000 Тип данных data_A['time'] - объект. Как я могу изменить в....
25 Ноя 2021 в 05:49
Рассмотрим следующий пример import datetime import pandas as pd df = pd.DataFrame({'var' : np.random.randint(0,10, size = 16993)}, index = pd.date_range('2021-01-01 00:00:00', '2021-03-01 00:00:00', freq ='5 min')) d....
25 Ноя 2021 в 05:20
Я настроил свой DataFrame так: cols = ['molecule_id', 'atom_id', 'atom_type', 'x', 'y', 'z'] data = pd.DataFrame()\ .from_dict(data_dict, orient='index', columns=cols)\ .set_index(['molceule_id', 'atom_id']) print(data.head(8)) Вот data_dict: dict[str, list] Это приводит к: ....
25 Ноя 2021 в 05:10
У меня есть данные в этой форме. a b c d e f 1 2 3 4 5 1m 7 8 9 1 2 1m 3.08 4 5 6 7 2 8 2 8 3 2 2 4 5 3 7 9 2 Я пытаюсь выбрать элементы столбца «a», которые имеют значения 2 в столбце «f». Я пытался использовать это: elements = df.query('f==2')['a'] После попытки распечатать эле....
25 Ноя 2021 в 04:44
Как довольно нечастый пользователь Pandas, я хотел бы знать, как лучше всего повернуть один столбец (представляющий время), чтобы он перемещался по горизонтали, а остальные складывались на основе другого столбца или индекса. Вот что я имею в виду: data = [ [2018, "Alex", 172, 61], [2019, "Alex",....
25 Ноя 2021 в 04:32
У меня есть такой код: import pandas as pd import os ext = ('.tsv') for files in os.listdir(os.getcwd()): if files.endswith(ext): x = pd.read_table(files, sep='\t', usecols=['#Chrom','Pos','RawScore','PHRED']) x.drop_duplicates(subset ="Pos",keep = False, inplace = True) data_frame=x.h....
25 Ноя 2021 в 02:09
Я хочу заполнить значения NaN таким образом: поместите те же значения, что и столбец B, если они имеют такое же значение в B Примере: A B nan 'ra' 9 'ra' 5 'pa' Таким образом, значение NaN в столбце A должно быть 9, потому что они имеют те же значения в столбце B.....
25 Ноя 2021 в 00:16
Я пытаюсь пометить некоторые значения в DataFrame в Pandas на основе самого значения на месте. df = pd.read_csv('data/extrusion.csv') # get list of columns that contain thickness columns = [c for c in data.columns if 'SDickeIst'.lower() in c.lower()] # create a function that returns the class base....
24 Ноя 2021 в 23:14
У меня есть DataFrame ниже, в котором есть некоторые недостающие значения. df = pd.DataFrame(data=[['A', 1, None], ['B', 2, 5]], columns=['X', 'Y', 'Z']) Поскольку df['Z'] должен быть целочисленным столбцом, я изменил его тип данных на pandas новый экспериментальный тип целое числ....
24 Ноя 2021 в 22:21
Я пытаюсь создать "таблицу с двумя записями" из многих столбцов в моем df. Я пробовал с pivot_table / crosstrab / groupby, но появление результатов с использованием этой функции не является удовлетворительным, поскольку не будет "таблицей с двумя записями" Например, если у меня есть такой фрейм дан....
24 Ноя 2021 в 21:40
У меня есть 2 набора данных, оба файла .txt. Инициализируется как: df_a = pd.read_csv("path_a.txt") # df_a.shape = (50000, 8) df_b = pd.read_csv("path_b.txt") # df_b.shape = (8000, 8) Их столбцы 8 имеют одинаковые имена. Я хочу объединить как col_1, столбец отметки времени в формате unix, так и с....
24 Ноя 2021 в 21:27
Я должен взять этот фрейм данных: d = {'Apple': [0,0,1,0,1,0], 'Aurora': [0,0,0,0,0,1], 'Barn': [0,1,1,0,0,0]} df = pd.DataFrame(data=d) Apple Aurora Barn 0 0 0 0 1 0 0 1 2 1 0 1 3 0 0 0 4 1 0 0 5 0 1 0 И подсчитайте частоту числа один в каждом столбце и созда....
24 Ноя 2021 в 21:16
(В этом сообщении не объясняется, что было запрошено ниже. Существует проблема слияния перед объединением или суммированием, вопрос заключается в использовании этих функций вместе для заполнения столбца.) У меня есть два фрейма данных, которые выглядят так (очевидно, это примеры): data1 = {'Name'....
24 Ноя 2021 в 20:37
Я установил твиттерскреб и запустил это from twitterscraper import query_tweets import daterime as dt import pandas as pd Но оказывается AttributeError: 'NoneType' object has no attribute 'find_all' Пожалуйста, помогите мне!....
24 Ноя 2021 в 20:31
У меня есть набор данных с информацией об одежде, один из столбцов - «цвет», в этом столбце 15% пропущенных значений. Я пытаюсь написать функцию, которая будет назначать «случайный» цвет одежде, значение которой отсутствует (с учетом вероятности того, что это определенный цвет). white 0.194729 ....
24 Ноя 2021 в 20:03
У меня есть данные 4D во фрейме данных. Мне нужно преобразовать его в массив 3D Numpy. Я могу сделать это с помощью циклов for, но есть ли более эффективный способ? # Data: df = pd.DataFrame() df['variable'] = ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C', 'D', 'D', 'D', 'A', 'A', 'A', 'B', ....
24 Ноя 2021 в 19:09
У меня есть файл CSV со столбцом (CODE REF), в котором хранятся два типа значений (1A и 1X); Я импортирую его в фрейм данных Pandas. CODE REF не всегда может начинаться с 1X, но я могу найти индекс первой строки, начинающейся с 1X, и соответствующим образом нарезать свой Dataframe. Я борюсь с осн....
24 Ноя 2021 в 18:54
У меня есть фрейм данных, подобный следующему, мультииндексированный по имени файла и номеру и содержащий столбец с именем метки. arr = [['filename1', 1, 'label1'], ['filename1', 2, 'label1'], ['filename1', 3, 'label2'], ['filename2', 1, 'label2'], ['filename2', 2, 'label....
24 Ноя 2021 в 18:48