Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

Я хочу отфильтровать и вернуть столбец на основе того, имеет ли каждая страна больше F, чем M. Например, если в стране больше F, чем M, столбец вернет True, иначе False. Как я могу сделать это в пандах? пожалуйста помоги! Большое спасибо. Я уже отфильтровал коды стран, пол и их количество. Мне п....
4 Фев 2022 в 18:10
У меня есть фрейм данных, как показано ниже td = {966: [('Feat1', -0.04), ('Feat2=True ', -0.02), ('Feat3 <= 20000.00', 0.01), ('Feat4=Power Supply', -0.01), ('Feat5=dada', -0.0)], 879: [('Feat8=Rare', 0.02), ('Feat11=HV', -0.01), ('Feat21=Power Supply', -0.01), ('20000.00 < Feat3 <= ....
4 Фев 2022 в 13:06
Попытка преобразовать несколько файлов XLSB в CSV. Не уверен, в чем здесь проблема import os import pandas as pd path = r'C://Users//greencolor//Autoreport//Load_attachments//' for filename in os.listdir(path): if filename.startswith("PB orders"): print(filename) ....
4 Фев 2022 в 12:36
Я хочу найти среднее/среднее значение определенного значения в определенном столбце, значение представляет собой строку Допустим, это таблица RAM Screen_Size Resolution SSD HDD Weight Price 8 15.6 1920 x 1080 512 512 1.90 807.00 12 17.0 ....
4 Фев 2022 в 07:26
У меня есть образец данных df. Я хотел бы знать, есть ли способ вернуть все значения, начинающиеся со специального символа. В настоящее время у меня есть только возвращаемые значения со знаком «@», но мне нужны все специальные символы. Или, по крайней мере, как перечислить несколько вариантов с пом....
4 Фев 2022 в 07:24
Я пытаюсь преобразовать этот код json в кадр данных python. Я использовал конвертер json, чтобы преобразовать это в csv. Похоже, что значения столбцов находятся перед двоеточием. Должен ли я просто обернуть список имен столбцов? Моя конечная цель — оптимизировать процесс импорта данных. Это при....
4 Фев 2022 в 06:21
У меня есть Dataframe выглядит следующим образом. import pandas as pd import numpy as np # Create data set. present = 12 died = 20 dataSet = {'id': ['A', 'A', 'A','A','B','B','B','C'], 'id_2': [1, 2, 3, 1, 1,2,3,1], 'start' : [9,13,12,11,9,20,22,13], 'end' : [14,22,....
4 Фев 2022 в 06:06
У меня есть список как таковой li=[2,4,5,7,8,9,10,26,23,28,11,3,17,10] Я хочу создать новый столбец в моем кадре данных, чтобы 1-е значение в списке повторялось 8 раз, второе значение повторялось 8 раз, третье повторялось 8 раз, 4-е повторялось 9 раз, 5-е 9 раз, 6-й 9 раз и 7-й 7 раз. Следующие се....
4 Фев 2022 в 05:40
Я уже установил pandas для использования в python, но когда я пишу код для импорта pandas, его нельзя было использовать. Как я могу решить эту проблему?....
4 Фев 2022 в 05:31
Мои исходные данные выглядят примерно так: Day Time Type 3 21:00 0 3 21:00 0 3 22:00 0 4 21:00 0 3 21:00 1 3 22:00 1 4 22:00 1 3 21:00 2 4 22:00 2 4 22:00 2 Хотя это результирующие сгруппированные данные....
4 Фев 2022 в 05:24
Пример набора данных, с которым я работаю df = pd.DataFrame({"competitorname": ["3 Musketeers", "Almond Joy"], "winpercent": [67.602936, 50.347546] }, index = [1, 2]) Я пытаюсь выяснить, имеет ли 3 Musketeers или Almond Joy более высокое значение winpercent. Код, который я написал: more_popular = ....
4 Фев 2022 в 02:31
Я пытаюсь создать файл excel, содержащий записи объектов в списке. Я получаю файл только с последней записью. Такое впечатление, что записи перезаписывают друг друга. Вот мой код: import pandas as pd class dog: def __init__(self, id,type, name, age): self.id = id self.type = ....
4 Фев 2022 в 00:50
У меня есть кадр данных, который содержит такие столбцы - ['labels', 'labels.1', 'labels.2'] это продолжается до некоторого числа labels.n Один из этих столбцов содержит нужное мне значение. Я хочу получить это значение и добавить его в df['final_label']. Если значение отсутствует в столбцах меток....
3 Фев 2022 в 22:53
У меня такой df: values = {'a':[1,2,3,4], 'b':[1,2,5,9], 'c':[10,1000,20,30]} d=pd.DataFrame(values) Каков наилучший способ получить столбец с наибольшим разбросом между максимальным и минимальным значениями? Вывод должен быть следующим: c, потому что 1000 - 10 > 9 - 1 > 4 - 1....
3 Фев 2022 в 21:36
У меня есть pandas df с подзаписями. Я хотел бы создать условие для конкретной подзаписи, и если это условие не выполняется, я хотел бы удалить всю строку, чтобы обновить файл df. Например, я хотел бы проверить каждую подзапись 0 для всех записей и поставить условие, что если pt<120, то удалить всю....
3 Фев 2022 в 20:49
У меня есть процесс, который я могу перебирать для значений, хранящихся в списке, но он перезаписывает окончательный фрейм данных с каждым циклом, и я хотел бы добавить или объединить результат циклов в один фрейм данных. Например, приведенный ниже, я вижу, что «dataframe» будет сначала заполняться....
3 Фев 2022 в 20:45
Я хочу иметь возможность округлять весь столбец даты до любых двух 12-часовых значений, к которым ближе всего. Например, если я хочу, чтобы столбец был округлен до 8 утра или 8 вечера. dates = pd.to_datetime(['2022-01-28 15:25:22.456', '2022-01-27']) Должно стать этим dates2 = pd.to_datetime(['2022....
3 Фев 2022 в 19:47
Я хочу выбрать всю строку, в которой найдено минимальное значение 3 выбранных столбцов, в кадре данных следующим образом: После этого он должен выглядеть так: Я пробовал что-то вроде dfcheckminrow = dfquery[dfquery == dfquery['A':'C'].min().groupby('ID')] Явно плохо получилось. Заранее спасибо!....
3 Фев 2022 в 19:38
У меня есть следующий Excel-файл Который я преобразовал в DataFrame и удалил 2 столбца, используя приведенный ниже код: df = pd.read_excel(self.file) df.drop(['Name', 'Scopus ID'], axis=1, inplace=True) Теперь моя цель — поменять местами все имена в df. Например, Имя Adedokun, Babatunde Olubayo Кот....
3 Фев 2022 в 19:17
У меня есть файл .csv, который выглядит так: 1 [AS?] [NULL] x.x.x.x 1.5ms 2 [AS?] [NULL] x.x.x.x 2.7ms 4 [AS?] [NULL] x.x.x.x 31.6ms 6 [AS?] [NULL] x.x.x.x 43.5ms 7 [6805] [TEDE-INFRA] x.x.x.x 52.8ms 8 [6805] [TEDE-INFRA] x.x.x.x 49.2ms 9 [12638] [TEDE-INFRA] x.x.x.x 45.9ms 10 [15169]....
3 Фев 2022 в 19:13
В приведенном ниже df мне нужно заменить COST A и COST B для E на 0 и заменить комментарий на Un reported cost, когда выполняются следующие условия: E и F имеют одинаковую стоимость для «СТОИМОСТИ A». E и F имеют одинаковую стоимость для «СТОИМОСТИ B». Как вы можете видеть, 20 и 0,5 для E заменяются....
3 Фев 2022 в 19:06
Учитывая этот словарь dataframe и word_index: import pandas as pd df = pd.DataFrame(data={'text_ids': [ [1, 2, 3, 2, 7, 2, 8, 2, 0], [1, 2, 4, 2, 7, 2, 8, 2, 0], [1, 2, 5, 2, 6, 2, 8, 2, 0....
3 Фев 2022 в 18:58
import pandas as pd import numpy as np df = pd.DataFrame(np.random.choice([np.nan,1], p=(0.8,0.2),size=(10,10))) print (df) 0 1 2 3 4 5 6 7 8 9 0 NaN NaN 1.0 NaN NaN NaN NaN NaN NaN NaN 1 NaN NaN NaN NaN NaN NaN NaN NaN 1.0 NaN 2 NaN NaN NaN NaN NaN N....
3 Фев 2022 в 18:22
import pandas as pd # initialize list of lists data = [['tom', 'Y','Y','N'], ['nick', 'N','N','N'], ['juli', 'N','Y','N'], ['Luc', 'Y','Y','N'], ['Adg', 'Y','N','N'], ['Flav', 'N','Y','N'], ['Alf', 'Y','Y','N'], ['Jut', 'Y','N','N'], ['Uan', 'Y','Y','Y']] # Create the pandas DataFr....
3 Фев 2022 в 17:56
У меня есть df следующим образом: col1 col2 ----------- a 1b a 1b a 1a b 2a b 3f И я хочу подсчитать, сколько уникальных пар имеет каждый элемент col1: output: (a, 2) (b, 2) ....
3 Фев 2022 в 17:23