Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

У меня есть датафрейм: df = pd.DataFrame({ 'BU': ['AA', 'AA', 'AA', 'BB', 'BB', 'BB'], 'Line_Item': ['Revenues','EBT', 'Expenses', 'Revenues', 'EBT', 'Expenses'], '201901': [100, 120, 130, 200, 190, 210], '201902': [100, 120, 130, 200, 190, 210], '201903': [200, 250, 450, 120, ....
9 Июн 2021 в 01:11
У меня есть пустышка df: data = {'numerator_en':[11, 113, 53], 'denominator_en':[91, 982, 298], 'numerator_fr':[6, 232, 58], 'denominator_fr':[63, 1278, 389], 'numerator_th':[14, 652, 231], 'denominator_th':[416, 3835, 1437], ....
8 Июн 2021 в 23:46
У меня есть фрейм данных с двумя столбцами, мне нужно разделить эти два столбца (столбец A и B) на N последовательных строк (например, 100 строк). так что на выходе будет 100 строк в столбцах A и B, еще 100 строк в столбцах C и D, ..... есть ли какая-то конкретная функция, которая может справиться ....
8 Июн 2021 в 23:21
Я использую Pandas Series для построения графиков данных из вывода vmstat. После загрузки данных фрейм данных выглядит хорошо: vmstat_filename = 'vmstat0607.csv' df = pd.read_csv(vmstat_filename, sep=',') df date_time free_mem block_ins block_outs interupts context_switches cpu_user ....
8 Июн 2021 в 23:00
У меня есть датафрейм Group Score Rank 1 0 3 1 4 1 1 2 2 2 3 2 2 1 3 2 7 1 Я должен взять разницу в баллах в следующем рейтинге внутри каждой группы. Например, в группе 1 ранг (1) - ранг (2) = 4-2 Ожидаемый результат: Group Sc....
8 Июн 2021 в 22:42
У меня есть датафрейм: Group Score 1 3 1 2 2 3 2 1 3 0 3 1 4 1 4 1 Я хочу взять средний балл каждой группы и расположить все группы на основе среднего балла в порядке убывания. Мой первоначальный мыслительный процесс состоит....
8 Июн 2021 в 22:35
Мне нужно создать словарь, в котором каждый элемент представляет собой строку. Ключ представляет конкретный столбец, а значения будут списком оставшихся записей столбца. Простой пример ниже: Пример df: Col_A Col_B Col_C Col_D Roger 5 blue house Kim 2 green ....
8 Июн 2021 в 21:20
У меня есть приложение, в котором я пытаюсь преобразовать Pandas DataFrame в объект JSON и обратно, и у меня возникает проблема, когда df содержит объект Timedelta. Я использую Pandas 1.2.4. Вот образец df, который я использовал: >>> timedelta_df = pd.DataFrame({'datetime': pd.Series(['2013-12-31T0....
8 Июн 2021 в 21:18
Я делаю личный проект по практике панд и Beautiful soup, я скопировал эту информацию и сохранил ее в pandas df вот так: 0 €8.5M 1 €0 2 €9.5M 3 €2M 4 €21M ... 16534 €1.8M 16535 €1.1M 16536 €550K 16537 €650K 16538 €1.1M Name: Value, Le....
8 Июн 2021 в 20:12
Вот входные данные 2019-09-06 00: 00: 1567702800 Я пробовал много способов изменить его на формат ГГГГ-ММ-ДД, но он не работает из-за этой части «00: 00: 1567702800» не правильный формат. Это должно быть 00: 00: 15.67702800. Как изменить формат с 00: 00: 1567702800 на 00: 00: 15.67702800?....
8 Июн 2021 в 18:20
У меня есть набор данных, содержащий два столбца. Один - это Message Received Timestamp, а другой - Message Sent Timestamp. Формат времени выглядит так 2021-06-05T07:00:34Z. Я хотел бы рассчитать разницу во времени в секундах между этими двумя столбцами и убедиться, что разница не превышает 24 ho....
8 Июн 2021 в 18:19
У меня есть столбец возраста: df.age, в котором существуют некоторые значения, не имеющие смысла в данном контексте. Как я могу преобразовать значения, выходящие за пределы диапазона 18–100, в NA? Я знаю, как это сделать в R, поскольку для этого есть функция, но есть ли что-то подобное в Python?....
8 Июн 2021 в 17:56
1 - Я пытаюсь преобразовать столбец «Дни» в количество дней в днях -> «-1 дней +08: 22: 13.269259» в «-1» 2 - а крайний срок столбца - только дата -> от «0021-06-09 00:00:00» до «09-06-21» >>>new['Days'] = (datetime.datetime.today() - pd.to_datetime(new['Deadline'], format=("00%y-%m-%d %H:%M:%S"))) ....
8 Июн 2021 в 17:27
Я хотел бы вставить объект в excel, но у меня возникают проблемы с переносом его в строку и отбрасыванием лет. Пример ниже: c Out[274]: 2020 3.000000 2021 323.216667 2022 127.533333 2023 1.500000 2024 -148.000000 2025 -25.083333 2026 -48.133333 2027 -234.033333 2028 ....
8 Июн 2021 в 17:10
У меня есть pd Dataframe cooc_all (симметричная матрица), из которого я хотел бы создать список, содержащий все значения из DataFrame. В настоящее время я сделал это следующим образом: pd_list = [] for i in range(0,40): for j in range(i, 40): pd_list.append(cooc_all[j][i]) Это лучший с....
8 Июн 2021 в 16:55
Я пытаюсь перебрать список ниже, который извлекается из таблицы HTML table = pd.read_html(url) Я извлек третью таблицу: table1 = table[2] Я пытаюсь подсчитать до определенного слова в списке переменных table1. структура вывода списка показана ниже 0 1 2 <-------....
8 Июн 2021 в 15:05
У меня есть фрейм данных pandas с несколькими строками, которые почти дублируют друг друга, за исключением одного значения. Моя цель - объединить эти строки и суммировать различное значение. Вот пример: names count subject A 2 physics A 3 physics A 3 chemistr....
8 Июн 2021 в 14:00
Я хочу удалить подмножество строк из Pandas DataFrame на основе проверки groupby(). Первичный DataFrame: >>> df name day fruit foobar 0 Tim 1 Apple 0 1 Tim 1 Apple 1 2 Tim 2 Apple 2 3 Anna 1 Banana 3 4 Anna 1 Strawberr....
8 Июн 2021 в 13:42
Я мог бы использовать функцию панд ISIN. По сути, мне нужно агрегировать данные в фреймворке данных по разным критериям по годам. Проблема в том, что мне нужно выполнить множество агрегатов данных (например, название страны, программу финансирования и т. Д.). Чтобы сделать это целесообразным, я п....
8 Июн 2021 в 13:21
У меня есть следующие дф: values_list = [[15, {'num':[0]}, 100], [20, {'num':[0]}, 50], [25, {'num':[0]}, 80], [45, {'num':[0], 'option':[1]}, 48], [40, {'num':[0]}, 70], [41, {'num':[0]}, 90], [51, {'num':[0]}, 111]] df = pd.DataFrame(values_list, columns=['Field_1....
8 Июн 2021 в 12:43
Как я могу анализировать строки, используя ту же логику, которую Pandas будет использовать при чтении CSV, где приведение «False» к bool даст мне False. У меня есть текстовые значения, введенные пользователями, которые мне нужно вставить в DataFrame, они должны автоматически приводиться к типу dtyp....
8 Июн 2021 в 11:44
Вход: df1 = pd.DataFrame([[101, 'DC1', 'QA,DEMO'], [101, 'EM5', 'QA,DEMO'], [102, 'RA6', 'PA,QA,GF'], [103, 'DC1', 'AB,LK'], [103, 'RA6', 'OO'], [103, 'PA4', 'AB,OO'] ] , columns=['Call_id', 'Agent....
8 Июн 2021 в 10:45
Я хочу перемешивать столбцы без порядка; полностью псевдослучайно, на одной строчке кода. Перед: A B 0 1 2 1 1 2 После: B A 0 2 1 1 2 1 Мои попытки до сих пор: df = df.reindex(columns=columns) df.sample(frac=1, axis=1) df.apply(np.random.shuffle, axis=1) ....
8 Июн 2021 в 10:28
Я пытаюсь удалить идентичную строку, совпадающую между двумя фреймами данных. однако, какой бы метод я ни пытался, идентичные строки в одном и том же фрейме данных также отбрасываются. Но я хочу сохранить идентичные строки из одного фрейма данных и отбросить те, которые совпадают только с другим ф....
8 Июн 2021 в 10:23
Мне пришлось расплавить 4 файла данных, а затем переименовать столбец значений, когда я кодирую только для каждого df, код работает, но при создании цикла for код не работает? Зачем? Цикл for: data_files = [df1, df2, df3, df4] names = ['child_mortality','income','life_expectancy','population'] i = ....
8 Июн 2021 в 10:15