Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

Я хочу объединить строки, содержащие определенное значение, однако я хочу, чтобы в объединенной строке были новые столбцы. Пример import pandas as pd df = pd.DataFrame([{'Day': "Monday", 'Item_1': "Shirt", 'Item_2': "Mug", 'Item_3': "Pen"}, {'Day': "Monday", 'Item_1': "S...
26 Ноя 2022 в 19:40
Я хотел бы удалить все элементы из списка списков, которые появляются более одного раза, и я ищу более гладкое решение, чем это: Удаление повторяющихся элементов из списка списков в Prolog Я не пытаюсь удалить повторяющиеся списки внутри родительского списка, как здесь: Как удалить дубликаты из вл...
26 Ноя 2022 в 19:32
Мне трудно преобразовать отдельные столбцы даты и времени из файла csv в объединенный столбец даты и времени с миллисекундами. Исходные данные: Date Time 0 2014/9/2 08:30:00.0 1 2014/9/2 08:37:39.21 2 2014/9/2 08:39:41.2 3 2014/9/2 08:41:23.9 4 2014/9/2 09:13:01.1 5 ...
26 Ноя 2022 в 19:31
Мне нужно создать кадр данных pandas на основе 4 файлов txt с комментариями (чтобы пропустить при чтении) на основе следующей структуры: # Moteur conçu par le Poly Propulsion Lab (PPL) nom=Tondeuse # Propriétés générales hauteur=0.5 masse=20.0 prix=110.00 # Propriétés du moteur impulsion specifiqu...
26 Ноя 2022 в 18:49
У меня немного сложный выбор в двух кадрах данных. Скажем, у меня есть такой фрейм данных country pop continent lifeExp gdpPercap 0 Afghanistan 31889923.0 Asia 43.828 974.580338 1 Albania 3600523.0 Europe 76.423 5937.029526 2 Algeria 33333216.0 Afr...
26 Ноя 2022 в 18:48
У нас есть 20 различных фреймов данных, каждый фрейм данных содержит историческую цену акций компании, например: Date ISFT 0 2017-11-27 648.10 1 2017-11-28 649.90 2 2017-11-29 639.90 3 2017-11-30 697.10 4 2017-12-01 675.20 ... ... 1186 2022-11-15...
26 Ноя 2022 в 18:48
Изменить: я понял это: Df_weather_test = df_погода Df_weather_test['date_time'] = pd.to_datetime(df_weather['date_time']) Df_weather_test2 = df_weather_test.resample('15T', on='date_time').mean().interpolate() У меня есть набор данных с почасовыми временными интервалами, каждый час которых содержит...
26 Ноя 2022 в 18:29
Я пытаюсь перезаписать значение, указанное в столбце «Группа», когда значение в столбце «Ключевое слово» является дубликатом соседнего значения. Например, поскольку строка «коммерческие услуги по уборке офисов» повторяется, я хотел бы перезаписать соседний столбец на «коммерческие услуги по уборке»....
26 Ноя 2022 в 18:21
Мой фреймворк данных похож на это: df = pd.DataFrame({"Name": ["A", "B", "C", "D", "E","F", "G"], "Tldiffto3": [2.0, -3.0, 2.0,17.0,7.0, 12.0,2.0], "LZdiffto3": [0.94, -5.0, 7.0,29.0,4.0, 10.0,2.5], ...
26 Ноя 2022 в 18:09
У меня есть фрейм данных, который выглядит так: info_version commits commitdates 18558 17.1.3 42 2017-07-14 20783 17.1.3 57 2017-07-14 20782 17.2.2 57 2017-09-27 18557 17.2.2 42 2017-09-27 18556 17.2.3 42 2017-10-30 20781 ...
26 Ноя 2022 в 18:02
Когда я запускаю applymap() в ячейке Jupyter, все работает нормально. Однако, когда я запускаю точно такой же код внутри своего класса, он не стилизует DataFrame. Этот код работает как положено #get the DataFrame from the class in the Jupyter cell df = my_class.quality('headers') # applymap() styl...
26 Ноя 2022 в 17:52
Я хотел бы удалить строку/столбец из 2d DataFrame. Предположим, что DataFrame выглядит так: animal cat dog hedgehog time 0 1 1 0 1 2 0 1 Как избавиться, скажем, от всей собачьей штуковины, чтобы получить что-то вроде этого: animal cat hedgehog time 0 1...
26 Ноя 2022 в 16:55
Привет, я хотел спросить, что у меня есть данные из 80 столбцов, и все они не имеют имен, а их 80 столбцов и 12500 строк в длину, и между ними есть пустые столбцы. 8,1,,0,1993,146,,2,1,,,,,,,,,,2.1,0.65,0.15,0.65,19.1,,18.03,,,19.6,,,0.06,,,,,,19.1,19.6294717,19.36473585,0.06,,,,51.25,19.3,23.3,-0.0...
26 Ноя 2022 в 16:46
У меня есть следующий кадр данных pandas df time animal 0 0 cat 1 0 dog 2 1 hedgehog 3 1 cat 4 1 cat Я бы хотел группировать по времени, подсчитывая, как часто животное находится в новой группе, например, 2x кошка за время 1...
26 Ноя 2022 в 15:53
Я использую финансовый API Yahoo для извлечения данных с помощью ThreadPoolExecutor. Может ли кто-нибудь показать мне, как привести вывод к превосходству, если это возможно? Спасибо Код import yfinance as yf from concurrent.futures import ThreadPoolExecutor def get_stats(ticker): info = yf.Ti...
26 Ноя 2022 в 14:03
У меня большой фрейм данных, и мне нужен новый столбец sig со значениями 0 или 1. Условия: Добавленное значение = 1 в 3-й строке каждого дня, начиная с 08:30, если data в строке 3 > data строка 2 > data строка 1, иначе 0 Ограничения: в исходном кадре данных интервалы секунд в метках времени не ра...
26 Ноя 2022 в 13:59
Я пытаюсь прочитать конкретный csv (plane-data.csv), но весь df имеет тип объекта. Мне нужно, чтобы «год» был в целочисленном типе, чтобы я мог выполнять вычисления. Пожалуйста, взгляните на мой скриншотМой набор данных взят из ссылки plane-data.csv Очень хотелось бы получить помощь, я искал весь и...
26 Ноя 2022 в 13:24
Я хотел бы сделать то же самое в пандах python, как показано на картинке. введите здесь описание изображения Это функция суммы, в которой первая ячейка фиксирована, а формула вычисляет «непрерывную сумму». Я пытался создать фрейм данных pandas, но мне это не удалось....
26 Ноя 2022 в 12:44
import numpy as np import pandas as pd import matplotlib.pyplot as plt #loding data file=pd.read_csv("students_scoure.csv") # print(file.shape) # print(file.head()) # print(file.describe()) #plot the data file.plt(x='Hours',y='Scores',style='o') plt.show() И я получаю сообщение об ошибке: 5902 re...
26 Ноя 2022 в 12:22
У меня есть простой график, исходный код которого приведен ниже: import pandas as pd def plot_responses(index, y): index='Arsen initial' y=pd.Series({1: 0.8, 2: 0.8, 3: 0.59, 4: 0.54, 5: 0.86, 6: 0.54, 7: 0.97, 8: 0.69, 9: 1.39, 10: 0.95, 11: 2.12, 12: 1.95, 13: 0.99, 14: 0.76, 15: 0.82, 16...
26 Ноя 2022 в 10:45
Привет, я использую txt-файл размером 3 ГБ и хочу изменить его на CSV, но он выдает error_bad_lines ParserError: ' ' ожидается после '"' Код, который я использую df1 = df.read_csv("path\\logs.txt", delimiter = "\t", encoding = 'cp437',engine="python") df1.to_csv("C:\\Data\\log1.csv",quotechar='"',er...
26 Ноя 2022 в 10:09
Я собираюсь использовать аналогию с футболом, чтобы проиллюстрировать проблему. У меня есть таблица, представляющая игроков в футбольном матче. player | position | start minute ------------------------------ Bob | keeper | 0 Pedro | Center Midfielder | 0 Joe | Striker ...
26 Ноя 2022 в 09:59
Я хочу разделить одну строку на несколько строк данных за 6 часов на основе 15-минутного интервала времени в фрейме данных pandas. start_time end_time 0 2022-08-22 00:15:00 2022-08-22 06:15:00 Я пробовал разделить время на один час и использовал код ниже result['start_time'] = re...
26 Ноя 2022 в 09:41
У меня есть один фрейм данных, содержащий статистику о сезоне НБА. Я просто пытаюсь отсортировать по дате, но по какой-то причине он группирует все игры с одинаковыми данными и меняет значения указанной даты на одинаковые значения. df = pd.read_csv("gamedata.csv") df["Total"] = df["Tm"] + df["Opp.1...
26 Ноя 2022 в 08:19
Это мой оригинальный файл CSV введите здесь описание изображения Я хочу сделать столбец жанра только первым тегом. когда я использую dataframe['genre'] = dataframe['genre'].str.extract('^(.+?),') Он получает строку до первой запятой, но также избавляется от столбцов без запятых введите описание и...
26 Ноя 2022 в 07:56