Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

У меня есть файл PDF, мне нужно преобразовать его в файл CSV, это ссылка на мой файл PDF https: //online.flippingbook.com/view/352975479/ используется код import re import parse import pdfplumber import pandas as pd from collections import namedtuple file = "Battery Voltage.pdf" lines = [] total_ch...
26 Ноя 2022 в 07:16
Я создал один новый фрейм данных, используя одно значение списка и столбца, и я успешно переименовал имя индекса, но я не могу переименовать имя первого столбца, я попробовал все возможные методы, которые я знаю (я хочу переименовать это имя столбца O с датой, я пробовал все методы, но это не срабо...
26 Ноя 2022 в 05:55
У меня есть кадр данных pandas. В столбце у меня есть список. Но некоторые строки NaN. Я хочу найти длину каждого списка, если это NaN, мне нужна длина 0. My_column [1, 2]-> should return 2 [] -> should return 0 NaN -> should return 0 Любая помощь? Спасибо....
26 Ноя 2022 в 04:53
Я сохранил словарь Python с помощью функции numpy np.save(). Мне пришлось загрузить allow_pickle, чтобы загрузить его обратно, поэтому теперь у меня есть словарь в таком формате: values = {(0, 0, 0): {0: -1421.05, 1: -1578.94, 2: -1473.65, 3: -1471.21},(0, 0, 1): {0: -142, 1: -157, 2: -147, 3: -147...
26 Ноя 2022 в 03:57
У меня есть 2 разных набора данных 1 — основные данные со строкой 400 тыс. — большие данные Еще одна строка 10k - небольшие данные Скажем df1 - большие данные Df2 - маленькие данные Я использую loc для 1 идентификатора. Я не хочу, чтобы столбец df1['ltl'] был равен нулю, поэтому я хочу заменить его ...
26 Ноя 2022 в 03:17
У меня есть список, каждая строка содержит 4 поплавка (должна представлять ограничивающую рамку) [[7.426758, 47.398349, 7.850835593464796, 47.68617800490421], [7.850835593464796, 47.398349, 8.274913186929592, 47.68617800490421], [8.274913186929592, 47.398349, 8.698990780394388, 47.68617800490421]]...
26 Ноя 2022 в 02:54
Я извлекаю данные из Sqlite3 и перемещаю их в фрейм данных для работы с ними. Однако я получаю этот странный результат, когда он помещает имя первого столбца во вторую строку, в то время как другие имена столбцов не затрагиваются в первой строке. Это создает проблемы, поскольку панды не распознают...
26 Ноя 2022 в 02:53
Поэтому я получил этот кадр данных, показывающий основные причины смерти за каждый год в Чили. Исходный фрейм данных Я хочу сделать что-то вроде этого: Что я хочу сделать Я хочу сделать это, чтобы увидеть, как конкретная причина смерти меняется в указанные годы. Я сделал фрейм данных, поэтому «Caus...
26 Ноя 2022 в 02:50
У меня есть файл данных, который я очищаю, и источник использует "--" для обозначения отсутствующих данных. В конечном итоге мне нужно, чтобы это поле данных было либо целым числом, либо числом с плавающей запятой. Но я не уверен, как удалить строку. Я указал типы в операторе type_dict перед импор...
26 Ноя 2022 в 02:47
У меня есть файл .csv, в котором перечислено несколько тысяч имен. Если я прочитаю CSV-файл в кадре данных pandas, легко ли добавить кавычки вокруг имен с «,» в конце каждой строки? Пример ниже Вот как теперь выглядит вывод CSV-файла. имя1 имя2 имя3 имя4 Как бы я хотел, чтобы результат выглядел с ...
26 Ноя 2022 в 01:05
Мне нужна помощь в очистке веб-сайта по личным причинам, но, поскольку я все еще учусь использовать Python, мне трудно с этим справиться. Я попытался использовать find.element("xpath","xpath code here") для извлечения таблицы с веб-сайта, но получил сообщение об ошибке, утверждающее, что элемент не...
26 Ноя 2022 в 01:02
Мне нужно преобразовать скрипт python в ruby. Я использую для этого гемы Pandas и Numpy, которые значительно упрощают работу. Например, у меня есть такие строки: # python # DF is a dataframe from Pandas DF['VAL'].ewm(span = vDAY).mean() DF['VOLAT'].rolling(vDAY).std() Поэтому без вопросов, я конв...
26 Ноя 2022 в 00:59
Чтобы мой алгоритм машинного обучения не стремился к определенным данным, я хочу уменьшить частотные различия в моем наборе данных, который представляет собой таблицу pandas, Например, в столбце X; Значение 1500 раз B значение 3000 раз C значение 1300 раз Есть ли способ получить 1250 из них всех?...
26 Ноя 2022 в 00:43
У меня есть датафрейм df = pd.DataFrame({'col' : [1,2, 10, np.nan, 'a'], 'col2': ['a', 10, 30, 'c',50], 'col3': [1,2,3,4,5.0]}) Как я получаю в столбце col2 новый фрейм данных с символами. В этом случае df_final = ['a', 'c'] Я пытаюсь проверить, если не число...
26 Ноя 2022 в 00:39
Пожалуйста, будьте терпеливы, я новичок в Python и Pandas. У меня много фреймов данных pandas, но некоторые из них дублируются. Поэтому я написал функцию, которая проверяет, равны ли 2 кадра данных, если они равны 1, они будут удалены: def check_eq(df1, df2): if df1.equals(df2): del[df...
26 Ноя 2022 в 00:30
У меня есть фрейм данных с 2 столбцами. Я пытаюсь отсортировать один столбец («значения») по убыванию, а когда два значения совпадают, отсортировать другой столбец по возрастанию. В настоящее время мой код: br_df = br_imgfeatures_df.mean().reset_index(name='value').sort_values(by='value', ascendin...
26 Ноя 2022 в 00:28
Я хочу обновить серию, если в ней отсутствует ключ, но мой код генерирует ошибку. Это мой код: for item in list: if item not in my_series.keys(): my_series = my_series[item] = 0 Где my_series — это серия dtype int64. На самом деле это подсчет стоимости. Мой код выше генерирует следующу...
26 Ноя 2022 в 00:05
У меня есть этот csv, содержащий несколько парных строк, таких как: LabebStoreId,catalog_uuid,lang,cat_0_name,cat_1_name,cat_2_name,cat_3_name,catalogname,description,properties,price,price_before_discount,externallink,Rating,delivery,discount,instock 6021,89028,en,Electronics & Appliances,Batteries...
25 Ноя 2022 в 23:54
У меня есть словарь с несколькими ключами и несколькими значениями для каждого ключа (иногда). Словарь заархивирован из двух списков, которые я вытащил из листа Excel с помощью pandas. Я преобразовал значения в целые числа. Мой словарь выглядит так: dictionary = {'A223':[1,4,5],'B224':[7,8,9],'A3...
25 Ноя 2022 в 23:53
У меня есть df со столбцом, в котором некоторые значения имеют ..., а некоторые .., а некоторые без точек. Type range Mike 10..13 Ni 3..4 NANA 2...3 Gi 2 Желаемый результат должен выглядеть так Type range Mike 10 Mike 11 Mike 12 MIke 13 Ni ...
25 Ноя 2022 в 23:53
У меня есть следующий кадр данных в качестве входных данных: FriendName,Restaurant,InterestRank,Cuisine,Cost,Alcohol Amy,R2,1,French,1,No Amy,R6,7,Japanese,0,No Ben,R5,2,Japanese,1,No Ben,R2,3,French,1,No Cathy,R5,1,Japanese,1,No Cathy,R8,2,Mexican,1,No Amy,R1,2,French,2,Yes Amy,R4,3,French,2,Yes Am...
25 Ноя 2022 в 23:02
У меня есть кадр данных с данными OHLC. Мне нужно получить цену закрытия в серии панд, используя столбец метки времени в качестве индекса. Я читаю из sqlite db в свой df: conn = sql.connect('allStockData.db') price = pd.read_sql_query("SELECT * from ohlc_minutes", conn) price['timestamp'] = pd.to_...
25 Ноя 2022 в 22:58
Я пытаюсь получить значения в столбце z, содержащие нулевые значения или целые числа: df = pd.DataFrame({'X': [1, 2, 3, 4], 'Y': [2, 10, 13, 18], 'Z': [3, None, 5, None]}) a = df[(df.X == 1) & (df.Y == 2)].Z.item() print(a) #output: 3 b = df[(df.X == 7) & (df....
25 Ноя 2022 в 22:53
У меня есть DataFrame со столбцом, который содержит словарь следующим образом: df: date dictionary 0 2021-01-01 00:00:00 + 00:00 'Total':{'USD':100, 'size':20}, 'country':{'USA': {'income': 20000}, 'fees': {'total': 55}} 1 2021-01-01 00:00:00 ...
25 Ноя 2022 в 22:46
У меня есть следующая строка кода df["high_int"] = df.Slope * (df.index - df.max_idx) + df,loc['max_idx', 'High] Max_idx содержит индексы самых высоких максимумов за период, например: 15 или 30. I have tried .loc, .iloc, .at, .iat .get, .shift(), as well as df['max_idx'].map(df['High']) Похоже,...
25 Ноя 2022 в 22:25