Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

У меня есть датафрейм, как показано ниже: import pandas as pd # intialise data of lists. data = {'Name':['Tom', 'nick', 'krish', 'jack'], 'Book1':[20, 21, 19, 18], 'Book2':[20,'', 12, 20], 'Book3':[31, 21, 17, 16], 'Book4':[31, 19, 18, 16]} # Create DataFrame df = pd....
27 Ноя 2021 в 16:48
Итак, я пытаюсь создать новые данные во временном ряду на основе прошлых данных. Например, у меня есть данные об игроках, где каждая строка представляет собой статистику, накопленную в определенном возрасте. Я хочу создать новую строку в Dataframe, где я увеличиваю максимальный возраст на единицу,....
27 Ноя 2021 в 06:51
Как определить, не начинается ли каждая строка в столбце с совпадения с регулярным выражением. Мне нужно проверить, когда столбец НЕ равен строке. Я нашел: pandas.Series.str.match И это почти то, что мне нужно, но я хочу получить True, когда строка НЕ ​​совпадает....
27 Ноя 2021 в 05:00
Я не уверен, что делаю не так. У меня есть фреймворк: ticker year GHG provided 0 SECO.AB 2020 190748000 True 1 MT.NA 2020 182300000 True 2 HOLN.SW 2020 129000000 True Но когда я пытаюсь вставить в свою БД, я получаю индекс в виде таблицы: df[['ticker', 'year'....
27 Ноя 2021 в 02:01
У меня есть фрейм данных, например: Groups Value Element G1 1 A G1 4 B G1 6 C G2 2 D G2 1 E G3 7 F G3 4 G G3 2 H G3 2 I И я хотел бы добавить новый столбец под названием first_Element, который будет для каждого Groups элемен....
26 Ноя 2021 в 22:48
Я получил dict с ключами и значениями, например: dict_1 = {'Dog': ['Dog'], 'Car': ['Cat']} И DataFrame ,name,values 0 Apple [Apple] 1 Pear [Pear] 2 Lemon [Lemon] Я хотел бы добавить / добавить диктант в столбцы в существующем фрейме данных ,name,values 0 Apple [Apple] 1 Pear ....
26 Ноя 2021 в 20:53
У меня есть dataframe1, который показывает рейтинг аудитории и жанр каждого фильма: movie_id| rating | action | comedy | drama 0 4 1 1 1 1 5 0 1 0 2 3 0 1 1 1 для действия означает, что это боевик, а 0 означает, ....
26 Ноя 2021 в 20:49
У меня есть фреймворк panda с 3 столбцами: Brand Model car_age PEUGEOT 207 4. 6-8 BMW 3ER REIHE 2. 1-2 FIAT FIAT DOBLO 3. 3-5 PEUGEOT 207 1. 0 BMW 3ER REIHE 2. 1-2 PEUGEOT 308 2. 1-2 BMW 520D 2. 1-2 .....
26 Ноя 2021 в 20:40
У меня есть следующая функция для получения имени столбца последнего ненулевого значения строки import pandas as pd def myfunc(X, Y): df = X.iloc[Y] counter = len(df)-1 while counter >= 0: if df[counter] == 0: counter -= 1 else: break return(X....
26 Ноя 2021 в 20:30
Как я могу отделить текст от числа в Panda Python, если он еще не разделен пробелом ("")? В моем фрейме данных df у меня есть столбец с 0,3314QSF. Я хочу разделить это на два столбца, содержащие соответственно 0,3314 и QSF в двух разных столбцах в моем фрейме данных. Фрейм данных состоит из тысяч с....
26 Ноя 2021 в 19:43
У меня есть фрейм данных со столбцом, содержащим имена состояний. Имена представляют собой смесь аббревиатур штатов США и названий штатов других стран. И я только хочу изменить названия штатов США и оставить другие как есть. Data Country State 1 United States MI 2 United St....
26 Ноя 2021 в 19:12
Я тестирую библиотеку Spacy, но у меня возникают проблемы с очисткой предложений (т.е. удалением специальных символов; знаков препинания; таких шаблонов, как [Verse], [Chorus], \ n ...) перед работой с библиотекой. Я в некоторой степени удалил эти элементы, однако, когда я выполняю токенизацию, я за....
26 Ноя 2021 в 19:00
У меня есть папка /data/csvs, которая содержит ~ 7000 файлов CSV, каждый из которых содержит ~ 600 строк. У каждого CSV есть имя, которое содержит отметку времени, которую необходимо сохранить, например /data/csvs/261121.csv, /data/csvs/261122.csv (261121 сегодняшняя дата 26/11/21). Мне нужно: Заг....
26 Ноя 2021 в 17:46
У меня есть фреймворк Python. Моя колонка Date-Time содержит дату и время. Некоторые из них отформатированы как даты, а некоторые были введены как строки. Используя python, я хочу пропустить ячейки типа str и применить эту функцию к остальным: df['Date-Time'] = df['Date-Time'].apply(lambda x: x.s....
26 Ноя 2021 в 17:33
Так выглядит мой набор данных, Temp (C) Rel Hum (%) Wind Spd (km/h) St 0 8.1 81 4 0.0 1 8.1 79 4 2.0 2 8.1 78 4 3.0 3 8.1 80 4 3.0 4 8.1 78 4 2.0....
26 Ноя 2021 в 17:14
Я пытаюсь написать свой первый сценарий синтаксического анализа этого файла; ;$FILEVERSION=1.3 ;$STARTTIME=44512.7163933106 ; ;------------------------------------------------------------------------------- ; Bus Name Connection Protocol Bit rate ; 1 Connection1 Untitled6@....
26 Ноя 2021 в 15:41
Я хочу присоединиться к фрейму и серии данных pandas, чтобы лучше понять, я беру следующий пример, в реальном сценарии есть несколько столбцов, любые предложения будут заметны import pandas as pd data = [[1,2],[2,3],[3,4]] df1 = pd.DataFrame(data, columns=['A',"B"]) print(df1) dict = {'C': 5, ....
26 Ноя 2021 в 15:32
Добрый вечер, я пытался работать с набором данных Instacart в рамках своих онлайн-классов, используя Jupyter Notebook (Python); одно из требований - объединить все файлы (которые в основном имеют разные столбцы и один или два внешних ключа) в один большой CSV, как в этом случае: https://github.com/....
26 Ноя 2021 в 14:32
У меня есть следующий фрейм данных с почасовым разрешением day_ahead_DK1 Out[27]: DateStamp DK1 0 2017-01-01 20.96 1 2017-01-01 20.90 2 2017-01-01 18.13 3 2017-01-01 16.03 4 2017-01-01 16.43 ... ... 8756 2017-12-31 25.56 8757 2017-12-31 11.02 8758 2017-12-3....
26 Ноя 2021 в 14:30
Как я могу удалить все символы перед определенным символом в столбце Dataframe? В этом примере удалите все ДО первой запятой (,), и, конечно, названия компаний всегда будут разной длины и редко будут одинаковыми, но всегда перед первой запятой. Мой Dataframe: address 0 My Company Ltd, address....
26 Ноя 2021 в 14:01
Я хочу изменить формат столбца фрейма данных с ГГГГ-ММ-ДД на ДД / ММ / ГГГГ. Я делаю это с помощью: df['Start Date'] = pd.to_datetime(df['Start Date'], format='%Y-%m-%d') df['Start Date'] = df['Start Date'].apply(lambda x: x.strftime('%d/%m/%Y')) Я хочу сделать это сейчас в функции: def datesqltoe....
26 Ноя 2021 в 13:15
У меня есть фреймворк, содержащий заказы. Каждый товар имеет свой цвет. Я хочу создать (линейный) график ежемесячных данных и показать появление цветов в течение месяца. Фрагмент текущего фрейма данных: Color 2021-08-25 17:43:30 Blue 2021-08-25 17:26:34 Blue 202....
26 Ноя 2021 в 12:56
Скажем, у меня есть два фрейма данных с мультииндексами, где один из индексов глубже другого. Теперь я хочу выбрать только те строки из одного (более глубокого) фрейма данных, где их частичный индекс включен в другой фрейм данных. Пример ввода: df = pandas.DataFrame( { "A": ["a1", "a1",....
26 Ноя 2021 в 12:32
У меня есть рабочий код для выполнения некоторых вычислений и создания фрейма данных, однако требуется значительное количество времени, когда число if, рассматриваемое как id: s, растет (на самом деле, время увеличивается экспоненциально). Итак, вот если ситуация: у меня есть фрейм данных, состоящий....
26 Ноя 2021 в 12:21
Я пытаюсь создать функцию с названием sales_recap для расчета минимальной, максимальной и средней стоимости продажи. def sales_recap(sales) Например, если у меня есть фрейм данных в качестве входных данных, например: sales = pd.DataFrame({ 'Type':['Electronics', 'Electronics', 'Electronics', 'H....
26 Ноя 2021 в 12:14