Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

У меня есть набор данных как таковой - и я хочу создать List of tuples как (Name_of_State , Literacy_rate) (JAMMU&KASHMIR, 89.78) #example Мне пришлось немного очистить, убрать районы и просто сохранить штаты. data=data[data['Name']!='India'] #removing the India's row data=data[data['TRU']=='T....
2 Дек 2020 в 08:48
Мне нужно написать функцию для фильтрации набора данных на основе некоторых иерархических условий. Цель этой функции - получить одну аннотацию для каждого белка из их группы. Функция должна сделать следующее: Сгруппируйте белки по столбцу "id" Проверьте каждый анализ в группе белков Выберите анализ ....
30 Ноя 2020 в 18:58
Я думаю, что это довольно общая проблема. А именно, чтобы преобразовать двудольную матрицу смежности в список из списка узлов. В Pandas это означало бы преобразование из определенного формата pd.DataFrame в определенный формат pd.Series. Для людей, не занимающихся дискретной математикой, это выгля....
Использование сюжета для гистограммы, сохраняет заказ набора данных при отсутствии использования {{x0}}: import pandas as pd import plotly.express as px df = pd.DataFrame({'val': [1, 2, 3], 'type': ['b', 'a', 'b']}, index=['obs1', 'obs2', 'obs3']) px.bar(df, 'va....
23 Ноя 2020 в 10:41
У меня есть фрейм данных со следующей структурой: 1995 1996 AT1 3 6 AT2 5 3 AT3 2 1 FR1 1 1 FR5 2 1 FR7 7 8 Я хотел бы добавить столбцы или создать фрейм данных, содержащий процент каждой строки от общего количества, в зависимости от групп, указ....
22 Ноя 2020 в 20:34
Привет эксперты, у меня есть длинный текстовый файл, содержащий данные, как показано ниже 1 2 3 4 5 6 7 Я хочу разбить файл по определенному индексу столбца и вставить разделенный вывод бок о бок. поэтому мой ожидаемый результат будет 1 5 2 6 3 7 4 Кто-нибудь может предложить решение на Python.....
22 Ноя 2020 в 17:27
Поэтому я использую расстояние Левеншира, чтобы найти ближайшее совпадение и заменить многие значения в большом фрейме данных, используя этот ответ в качестве основы: import operator def levenshteinDistance(s1, s2): if len(s1) > len(s2): s1, s2 = s2, s1 distances = range(len(s1) + ....
20 Ноя 2020 в 21:47
Я хотел бы объединить два фрейма данных. Фрейм данных 1: Name Early Mid Late AverageS Date Place Rno Num Bar xyz 32.0 12.2 32 76 20190202 NY 1 4 2 abc 46.0 24.2 96 67 20190802 SA 2 6 2 ghj 29.0 85.2 34 35....
20 Ноя 2020 в 13:47
Я пытаюсь справиться с несбалансированным multi label dataset с помощью cross validation, но scikit learn cross_val_score возвращает nan list of values при запуске классификатора. Вот код: import pandas as pd import numpy as np data = pd.DataFrame.from_dict(dict, orient = 'index') # save the given ....
Подобно этому вопросу: столбец списков Pandas, создать строку для каждого элемента списка Я хочу explode столбец списка, но также получить столбец ранга. Ни один из ответов, приведенных в приведенном выше вопросе, на самом деле не работает. Итак, вот как выглядит мой фрейм данных: df = a....
18 Ноя 2020 в 05:06
Учитывая следующую таблицу: df = pd.DataFrame({'pers_no': [1,1,2], 'start_date': ['2000-03-01','2000-06-01', '2001-04-01'], 'end_date': ['2000-05-01','2000-07-01', '2001-06-01'], 'value': [199,219,249]}) pers_no start_date end_date value 0 1 2000-03-01 2000-05-01 199 1 1 2000-06-01 20....
16 Ноя 2020 в 11:59
Я стремлюсь передать группу по количеству значений, но рассматриваю только строки, в которых Item и Item 2 разные. Следующее достигает этого, но отбрасывает строки, если никакие значения не отличаются. Если есть одно или несколько значений, которые присутствуют, но идентичны между Item и Item 2, я....
16 Ноя 2020 в 07:45
Я хочу, чтобы значения были ffill() в S0.0,S1.0,S2.0 в группе "ID" ID Close S0.0 S1.0 S2.0 0 UNITY 11.66 NaN 54 NaN 1 UNITY 11.55 56 NaN NaN 2 UNITY 11.59 NaN NaN 78 3 TRINITY 11.69 47 NaN NaN 4 TRINITY 11.37 NaN 69 ....
15 Ноя 2020 в 12:23
В моем фрейме данных B есть следующие данные: F1 F2 Count A C 5 B C 2 B U 6 C A 1 Я хочу сделать из них квадратную матрицу, чтобы результаты были такими: A B C U A 0 0 6 0 B 0 0 2 6 C 6 2 0 0 U 0 6 0 0 Первона....
13 Ноя 2020 в 09:18
Я пытаюсь предсказать доход (70000+) на основе определенных категориальных полей (пол и высший сертификат, падение, градус) на основе кода Python ниже. Я создал диапазон для среднего дохода, а затем указал конкретный диапазон дохода (70000+), который я хотел спрогнозировать, используя (Пол и высший ....
12 Ноя 2020 в 04:11
У меня довольно большой корпус (500 тыс. Новых статей) в фрейме данных в одном столбце. В начале большинства (но не всех) статей есть различный случайный отбрасываемый текст вплоть до фразы «(Рейтер) -» Я пробовал различные перестановки следующего регулярного выражения, пытаясь настроить весь столбе....
12 Ноя 2020 в 01:32
Предположим, у меня есть следующий DataFrame dict_test = {'a':[['1','2'], ['t','rba'], ['5','6','20'],['7','9'],['sar']],'b':['John','John','John','Tom','Tom']} df = pd.DataFrame(dict_test) Я искал способ изменить его так, чтобы в итоге я получил dict_test2 = {'a':[['1','2'], ['1','2','t','rba']....
11 Ноя 2020 в 20:20
У меня есть фрейм данных ниже: Col1 Col2 Col3 Col4 Col5 Col6 Col7 1 A T 1 AG NBL NH 2 A T 1 NAG BL NH 3 A M 2 NAG NBL HL 4 NS M 1 NAG BL NH 5 NS T 1 NAG NBL HL 6 A M 2 NAG NBL HL Я хочу созд....
9 Ноя 2020 в 23:04
Скажем, у меня есть фрейм данных ниже: index value 1 1 2 2 3 3 4 4 Я хочу применить функцию к каждой строке, используя предыдущие две строки, используя оператор «применить». Допустим, например, я хочу, чтобы текущая строка и предыдущие 2 строки были несколькими, если ....
9 Ноя 2020 в 02:37
Это не выглядит сложным, но пока не удалось найти решения. У меня есть df, который выглядит так: df = {'Name': ['MIR-10','MIR-10','LET-7','LET-7','LET-7','MIR-142','MIR-142','MIR-142'], 'Type':['3prime','3prime','3prime','5prime','5prime','3prime','5prime','3prime']} df = pd.DataFrame(data=df)....
8 Ноя 2020 в 21:48
Учитывая следующие данные: import pandas as pd import io df = pd.read_csv( io.StringIO( "bit,val\nbit_0,40.9\nbit_1,49.6\nbit_2,50.5\nbit_3,37.7\nbit_4,52.0\nbit_5,55.1\nbit_6,40.6\nbit_7,37.8\nbit_8,39.2\nbit_9,51.1\nbit_10,48.4\nbit_11,49.8\nbit_12,51.7\nbit_13,46.7\nbit_14,40.8\nbit_....
8 Ноя 2020 в 20:42
У меня есть фрейм данных, и я хочу создать столбец на основе условия, которое заполняет строку значением строки в другом столбце. df = pd.DataFrame({'parent':[32, 3, 88, 9, 10, 23, 99, 23], 'id':[1, 2, 3, 4, 5, 6, 7, 8], 'flag':[True,True,False,True,False,True,T....
8 Ноя 2020 в 17:31
Я пытаюсь создать фреймворк с датой, заголовком и содержанием веб-сайта. Чтобы очистить эту информацию, я делаю следующее: import requests from bs4 import BeautifulSoup import pandas as pd def main(req, num): r = req.get("http://www.lavocedellevoci.it/category/inchieste/page/{}/".format(num))....
8 Ноя 2020 в 06:25
У меня есть набор данных с многоиндексным двухмерным заголовком. Я хотел бы объединить его в одну строку заголовка, удалив имена пустых столбцов в первой строке по имени предыдущего столбца, отличного от nan в той же строке. Ниже показана структура имеющегося у меня фрейма данных. Первые две строк....
4 Ноя 2020 в 20:30
Я работаю с измененным набором данных набора данных Donors Choose. Я пытаюсь выполнить кодирование ответа для категориальных переменных. Я пытаюсь установить значение для нового столбца, используя loc. Значение устанавливается только для критериев, когда значение project_is_approved равно 1, а НЕ....
3 Ноя 2020 в 11:04