Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

У меня есть этот фреймворк date,AA 1980-01-01, 77.7 1980-01-02, 86 1980-01-03, 92.3 1980-01-04, 96.4 1980-01-05, 85.7 1980-01-06, 75.7 1980-01-07, 86.8 1980-01-08, 93.2 1985-08-13, 224.6 1985-08-14, 213.9 1985-08-15, 205.7 1985-08-16, 207.3 1985-08-17, 202.1 Я хотел бы вычислить максимум для каждог....
24 Ноя 2021 в 18:35
У меня есть этот набор данных для анализа настроений, загружая данные с помощью этого кода: url = 'https://raw.githubusercontent.com/jdvelasq/datalabs/master/datasets/amazon_cells_labelled.tsv' df = pd.read_csv(url, sep='\t', names=["Sentence", "Feeling"]) Проблема в том, что DataFrame получает стр....
24 Ноя 2021 в 18:17
Я хочу объединить 2 кадра данных по вертикали, но получаю эту ошибку: Переиндексирование допустимо только для объектов индекса с уникальным значением Как я могу это исправить? Df1 TimeStamp Input X Y Time Distance Speed Pressure Tilt_X Tilt_X 16 79769.0 touch 8898 8438 Na....
24 Ноя 2021 в 18:17
Я использую pd.get_dummies в этом примере фрейма данных ниже - и он работает правильно, но я хочу посмотреть, есть ли у кого-нибудь представление о том, как изменить результаты. Я опишу ниже: Оригинальный DF ID type AA23 A AB24 B DJ44 B KD33 C KD33 A BK89 B BL9....
24 Ноя 2021 в 18:11
Я создаю фрейм данных для документа, созданного из текста с помощью spacy, как показано ниже: test='We walked the walk and still walk it today. Walking brings us great joy.' tokens=[] lemma=[] pos=[] df=pd.DataFrame() doc=nlp(test) for t in doc: tokens.append(t.text) lemma.append(t.lemma_)....
24 Ноя 2021 в 17:52
Если у меня есть этот фрейм данных: # data data = [['london_1', 10,'london'], ['london_2', 15,'london'], ['london_3', 14,'london'],['london',49,'']] # Create the pandas DataFrame df = pd.DataFrame(data, columns = ['station', 'info','parent_station']) Так: station info parent_station 0 lond....
24 Ноя 2021 в 17:18
У меня есть 50 списков в файле py, и мне интересно, есть ли способ импортировать и превратить некоторые из них в словарь, то есть взять только 48 списков в словарь. Я могу добавлять их один за другим через dict(zip()), но это означает, что мне нужно предоставить длинный список имен списков и самих ....
24 Ноя 2021 в 17:13
У меня есть два фрейма данных, большой (df1) и меньший (df2). У обоих одинаковые столбцы и индексы. df1 = pd.read_csv(milkProdFile, delimiter=';', dtype=str, names=cols).set_index(["ANIM", "NULACT"], drop=False) df2 = pd.read_csv(correctionFile, delimiter=';', dtype=str, names=cols).set_index(["ANI....
24 Ноя 2021 в 16:42
Я следую ответу на этот вопрос < / а> У меня есть df вот так: score_1 score_2 1.11 NaN 2.22 3.33 NaN 3.33 NaN NaN ........ Правило для вычисления final_score состоит в том, что мы требуем, чтобы хотя бы одна из оценок была non-null, если ....
24 Ноя 2021 в 16:39
Я имею дело с тысячами файлов csv GPS, которые я хочу построить в программе ГИС. Для этого мне нужны десятичные градусы, но данные были собраны в десятичных градусах минут. У меня есть функция, которая преобразует десятичные градусы минут в желаемый формат, однако расположение данных в каждом файл....
24 Ноя 2021 в 15:49
Как мне округлить ниже: Time 0 2021-11-23 08:07:35 1 2021-11-09 23:12:13 До ближайшей мин: Time 0 2021-11-23 08:08:00 1 2021-11-09 23:12:00 ....
24 Ноя 2021 в 15:49
Я пытаюсь заменить значения NaN в столбце pandas df ниже двумя отдельными значениями, то есть 8 и 12. | ColumnD | +------------+ | 6 | | NaN | | 10 | | NaN | | 14 | В настоящее время я могу добиться этого вручную, используя iloc фрейма данны....
24 Ноя 2021 в 15:43
Я пытаюсь очистить исторические данные о биткойнах с coinmarketcap.com, чтобы получить близкие, объем, дату, максимальные и минимальные значения с начала года до 30 сентября 2021 года. После нескольких часов просмотра потоков и видео, я Я новичок в парсинге с помощью Python, я не знаю, в чем моя ош....
24 Ноя 2021 в 15:12
Опция по умолчанию для степеней свободы ddof в np.std - ddof=0. При использовании np.std в pd.DataFrame.transform это поведение меняется: import numpy as np import pandas as pd df = pd.DataFrame({"col1": [1, 2, 3, 4, 5, 9], "group": ["a", "a", "a", "b", "b", "b"]}) std = df.group....
24 Ноя 2021 в 14:56
У меня есть столбец фрейма данных pandas, как показано ниже: | ColumnA | +-------------+ | ABCD(!) | | <DEFG>(23) | | (MNPQ. ) | | 32.JHGF | | "QWERT" | Цель состоит в том, чтобы удалить специальные символы и произвести вывод, как показано ниже: | ColumnA | ....
24 Ноя 2021 в 14:48
У меня есть лист Excel с 14 столбцами. Первые два столбца содержат имена людей и их адреса, а остальные двенадцать столбцов содержат слово «одобрено» или «не одобрено». Я знаю функцию СЧЁТЕСЛИ в Excel. Есть ли способ подсчитать, сколько «одобренных» у Python? Это мой код для чтения моего фрейма ....
24 Ноя 2021 в 13:44
Так выглядят мои данные. Я пробовал все, от превращения в список, затем в фреймворк, но без толку. ["[[{'uuid': '3cb5da6c-6db2-4893-9ebb-39443a7c83be', 'answers': 'Vibinators', 'votes': '74'}, {'uuid': '564b3357-df5f-4543-bd07-fa0c3c9401de', 'answers': 'I AM’s', 'votes': '139'}]]"] ....
24 Ноя 2021 в 13:37
Я использую pandas DF для обработки большого количества данных (500+ столбцов, 30 000+ строк) из моделирования в нашей лаборатории. Данные читаются из внешнего файла и имеют небольшие значения в следующем формате: 0.12750246E-61 0.12850512E-26 0.36285493E-05 0.2555013....
24 Ноя 2021 в 13:16
У меня есть таймсерии панд auctions вроде этого: problemStart 2018-12-19 13:00:00 1 2018-12-19 14:00:00 0 2018-12-19 15:00:00 0 2018-12-19 16:00:00 0 2018-12-19 17:00:00 0 ... ... 2021-10-29 12:00:00 0 2021-10-29 13:00:00....
24 Ноя 2021 в 13:14
У меня есть код, который принимает строку ДНК, в которой найдено только 4 символа: A, C, T и G, например «ATACAAG», и для каждого символа, если он находит 3 других возможных символа. Код включает цикл для строки и другой цикл для списка возможных символов. Проблема в том, что строки очень длинные:....
24 Ноя 2021 в 12:14
Фрейм данных ввода A B n1 "joe,jack" n2 "kelly,john" n3 "adam,sam" n1 "jack,frank" n3 "rita" n4 "steve, buck" n2 "john, kelly, peter" На основе индекса column A я хочу объединить текст, разделенный comma (,). Таким образом, ожидаемый результат будет выглядеть так (....
24 Ноя 2021 в 12:06
В Python я пытаюсь удалить строки фрейма данных, если даты ниже дат другого фрейма данных. Но сравнение не работает. Вот два моих фрейма данных и результаты, которые я пытаюсь сравнить. print(MeteoCH.head()) приведет к: TempAvg TempMin TempMax Date ....
24 Ноя 2021 в 12:01
Как выбрать столбец в файле Excel и отобразить его только пандами, которые я пробовал: videos = df.loc[:, df.columns == 'videos'] videosvar = (videos.loc[num].values) print(videosvar) ....
24 Ноя 2021 в 11:52
Мне нужно отредактировать приведенный ниже сценарий, чтобы выполнить действие, но, поскольку я новичок в Python, я борюсь. Приведенный ниже сценарий классифицирует слова в наборе данных: import pandas as pd d = {'men': ['men', 'boy'], 'women': ['women', 'girl', 'lady']} def classify(text): gen....
24 Ноя 2021 в 11:39
В настоящее время я работаю над фреймворком pandas и пытаюсь извлечь значение из столбца, который состоит из строки в списке, но я как бы застрял в том, как сохранить только тот текст, который мне нужен. Вот так выглядит один из списков: ["{'BusinessAcceptsCreditCards': 'True'", "'RestaurantsPriceR....
24 Ноя 2021 в 11:35