Pandas - это библиотека Python для обработки и анализа данных, например, кадры данных, многомерные временные ряды и наборы данных поперечного сечения, обычно встречающиеся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

Подробнее про pandas...

У меня такой df: CODE STATION PLACE SECTOR ALTITUDE MONTH YEARS_OF_STATION 0 103036 NaN TUMBES COSTA NORTE 70 ENE 27 1 103036 NaN TUMBES COSTA NORTE 70 ENE 27 2 103036 ....
22 Сен 2021 в 04:16
У меня есть две панды DataFrames, где первый DataFrame имеет два столбца: «a» и «id», а второй DataFrame имеет два столбца: «id» и «color_value». Я хотел бы сравнить идентификаторы между двумя DataFrames, и если есть совпадение, добавьте столбец в первый DataFrame с правильным color_value. По сути....
21 Сен 2021 в 23:18
У меня есть фрейм данных pandas со столбцом типа объекта, который имеет значения профилирования для каждого пользователя следующим образом: print(df[profile_values]) 1 [\n "ab",\n "abc",\n "abcd"\n] 1 NaN 3 [\n "ab",\n "abcd"\n] 4 NaN 5 [\n "ab"\n] ... Необходимо обрезать значен....
21 Сен 2021 в 21:24
Как я могу подсчитать, сколько раз массив присутствует в большем массиве? a = np.array([1, 0, 0, 1, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1]) b = np.array([1, 1, 1]) Количество раз, когда b присутствует в a, должно быть 3 . b может быть любой комбинацией единиц и нулей. Я работаю с огромными массивами, поэ....
21 Сен 2021 в 21:21
Предположим, у меня есть ежедневные данные с 2010 по 2020 год: Ex: Date col1 2010-01-01 False 2010-01-02 False ... 2020-12-31 False Я хочу установить col1 = True для всех строк, где (месяц равен 4, а день больше 25), а месяц равен 5, а день меньше 5. Таким образом, в ос....
21 Сен 2021 в 21:13
Я зашел в тупик, пытаясь сгруппировать записи в моем df и складывать значения из одного из столбцов. У меня есть запись df ~ 390k такой формы: df = pd.DataFrame({ 'Województwo': {14: 'ŁÓDZKIE', 15: 'ŁÓDZKIE'}, 'Powiat': {14: 'bełchatowski', 15: 'bełchatowski'}, 'Gmina': {14: 'Bełchatów'....
21 Сен 2021 в 20:45
Итак, в основном у меня есть DataFrame, который выглядит так: И задача состоит в том, чтобы увеличить глубину с шагом 0,1 (добавить новые строки), а также соответственно интерполировать значения. Должно получиться так: (нижняя часть обрезана из-за размера) Вот черновик кода, который я написал: imp....
21 Сен 2021 в 19:02
У меня есть df с именем df_out с такими именами столбцов, как это в следующей вставке, но я по какой-то причине не могу использовать функцию groupby с заголовками столбцов, поскольку она продолжает давать мне KeyError: 'year'. Я исследовал и попытался удалить пробелы, сбросить индекс, разрешить про....
21 Сен 2021 в 18:21
df.head(3) Out[20]: First_date Second_date 0 2021-09-18 2021-09-17 1 2021-09-22 2021-09-17 2 2021-09-27 2021-09-17 Я вычислил разницу между двумя date_columns, но я хочу исключить из дат только воскресенья, прямо сейчас то, что я рассчитал для него за целую неделю. df["First_date"] = df['Firs....
21 Сен 2021 в 18:19
Какие-нибудь советы о том, как узнать, находится ли определенное слово внутри столбца панд? # initialise data of lists. data = {'Colour':['Blue andtext', 'Greys', 'Potato', 'Yellow','Tree'], 'Values':[20, 21, 19, 18,44]} df2 = pd.DataFrame(data) Скажем: colours = ['Blue','Grey','Yellow'] ....
21 Сен 2021 в 17:57
У меня есть файл Excel, который я использую в качестве файла параметров, и я получаю данные в DataFrame. Я перебираю файл параметров (и сохраняю параметры в списке кортежей) и фрейм данных, чтобы применить функцию, когда это необходимо, но поскольку функция хранится в файлах параметров по ее имени, ....
21 Сен 2021 в 13:42
Доброго времени суток. У меня есть таблица с данными, которую вы можете скачать по этой ссылке: https://docs.google.com/spreadsheets/d/1EOEuBRYEpDNz5p1m-VD5fkJS7-DmmMlwIgmibrYRWZM/edit?usp=sharing Я должен вычислить «значения» столбца, определив значение для начинающих (в таблице значение для начин....
21 Сен 2021 в 13:37
У меня есть 2 фрейма данных: df1 = pd.DataFrame.from_dict({('category', ''): {0: 'A', 1: 'B', 2: 'C', 3: 'D', 4: 'E', 5: 'F', 6: 'G'}, (pd.Timestamp('2021-06-28 00:00:00'), 'metric_1'): {0: 4120.549999999999, 1: 11226.016666666665, 2: 25049.443333333333, 3: 18261.083333333332, 4: 2553....
21 Сен 2021 в 13:14
Я пробовал несколько способов. У меня есть кадр данных ниже, и у меня есть идентификатор EMP из другого процесса. Я хочу найти имя EMP на основе идентификатора EMP. EMP ID Name EMP Location 1 John A New York 2 Paul London 3 Adam K London 4 Lawrence L L....
21 Сен 2021 в 12:31
У меня есть два dataframe, как показано ниже: Background Skin Body Face Head value Beige Light Gray TribalNecklace Beard Bowl Cut value Blue Normal BowTie Pink Blushing Durag Red. А также Link....
21 Сен 2021 в 11:21
У меня есть фреймворк pandas, и я хочу удалить все строки с датой начала меньше 2019 и больше 2020. Конечно, я могу просто перебрать его, выполнить условие и отбросить его по индексу, если оно ложно. Например, как следующее: for index, row in df.iterrows(): # extract year from date format YYYY-....
21 Сен 2021 в 10:40
def compute(tick): df = pd.read_csv(f'{tick}.csv') a = df.loc['a'].sum() b = df.loc['b'].sum() c = df.loc['c'].sum() d = (a + b) / c return d В некоторых фреймах данных нет строки 'b', поэтому она возвращает KeyError. Затем я попробовал следующий код, но он не работает. Кто....
21 Сен 2021 в 08:48
Я пытаюсь заполнить пустые ячейки из одного столбца (а затем из нескольких столбцов), используя стандартное отклонение. Я видел несколько объяснений, но пока не видел ни одного прямого и относящегося к этому вопросу. Заранее благодарим за уделенное время! Вот что у меня есть на данный момент: Чтоб....
21 Сен 2021 в 08:02
У меня есть два фрейма данных (меню и заказы), и я хотел бы пометить элементы в фрейме данных меню в зависимости от того, насколько он популярен (сколько раз он появляется во фрейме данных «заказы»). import pandas as pd menu = pd.DataFrame( {'Item_Name':['Chicken Pizza','Mushroom Soup','Tiramis....
21 Сен 2021 в 07:12
Я слежу за этим учебник о том, как найти ближайших соседей точки с помощью scikit. Однако, когда дело доходит до отображения данных, в руководстве просто упоминается, что «индексы могут быть сопоставлены с полезными значениями, а два массива объединены с остальными данными». Но фактического объяснен....
21 Сен 2021 в 04:32
У меня есть df1, который выглядит так: year site 1 2 3 year site 1 2 3 year site 1 2 3 year site 1 2 3 1991 A 4.1 5.9 4.1 1991 B 3.3 4.1 4.1 1991 C 4.1 0.6 4.1 1991 D 4.1 4.1 4.1 1992 A 6.2 5.7 6.2 1992 B 6.2 7.1 6.2 1992 ....
21 Сен 2021 в 04:21
Скажем, у меня есть список: mylist = ['a','b','c'] И фрейм данных Pandas (df), в котором есть столбец с именем «рейтинг». Как я могу подсчитать количество появлений рейтинга при повторении моего списка? Например, вот что мне нужно: for item in myList # Do a bunch of stuff in here that takes a....
21 Сен 2021 в 02:25
Мне нужны результаты только тогда, когда день равен четвергу. Я могу фильтровать открытые сайты и ff, который сначала приходит первым, но не знаю, как фильтровать по определенному дню из моей даты форматирования. Спасибо def main(): result = [] print('Checking for available campsites....'....
21 Сен 2021 в 02:23
Мне нужно извлечь числовые значения из строки внутри DataFrame pandas. Скажем, ячейка DataFrame выглядит следующим образом (хранится в виде строки): [1.234,2.345] Я могу получить первое значение следующим образом: print(df['column_name'].str.extract('(\d+.\d+)',).astype('float')) Выход: 1.234 Теп....
21 Сен 2021 в 02:06
Итак, мой вопрос похож на этот один. Мой другой, потому что у меня списки разной длины в одной строке и столбцах. Многие из опробованных мной решений создают очень длинный фрейм данных с множеством повторов. Мои требования являются строковыми, что означает, что если в строке есть список, он разбив....
21 Сен 2021 в 01:33