Я тяну мои волосы на этом. У меня есть 2 датафрейма: Df1 содержит данные об игроках с их позицией (зоной) (нападающий, полузащитник или защитник) и некоторыми их Игровая статистика. df1 = pd.DataFrame({'Zone': ['DEF', 'MID', 'FWD'], 'Tackles': [5, 10, 5], 'Goals': [0, 1, 1], 'Shots': [10, 5, 2]} , i....
10 Янв 2022 в 19:20
Я изучаю Python, возможно, на реальных сценариях, и получил задание отфильтровать названия компаний, которые содержат более трех слов. Он находится в столбце с названием «Название компании», а фрейм данных называется «данные». Мне удалось внести их в список, а в конечном итоге и в фрейм данных. О....
6 Янв 2022 в 01:47
У меня есть набор данных, который я создал путем слияния двух df вместе в столбце «NAME», и теперь у меня есть более крупный набор данных. Чтобы закончить DF, я хочу выполнить некоторую логику, чтобы очистить его. Требования: Я хочу выбрать уникальное «ИМЯ», но я хочу сопоставить имя с самой выс....
8 Дек 2021 в 03:49
Итак, я ищу эффективный способ установки значений в существующем столбце и установки значений для нового столбца на основе некоторых условий. Если у меня есть 10 условий в большом наборе данных, нужно ли мне писать 10 строк? Или можно их как-то объединить ... пока не придумал. Вы можете что-нибуд....
5 Окт 2021 в 21:38
Почему это работает? import pandas as pd numbers = {'mynumbers': [51, 52, 53, 54, 55]} df = pd.DataFrame(numbers, columns =['mynumbers']) df.loc[df['mynumbers'] <= 53, 'mynumbers'] = 'True' print (df) Выход: mynumbers 0 True 1 True 2 True 3 False 4 False Но это возвращает....
2 Окт 2021 в 13:48
У меня есть набор данных csv, который я импортировал в Jupyter и сохранил в inp0. Я пытаюсь создать ценовой сегмент для них, используя функцию .loc в ставке pandas с ошибкой ниже. Мой код: inp0.loc[inp0.price==0.00, 'Price_Bucket'] = 'Free App' inp0.loc[[inp0.price>0.00 and inp0.price<3.00],'Price_....
25 Июл 2021 в 10:32
У меня DF довольно большой. Фрагмент, подобный показанному ниже. SrNo | Merchant | Revenue | Currency 1 | UBER SR | 123 | INR 2 | UBER (SR)| 123 | INR 3 | SR UBER | 123 | INR 4 | ZOMATO SR| 123 | INR 5 | ZOMATOSR | 123 | INR 6 |12FLIPAKRT| 123 | IN....
28 Июн 2021 в 15:57
Я практиковался с пандами и столкнулся со следующей проблемой. Я тренировался с набором данных олимпийских медалей, где страны указаны в одном столбце, а медали - в последующих столбцах. В рамках проверки качества я хотел написать строку кода, которая проверяет, что сумма золотых (01!), Серебряных ....
9 Июн 2021 в 21:28
Проблема Pandas, похоже, поддерживает использование df.loc для назначения словаря записи строки, например: df = pd.DataFrame(columns = ['a','b','c']) entry = {'a':'test', 'b':1, 'c':float(2)} df.loc[0] = entry Как и ожидалось, Pandas вставляет значения словаря в соответствующие столбцы на основе кл....
20 Май 2021 в 21:26
Пытается суммировать строки для определенных столбцов в пандах. Имеют: df = name age gender sales commissions joe 25 m 100 10 jane 55 f 40 4 Хочу: df = name age gender sales commissions joe 25 m 100 10 jane 55 f 40 4 ....
2 Май 2021 в 01:25
Я пытаюсь отфильтровать свой фрейм данных по нескольким условиям, используя loc Данные поступают из файла Excel, который я импортировал в фрейм данных с помощью df = pd.read_csv () Вот пример структуры из df с использованием df.head (): df.head ( ) И мне нужно отфильтровать по следующим критериям: г....
18 Апр 2021 в 23:28
Итак, мой набор данных - это данные опроса, где каждая строка показывает вопрос и уникальный числовой ответ респондента на этот вопрос. К сожалению, для некоторых вопросов шкала была обратной (иначе 1s должно быть 4s .......
12 Фев 2021 в 02:38
Я пытаюсь найти строки, в которых надежность составляет <0,70, но результат, похоже, включает строки, в которых надежность также составляет 0,70. Что могло быть не так? Оригинальный DF: Po_id po_name продукт год показатель знаменатель скорости числитель is_reported надежность 0 1051408 Коммерчес....
4 Фев 2021 в 21:02
У меня есть timeseries df с 5-летними ценами на фондовые индексы (так что df имеет 2 столбца Date и Price. Затем у меня есть новый столбец «3M forward date», который представляет собой просто исходный столбец Date + 3 месяца. Затем я пытаюсь создать столбец «Форвардная цена 3M». Это будет соответст....
22 Янв 2021 в 15:11
У меня есть такой фрейм данных df = pd.DataFrame ({'a': [1], 'b': [1], 'c': [1], 'd': [1], 'e': [ 1]}) df Я хочу выбрать столбцы a, b, c, e с .loc! Я нахожу l = df.loc [:, 'a': 'c']. Columns.to_list () l + = ['e'] .......
30 Дек 2020 в 18:09
Я ищу итеративный способ создания подмножества моего фрейма данных pandas на основе даты и продукта. Я хотел бы сохранить первую строку для каждого продукта в течение двухнедельного окна. Итак, для df A: .......
16 Дек 2020 в 00:05
Я хочу извлечь столбцы из фрейма данных, используя другой фрейм данных. Я не хочу жестко закодировать заголовки столбцов в коде, поскольку данные поступают из CSV, а столбцы могут быть добавлены с другими заголовками. Пробовал с .loc и используя итерации, но ничего не работает. Это то, что у меня....
9 Дек 2020 в 07:57
Я пытаюсь добавить два фрейма данных, используя concat с axis = 0, поэтому столбцы остаются такими же, но индекс увеличивается. Один из фреймов данных содержит определенные столбцы с порядковым номером (начиная с единицы вверх, но не обязательно последовательно, например, 1,2,3,4,5 и т. Д.) import ....
26 Ноя 2020 в 13:21
Сейчас я чувствую себя действительно глупо, это должно быть легко. У меня здесь хорошая помощь как сделать -keep-the-index-of-my-pandas-dataframe-after-normalazation-json Мне нужно получить минимальное / максимальное значение в столбце «цена» только тогда, когда значение в столбце «тип» - покупка /....
17 Ноя 2020 в 19:43
Здесь я пытаюсь получить среднее значение строк с 0 по 8 и столбцов с «15.09.2020» по «18.09.2020» из фрейма данных df, используя .loc [] в пандах. [Это фрейм данных df с 8 строками и 9 столбцами] [1] [1]: https://i.stack.imgur.com/QgjBp.png Пробовали использовать следующий длинный синтаксис: отли....
21 Сен 2020 в 07:18
Например: УКАЗАТЕЛЬ ФРУКТОВ 0: "банан" 1: «яблоко» 2: «пончик» 3: «пицца» 4: «лапша» 5: «мороженое» 6: «грейпфрут» Обычно, чтобы отбросить строки 2–5 включительно, я использую drop. (Df.index [[2,3,4,5]]) Однако для проекта, над которым я работаю, dataframe намного больше, и мне пришлось бы переч....
10 Июл 2020 в 05:07