Фрейм данных представляет собой табличную структуру данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.
У меня есть фрейм данных, как показано ниже
td = {966: [('Feat1', -0.04),
('Feat2=True ', -0.02),
('Feat3 <= 20000.00', 0.01),
('Feat4=Power Supply', -0.01),
('Feat5=dada', -0.0)],
879: [('Feat8=Rare', 0.02),
('Feat11=HV', -0.01),
('Feat21=Power Supply', -0.01),
('20000.00 < Feat3 <= ....
4 Фев 2022 в 13:06
У меня есть образец данных df.
Я хотел бы знать, есть ли способ вернуть все значения, начинающиеся со специального символа.
В настоящее время у меня есть только возвращаемые значения со знаком «@», но мне нужны все специальные символы. Или, по крайней мере, как перечислить несколько вариантов с пом....
У меня есть следующий фрейм данных:
df=
product_name 0 1 2
0 laptop 1200 1000 100
1 printer 150 10 100
2 tablet 300 30 560
3 desk 450 40 640
4 chair 200 20 207
Я хочу добавить сумму столбцов 1 и 2, но с у....
У меня есть Dataframe выглядит следующим образом.
import pandas as pd
import numpy as np
# Create data set.
present = 12
died = 20
dataSet = {'id': ['A', 'A', 'A','A','B','B','B','C'],
'id_2': [1, 2, 3, 1, 1,2,3,1],
'start' : [9,13,12,11,9,20,22,13],
'end' : [14,22,....
У меня есть кадр данных df со следующими данными:
df <- structure(list(group = c("cluster2", "cluster2",
"cluster1", "cluster2", "cluster2", "cluster2",
"cluster2", "cluster1", "cluster1", "cluster2"
), One = c(-0.614639315096381, 0.88834977627436,
0.0832368160901144, 0.00321829065579383, -1.0418....
3 Фев 2022 в 23:35
У меня есть кадр данных, который содержит такие столбцы - ['labels', 'labels.1', 'labels.2'] это продолжается до некоторого числа labels.n
Один из этих столбцов содержит нужное мне значение. Я хочу получить это значение и добавить его в df['final_label']. Если значение отсутствует в столбцах меток....
3 Фев 2022 в 22:53
Я изо всех сил пытаюсь найти правильный способ достижения относительной доходности в течение месяца, используя последнее наблюдение в предыдущем месяце. Данные для справки:
set.seed(123)
Date = seq(as.Date("2021/12/31"), by = "day", length.out = 90)
Returns = runif(90, min=-0.02, max = 0.02)
mData ....
В приведенном ниже df мне нужно заменить COST A и COST B для E на 0 и заменить комментарий на Un reported cost, когда выполняются следующие условия:
E и F имеют одинаковую стоимость для «СТОИМОСТИ A». E и F имеют одинаковую стоимость для «СТОИМОСТИ B».
Как вы можете видеть, 20 и 0,5 для E заменяются....
Учитывая этот словарь dataframe и word_index:
import pandas as pd
df = pd.DataFrame(data={'text_ids': [
[1, 2, 3, 2, 7, 2, 8, 2, 0],
[1, 2, 4, 2, 7, 2, 8, 2, 0],
[1, 2, 5, 2, 6, 2, 8, 2, 0....
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.choice([np.nan,1], p=(0.8,0.2),size=(10,10)))
print (df)
0 1 2 3 4 5 6 7 8 9
0 NaN NaN 1.0 NaN NaN NaN NaN NaN NaN NaN
1 NaN NaN NaN NaN NaN NaN NaN NaN 1.0 NaN
2 NaN NaN NaN NaN NaN N....
Я уже задавал аналогичный вопрос, но понял, что недостаточно конкретен. В настоящее время я анализирую данные, извлеченные из твиттера, в R. Твиты написаны разными пользователями в разные периоды времени (сбор данных в течение одного года для каждого пользователя). Я хочу отображать данные с помощ....
Я хочу взглянуть на распределение данных. Проблема в том, что я хочу сделать цикл, который отображает каждый столбец данных отдельно. При таком подходе гистограмма каждого столбца строится в одной графической области.
for x in df.columns.to_list():
df[x].hist(bins=120)
Как разделить эти гистог....
Я хочу вернуть веса в гистограмму, но с именами, появляющимися только один раз.
df = pd.DataFrame({'Name': ['Bob', 'Simon', 'Bill', 'Mary', 'Mary', 'Bob'],
'Weight': [70, 72, 71, 67, 67, 70]})
Этот:
Bob 70
Simon 72
Bill 71
Mary 67
....
У меня есть следующие два кадра данных df1 и df2
final raw st
abc 12 10
abc 17 15
abc 14 17
А также
final raw
abc 12
abc 14
Мой ожидаемый результат
final raw st
abc 17 15
Я хотел бы удалить строки на основе общего значения столбца. Моя попытка: ....
У меня есть
A <- rep(list(data.frame(a=c(1,2,3,2,1,4),b=c(7,3,1,2,2,1),c=c(2,3,7,2,2,8))),10)
B <- c(2,1,3,2,5,5)
И я хотел бы поместить B в качестве столбца каждого data.frame в списке A
Что-то типа
[[1]]
a b c d
1 1 7 2 2
2 2 3 3 1
3 3 1 7 3
4 2 2 2 2
5 1 2 2 5
6 4 1 8 5
[[2]]
a b c d
1 1 7 ....
3 Фев 2022 в 15:19
В сегодняшнем году, если разница в году соответствующего столбца составляет 5 или более, он предназначен для вывода 1, но выходит значение NaN.
import pandas as pd
from datetime import datetime
today = datetime.today()
def time(x):
if today.year - x.year > 5:
x = 1
return x
else:
x....
У меня есть следующий кадр данных df = pd.DataFrame({'id': ['b', 'b', 'b', 'b', 'a', 'a'], 'y': [1,2,3,4,1,2], 'v': [10, 8, 12, 18, -5, 10]})
Я определил две пользовательские функции, скажем, func1 и func2 с df в качестве входных данных. Обе функции возвращают фрейм данных с двумя столбцами x1 и x2....
У меня есть панды DataFrame, как это:
data = {'ID_1':['A', 'A','A', 'B', 'B', 'B'],
'ID_2':[1, 2, 2, 1, 1, 2],
'DATE':['2021-11-21', '2021-12-19', '2021-09-05', '2021-11-07', '2021-12-05','2021-12-26'],
'VALUE': [0.5, 0.5, 0.5, 0.6, 0.6, 0.6]}
df = pd.DataFrame(data)
И я х....
3 Фев 2022 в 12:20
У меня есть список mylist, в котором его элементы должны быть извлечены из разных файлов, и он доступен в формате ниже.
mylist = [[{'id':2,'name':"Ted"},{'id':7,'name':"Jack"}],
[{'id':13,'name':"Jim"},{'id':19,'name':"Tom"}],
[{'id':73,'name':"Sid"},{'id':89,'name':"Harry"}]]
К....
В настоящее время у меня есть следующая проблема, когда я хочу удалить строки в кадре данных pandas до того, как будет выполнено условие. Я хотел бы удалить каждую строку до того, как будет выполнено условие 10 или более в столбце «Число», в зависимости от столбца «Имя». Предположим, что кадр данн....
3 Фев 2022 в 10:39
У меня есть столбец текстов из столбца под названием «внутренние заметки» из CRM, и я пытаюсь использовать pandas для извлечения дат в новый столбец в виде массива. Все загружено, я хотел бы привести несколько примеров кодирования, которые я пробовал, но все, что я пробовал, далеко не так.
Вот неск....
3 Фев 2022 в 10:27
Я использую блокнот Jupyter и получаю данные с помощью API.
У меня есть список имен.
names = ['a','b','c','d']
for name in names:
df=library.function(name)
print(df)
Затем я получаю несколько словарей.
{'name':'a', 'level':2, 'quality': 12}
{'name':'b', 'level':3, 'quality': 14}
{'name':'c'....
3 Фев 2022 в 10:15
Я хочу объединить столбцы на основе одинаковых идентификаторов и убедиться, что строки объединены в одну строку (для каждого идентификатора). Может ли кто-нибудь помочь мне объединить столбцы для дубликатов и не дубликатов?
Данный:
ID Name Degree AM_Class PM_Class Online_Clas....
3 Фев 2022 в 09:43
Предположим, у нас есть этот фрейм данных:
> data
ID Period_1 Values
1 1 2020-03 -5
2 1 2020-04 25
3 2 2020-01 35
4 2 2020-02 45
5 2 2020-03 55
6 2 2020-04 87
7 3 2020-02 10
8 3 2020-03 20
9 3 2020-04 30
data <-
data.frame(
ID = c(1,1,2....
3 Фев 2022 в 08:35
Я создаю шаблон для обработки опросов SurveyMonkey в готовом формате Tableau. Я разбиваю опросы на типы вопросов. Я хочу максимально автоматизировать сценарий, поэтому я пытаюсь использовать цикл for для каждого типа вопроса.
Для наших целей давайте остановимся на вопросе о типе рейтинга.
Скажем, ....