Ищете недостающие значения?
columns = ['median', 'p25th', 'p75th']
# Look at the dtypes of the columns
print(____)
# Find how missing values are represented (Search for missing values in the median, p25th, and p75th columns.)
print(recent_grads["median"].____)
# Replace missing values with NaN,using numpy's np.nan.
for column in ___:
recent_grads.loc[____ == '____', column] = ____?
0
Saumya T
15 Июн 2018 в 15:56
Для подсказки мы можем использовать Попробуйте выбрать три столбца в столбцах, а затем посмотреть на атрибут .dtypes полученного DataFrame. Вызовите метод .unique () для медианного столбца. Используйте логическое выражение для фильтрации столбцов, чтобы у вас были только строки со значением UN. numpy имеет объект np.nan, который можно использовать для замены значений.
– Saumya T
15 Июн 2018 в 16:02
Для получения дополнительных инструкций вы можете использовать: Посмотрите на типы столбцов в столбцах, чтобы убедиться, что данные являются числовыми. Похоже, что строка используется для кодирования отсутствующих значений. Используйте метод .unique (), чтобы выяснить, что это за строка. Найдите недостающие значения в столбцах медианы, p25 и p75. Замените найденные пропущенные значения значением NaN, используя np.nan numpy.
– Saumya T
15 Июн 2018 в 16:47
Для столбца в столбцах: Recent_grads.loc [column == 'UN', column] = np.nan # ошибка получения не может использовать одно логическое значение для индексации в заданный элемент
– Saumya T
15 Июн 2018 в 16:54
# для столбца в столбцах: latest_grads.loc [column == 'UN', column] = np.nan (Получение ошибки) #recent_grads [columns] = latest_grads [columns] .replace ({'UN': np.nan}) (этот код работает нормально)
– Saumya T
15 Июн 2018 в 17:12
3 ответа
Имена столбцов, в которых мы ищем пропущенные значения
columns = ['median', 'p25th', 'p75th']
Взгляните на типы
print(recent_grads[columns].dtypes)
Узнайте, как представлены отсутствующие значения
print(recent_grads["median"].unique())
Замените отсутствующие значения на NaN
for column in columns:
recent_grads.loc[recent_grads[column] == 'UN', column] = np.nan
2
toti08
17 Окт 2018 в 17:46
Правильный ответ-
for column in columns:
recent_grads.loc[recent_grads[column] == 'UN', column] = np.nan
1
Mohammad Kanan
28 Июн 2018 в 17:41
# Print .dtypes
print(recent_grads.dtypes)
# Output summary statistics
print(recent_grads.describe())
# Exclude data of type object
print(recent_grads.describe(exclude=["object"]))
0
Karolis Koncevičius
30 Сен 2018 в 15:25
Похожие вопросы
Новые вопросы
median
Медиана - это «среднее» значение из набора значений. Если число значений является четным числом, медиана является средним значением «средних» значений.