Ищете недостающие значения?

columns = ['median', 'p25th', 'p75th']

# Look at the dtypes of the columns
print(____)

# Find how missing values are represented (Search for missing values in the median, p25th, and p75th columns.)
print(recent_grads["median"].____)

# Replace missing values with NaN,using numpy's np.nan.
for column in ___:
    recent_grads.loc[____ == '____', column] = ____?
0
Saumya T 15 Июн 2018 в 15:56
Для подсказки мы можем использовать Попробуйте выбрать три столбца в столбцах, а затем посмотреть на атрибут .dtypes полученного DataFrame. Вызовите метод .unique () для медианного столбца. Используйте логическое выражение для фильтрации столбцов, чтобы у вас были только строки со значением UN. numpy имеет объект np.nan, который можно использовать для замены значений.
 – 
Saumya T
15 Июн 2018 в 16:02
Для получения дополнительных инструкций вы можете использовать: Посмотрите на типы столбцов в столбцах, чтобы убедиться, что данные являются числовыми. Похоже, что строка используется для кодирования отсутствующих значений. Используйте метод .unique (), чтобы выяснить, что это за строка. Найдите недостающие значения в столбцах медианы, p25 и p75. Замените найденные пропущенные значения значением NaN, используя np.nan numpy.
 – 
Saumya T
15 Июн 2018 в 16:47
Для столбца в столбцах: Recent_grads.loc [column == 'UN', column] = np.nan # ошибка получения не может использовать одно логическое значение для индексации в заданный элемент
 – 
Saumya T
15 Июн 2018 в 16:54
# для столбца в столбцах: latest_grads.loc [column == 'UN', column] = np.nan (Получение ошибки) #recent_grads [columns] = latest_grads [columns] .replace ({'UN': np.nan}) (этот код работает нормально)
 – 
Saumya T
15 Июн 2018 в 17:12

3 ответа

Имена столбцов, в которых мы ищем пропущенные значения

columns = ['median', 'p25th', 'p75th']

Взгляните на типы

print(recent_grads[columns].dtypes)

Узнайте, как представлены отсутствующие значения

print(recent_grads["median"].unique())

Замените отсутствующие значения на NaN

for column in columns:
    recent_grads.loc[recent_grads[column] == 'UN', column] = np.nan
2
toti08 17 Окт 2018 в 17:46

Правильный ответ-

for column in columns:
  recent_grads.loc[recent_grads[column] == 'UN', column] = np.nan
1
Mohammad Kanan 28 Июн 2018 в 17:41
# Print .dtypes
print(recent_grads.dtypes)

# Output summary statistics
print(recent_grads.describe())

# Exclude data of type object
print(recent_grads.describe(exclude=["object"]))
0
Karolis Koncevičius 30 Сен 2018 в 15:25