Я пытался распечатать фрейм данных Pandas в html и выделить отдельные целые строки, если значение одного конкретного столбца для этой строки превышает пороговое значение. Я просмотрел Pandas Styler Slicing и попытался изменить функцию highlight_max для такого использования, но, похоже, с треском провалился; если я попытаюсь, скажем, заменить is_max проверкой, находится ли значение данной строки выше указанного порога (например, что-то вроде

is_x = df['column_name'] >= threshold

), не ясно, как правильно передать такую вещь или что вернуть.

Я также попытался просто определить его в другом месте, используя df.loc, но это тоже не сработало.

Также возникла другая проблема: если я опущу этот столбец (в настоящее время критерий) после этого, будет ли стиль сохраняться? Мне интересно, если бы df.loc предотвратил бы такую проблему.

11
Dread Pirate Roberts 24 Апр 2017 в 22:50

2 ответа

Лучший ответ

Это решение позволяет вам передать метку столбца или список меток столбца, чтобы выделить всю строку, если это значение в столбце (столбцах) превышает пороговое значение.

import pandas as pd
import numpy as np

np.random.seed(24)
df = pd.DataFrame({'A': np.linspace(1, 10, 10)})

df = pd.concat([df, pd.DataFrame(np.random.randn(10, 4), columns=list('BCDE'))],
               axis=1)
df.iloc[0, 2] = np.nan

def highlight_greaterthan(s, threshold, column):
    is_max = pd.Series(data=False, index=s.index)
    is_max[column] = s.loc[column] >= threshold
    return ['background-color: yellow' if is_max.any() else '' for v in is_max]


df.style.apply(highlight_greaterthan, threshold=1.0, column=['C', 'B'], axis=1)

Выход:

enter image description here

Или для одного столбца

df.style.apply(highlight_greaterthan, threshold=1.0, column='E', axis=1)

enter image description here

18
Scott Boston 15 Май 2019 в 12:56

Вот более простой подход:

  1. Предположим, у вас есть кадр данных 100 x 10, df. Также предположим, что вы хотите выделить все строки, соответствующие столбцу, например, «длительность», больше 5.

  2. Сначала вам нужно определить функцию, которая выделяет ячейки. Настоящий трюк в том, что вам нужно вернуть строку, а не одну ячейку. Например,

    def highlight(s):
        if s.duration > 5:
            return ['background-color: yellow']*10
        else:
            return ['background-color: white']*10
    

** Обратите внимание, что возвращаемой частью должен быть список из 10 (соответствующий количеству столбцов). Это ключевая часть.

  1. Теперь вы можете применить это к стилю данных как:

    df.style.apply(highlight, axis=1)
    
1
Steven 17 Янв 2018 в 20:07
43596579