У меня есть столбец фрейма данных («альбомы»), где большинство значений закодировано в виде обычного текста (например, «Альбом», «Альбом 2» и т. Д.), Но некоторые значения имеют utf-8 или другие значения в сочетании с ...

1
cdc18 24 Дек 2020 в 07:59

1 ответ

Лучший ответ

Для \xc3\xa9 вам нужна комбинация encode() и decode() с raw_unicode_escape

print( "Pr\xc3\xa9cis.".encode('raw_unicode_escape').decode() )

Документ: кодеки специфичные для Python кодировки


А для ' вам понадобится html.unescape

import html

print(html.unescape("'"))

Документ: html.

0
furas 24 Дек 2020 в 06:59