Я хочу взять файл excel, который содержит различные типы ячеек, такие как даты, валюта и т. д., и проанализировать его с помощью Python, включая типы ячеек.
Я пытался использовать Pandas
, но когда я открываю его с помощью Python, используя pd.read_excel
, все эти типы ячеек исчезают.
Например, ячейка, содержащая '50 USD'
(ячейка, содержащая тип валюты), будет отображаться как '50'
.
Есть ли в Python метод, который может читать эти ячейки с сохраненными типами ячеек?
Благодарность
1 ответ
Я думаю, вы можете путать значения ячеек и форматирование ячеек. Например, при значении 50 долларов США Excel сохраняет числовое значение, а затем применяет формат валюты для отображения. Поэтому правильно читать его в pandas как целое число, если вы хотите суммировать, усреднять или иным образом анализировать этот столбец.
Даты должны анализироваться автоматически, а если это не так, read_excel
имеет параметр parse_dates
, который позволяет вам это делать.
Теперь, в зависимости от того, как вы хотите вывести данные после того, как вы манипулировали ими в pandas, у вас может быть функция, которая выводит новый фрейм данных, который преобразует все значения в строку и применяет форматы к разным столбцам. Или, если вы работаете в блокноте, вы можете использовать API стилей pandas. Вы также можете записать файл обратно в excel с помощью pandas, а затем программно применить стили с помощью openpyxl.
Похожие вопросы
Новые вопросы
python-3.x
НЕ ИСПОЛЬЗУЙТЕ, ЕСЛИ ВАШ ВОПРОС ТОЛЬКО ДЛЯ PYTHON 3. Всегда используйте вместе со стандартным тегом [python].
dtype
для валюты? Имо нет такого типа данных. Однако вы можете анализировать даты