Я попытался поместить некоторые базовые операции предварительной обработки в pandas dataframe в отдельный класс:

import pandas as pd
import numpy as np
from numba import jit

class MyClass:
    def _init_(self):
        pass

    @jit

    def preprocess_dataframe(self, path):
        self.df = pd.read_csv(path, index_col=False, delimiter=' ' , names=['Time', 'Downloads', 'ServerID', 'Server', 'Date'], usecols=['Time', 'Downloads', 'Server', 'Date'])

        print(self.df.head(5))
        self.df['Date'] = self.df['Date'].astype(str)
        self.df['Timestamp'] = pd.to_datetime(self.df['Time'] +' '+ self.df['Date'], format='%H:%M:%S %Y%m%d')
        self.df[['Server_alone', 'Instance']] = self.df['Server'].str.split('-' ,expand=True)

        self.df.drop(columns=['Time'], inplace=True)

        self.df['Date'] = pd.to_datetime(self.df['Date'], format='%Y-%m-%d')

        self.df.set_index(self.df['Date'])

        return self.df

Когда я вызываю эту функцию в моем основном скрипте (см. Ниже), я получаю сообщение об ошибке:

AttributeError: module 'MyClass' has no attribute 'preprocess_dataframe'

Это соответствующая часть моего основного сценария:

import MyClass as mc

path = 'Data.txt'

df = mc.preprocess_dataframe(path)

>>>AttributeError: module 'MyClass' has no attribute 'preprocess_dataframe'

Я просмотрел несколько других вопросов, включая этот. Однако, ничто не решило мою проблему, несмотря на то, что я думаю, что исправить это довольно легко. Спасибо за помощь!

2
Mike_H 12 Апр 2019 в 16:10

2 ответа

Лучший ответ

Вы должны сделать метод статичным

import pandas as pd
import numpy as np
from numba import jit

class MyClass:
    @jit
    @staticmethod
    def preprocess_dataframe(path):
        df = pd.read_csv(path, index_col=False, delimiter=' ' , names=['Time', 'Downloads', 'ServerID', 'Server', 'Date'], usecols=['Time', 'Downloads', 'Server', 'Date'])

        print(self.df.head(5))
        df['Date'] = df['Date'].astype(str)
        df['Timestamp'] = pd.to_datetime(df['Time'] +' '+ df['Date'], format='%H:%M:%S %Y%m%d')
        df[['Server_alone', 'Instance']] = df['Server'].str.split('-' ,expand=True)

        df.drop(columns=['Time'], inplace=True)

        sdf['Date'] = pd.to_datetime(df['Date'], format='%Y-%m-%d')

        df.set_index(df['Date'])

        return df

И назовите это следующим образом

from filename import MyClass

path = 'Data.txt'

df = MyClass.preprocess_dataframe(path)
1
Sparky05 12 Апр 2019 в 13:39

Вы не создали экземпляр MyClass. Вы можете исправить это:

df = mc().preprocess_dataframe(path)

Также измените оператор импорта на: from filename import MyClass as mc

Вы также можете сделать preprocess_dataframe статическим методом, как указано в комментариях.

4
GGJON 12 Апр 2019 в 14:15