Я пытаюсь провести некоторый анализ данных с помощью пакета PCA sklearn. Проблема, с которой я сейчас сталкиваюсь, заключается в том, как мой код анализирует данные.

Пример некоторых данных выглядит следующим образом

Интенсивность длины волны; [um] [W / m ** 2 / um / sr] 196.078431372549 1.108370393265022E-003 192.307692307692 1.163428008597600E-003 188.679245283019 1.223639983609668E-003

Код, написанный до сих пор, выглядит следующим образом:

scaler = StandardScaler(with_mean=True, with_std=True) #scales the data

data_crescent=ascii.read('earth_crescent.dat',data_start=4958, data_end=13300, delimiter=' ')#where the data is being read


#where each variable comes from in the dat 
y_intensity_crescent=data_crescent['col2'][:]
x_wave_crescent=data_crescent['col1'][:]

standard_y_crescent=StandardScaler().fit_transform(y_intensity_crescent)#standardizing the intensity variable

#PCA runthrough of data 
pca= PCA(n_components=2)
principalCrescentY=pca.fit_transform(standard_y_crescent)
principalDfcrescent = pd.DataFrame(data = principalCrescentY
             , columns = ['principal component 1', 'principal component 2'])



finalDfcrescent = pd.concat([principalDfcrescent, [y_intensity_crescent]], axis = 1)

После запуска данные выдают эту ошибку:

    ValueError: Expected 2D array, got 1D array instead:

Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample

Чтобы проанализировать данные с помощью PCA, данные должны быть преобразованы в 2D-модель для получения ожидаемых результатов. Любая работа вокруг будет высоко ценится!

1
dom ryan 21 Дек 2019 в 06:01

1 ответ

Лучший ответ

Проблема в том, что вы предоставляете одну функцию y_intensity_crescent вашему объекту pca, выполняя: principalCrescentY=pca.fit_transform(standard_y_crescent). На самом деле вы даете только одно измерение вашему алгоритму PCA. Грубо говоря: анализ основных компонентов берет несколько временных рядов объектов и объединяет их в компоненты, которые являются комбинацией функций. Если вы хотите 2 компонента, вам нужно более 1 функции.

Вот несколько примеров того, как его правильно использовать: Учебник PCA с использованием sklearn

1
Yacine Mahdid 21 Дек 2019 в 03:09