Скажем, стоимость домов (целевая переменная) может быть легко отображена в зависимости от площади домов (переменные-предикторы), и мы можем увидеть нанесенные данные и провести по ним наиболее подходящую линию.

Однако подумайте, есть ли у нас переменные-предикторы, такие как (размер, количество спален, местность, количество этажей) и т. Д. Как мне построить все это относительно целевой переменной и визуализировать их на двумерной фигуре?

0
Sahil Chaturvedi 7 Янв 2018 в 19:09

2 ответа

Лучший ответ

Вычисление не должно быть проблемой (математика работает независимо от размерности), но построение графика определенно усложняется. PCA может быть трудно интерпретировать, и принудительная ортогональность здесь может быть неуместной. Я бы ознакомился с некоторыми советами, представленными здесь: https: //stats.stackexchange.com/questions/73320/how-to-visualize-a-fitted-multiple-regression-model

По сути, это зависит от того, о чем вы пытаетесь сообщить. Хорошая посадка? Может быть, сложите несколько графиков остатков.

2
Peter Barrett Bryan 7 Янв 2018 в 16:44

Если вам действительно нужна двухмерная фигура, это, конечно, непросто. Один из возможных подходов - уменьшить размерность ваших данных до 2, используя что-то вроде анализа основных компонентов. Затем вы можете снова изобразить его в двух измерениях. Уменьшение до 3-х измерений вместо 2-х также может работать, люди могут довольно хорошо понимать 3D-графики, нарисованные на 2D-экране.

Однако обычно вам не нужно выполнять линейную регрессию вручную, поэтому вам также не понадобится 2D-чертеж ваших данных. Вы можете просто позволить своему компьютеру вычислить линейную регрессию, и это отлично работает с более чем 2 или 3 измерениями.

2
Dennis Soemers 7 Янв 2018 в 16:31