Scikit-learn — это библиотека машинного обучения для Python, которая предоставляет простые и эффективные инструменты для анализа и интеллектуального анализа данных с упором на машинное обучение. Он доступен для всех и может использоваться повторно в различных контекстах. Он построен на NumPy и SciPy. Проект имеет открытый исходный код и может использоваться в коммерческих целях (лицензия BSD).

Подробнее про scikit-learn...

Поэтому меня просят реализовать параметр функции разделения: 80% обучение, 10% проверка и 10% тестирование. И я не понимаю, как это сделать здесь. Пожалуйста помоги. Спасибо. def plot_example(x_raw, y_raw): fig, axes = plt.subplots(3, 3) i = 0 for i in range(3): for j in range(3): ...
Можно ли получить имена меток из модели sklearn SGDClassifier, которая загружается из файла рассола? model = pickle.load(open("saved_model.pkl", 'rb')) y_pred = model.predict(x) Поскольку во входном векторе x могут присутствовать не все метки, как узнать возможные метки?...
27 Ноя 2022 в 05:17
Я относительно новичок в Python, и я пытаюсь создать модель множественной линейной регрессии, которая имеет две переменные-предикторы и одну зависимую. Проводя исследование по этому вопросу, я обнаружил, что Scikit предоставляет класс для этого. Я попытался получить модель для своих переменных и п...
Я работаю над веб-приложением ML и тренирую данные из файла CSV. При преобразовании массива данных в число с плавающей запятой появляется ValueError КОД X[:, 0] = le_country.transform(X[:,0]) X[:, 1] = le_education.transform(X[:,1]) X = X.astype(float) X < Сильный > ОШИБКА During handling of the a...
Я пытаюсь иметь 4 из моих 5 столбцов csv, чтобы предсказать последний столбец. я использовал MinMaxScaler, чтобы масштабировать мои данные до диапазона 0-1, но в какой-то момент, когда я хочу invers_transform это, MinMaxScaler изменяет мои исходные данные. Вот мой код: dataset = read_csv('zz.csv'...
26 Ноя 2022 в 10:24
При написании пользовательских классов, наследуемых от BaseEstimator sklearn, выбрасывающего AttributeError: object has no attribute . но этот атрибут присутствует и имеет значения. class BaseNull(BaseEstimator, TransformerMixin): def __init__(self, variables: Union...
26 Ноя 2022 в 05:35
Я работаю над задачей, где я должен увеличить данные. Для увеличения данных я должен выполнить полиномиальную аппроксимацию данных (нелинейные данные). Но если я сделаю полиномиальную аппроксимацию, я не получу точной аппроксимации данных. Ниже приведены 35 точек, которые я использовал в качестве ...
В модели RFC я пытаюсь выяснить, как важность функций меняет мою классификацию, когда я искажаю свои данные, например Функции (отсутствие возмущения) = функции (возмущенные данные) - функции (возмущения) Затем, используя функции (без возмущения) на моей уже подходящей модели. Можно ли вручную устан...
Я пытаюсь масштабировать набор дат для обучения модели машинного обучения использованию python и scikit-learn. Я хочу масштабировать набор данных, но утверждаю, что все необработанные отрицательные значения остаются отрицательными после масштабирования, а все необработанные положительные значения о...
Я работаю над проблемой регрессии ML, где я определил конвейер, как показано ниже, на основе онлайн-учебника. Мой код выглядит ниже pipe1 = Pipeline([('poly', PolynomialFeatures()), ('fit', linear_model.LinearRegression())]) pipe2 = Pipeline([('poly', PolynomialFeatures()), ...
У меня есть 9 предикторов (Clean df), но когда я запускаю модель, я получаю 10 коэффициентов. Вот мой код: #Get clean df with only more relevant columns Clean_indices = wkospi[['Open_sp','Close_sp','Close_jp','Open_eur','High_eur','Open_kos','Close_kos','1 Mo','2 Mo','1 Yr','2 Yr','Open_oil','Open_...
24 Ноя 2022 в 18:57
Я пытаюсь выполнить инверсию MixMaxScaler из одного значения. Однако я получаю эту ошибку: ValueError: Expected 2D array, got scalar array instead: array=0.16019679677629. Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a ...
24 Ноя 2022 в 18:40
Я тренирую CSV-файл с помощью sklearn, используя DecesionTreeClassifier, RandomForestClassifier и SVC. Когда я запускаю его, все они дают мне предупреждение: «X имеет имена функций, но классификатор был установлен без имен функций» 4 раза каждый. Я получаю данные с пандами и разделяю данные следующ...
Чтобы быть более конкретным, дисперсия ошибки значения x в два раза меньше, чем дисперсия ошибки y. Я просмотрел sklearn и не смог найти функцию, учитывающую дисперсию ошибки x....
24 Ноя 2022 в 15:20
Я знаю, как использовать predict_proba() и смысл вывода. Может ли кто-нибудь сказать мне, как pred_proba() внутренне вычисляет вероятность для дерева решений?...
Попытка установить последнюю версию Scipy (1.9.3) на образ python3.8-alpine tiangolo/uwsgi-nginx-flask:python3.8-alpine Не удалось. Scipy пытается установить numpy 1.8.5 и терпит неудачу со следующей ошибкой. ImportError: cannot import name 'Log' from 'distutils.log' (/tmp/pip-build-env-28q9f6x4/ov...
23 Ноя 2022 в 07:46
Я использовал sklearn.model_selection.cross_validate для перекрестной проверки sklearn.pipeline.Pipeline, и это прекрасно работает. Теперь меня интересуют коэффициенты шага выбора признаков в пайплайне. Используется селектор SelectFromModel(LinearSVC(penalty="l1", dual=False)). При установке return...
22 Ноя 2022 в 21:55
Я работаю над набором данных с довольно выраженным дисбалансом классов. Чтобы справиться с этим, я пытаюсь уменьшить экземпляры всех классов до того же количества, что и класс с наименьшим количеством экземпляров. wisdm["activity"].value_counts() Walking 418393 Jogging 336445 Upstairs ...
22 Ноя 2022 в 19:46
По сути, у меня есть набор данных с моделями автомобилей, и мне нужна гистограмма, на которой должно отображаться наибольшее количество обзоров 20 марок автомобилей! Я попробовал этот приведенный ниже код, но я получаю все модели брендов из набора данных, но мне нужны только 20 лучших марок автомоби...
I', создаю некоторые конвейеры с помощью scikit-learn, но у меня возникают проблемы с сохранением имен переменных в виде исходных имен, а не в формате имя_трансформатора__имя_функции. Это сценарий: У меня есть набор трансформеров, как пользовательских, так и некоторых из самого scikit-learn. Набор т...
21 Ноя 2022 в 23:27
Прямо сейчас у меня есть один экземпляр AI Notebook с двумя блокнотами (один для модели обучения, один для прогнозов и сохранения в таблице BigQuery для дальнейших целей). Мне нужно тренироваться и делать прогнозы еженедельно (или тренироваться только раз в месяц), и я делаю это вручную неделю за н...
Я новичок в машинном обучении и немного запутался, извините за тривиальный вопрос. У меня есть набор данных временных рядов, очень простой с двумя столбцами - Дата и Цена. Я прогнозирую цену и хочу добавить в свою модель некоторые функции, такие как скользящее среднее за последние 10 дней. Если я...
Я изучаю этот фрагмент и не понимаю, как было построено добавление столбцов. def column_addition(X): return X[:, [0]] + X[:, [1]] def addition_pipeline(): return make_pipeline( SimpleImputer(strategy="median"), FunctionTransformer(column_addition)) preprocessing = ColumnTra...
20 Ноя 2022 в 21:45
Я видел эту диаграмму потери шарнира: https://math.stackexchange.com/questions/782586/how-do-you-minimize-hinge-loss А также здесь: https://programmatically.com/understanding-hinge-loss-and-the-svm-cost-function/ Однако создание «того же» графика с помощью scikit-learn очень похоже, но кажется «прот...
20 Ноя 2022 в 21:37
Я работаю над заданием класса, где мне нужно использовать KNN для создания классификатора и точности отчета. У меня есть код, над которым я работаю. Я получил эту ошибку в коде ниже. Трассировка (последний последний вызов): Файл "c:\Users\jazzm\OneDrive\Desktop\python\HWK6.py", строка 20, в classi...
20 Ноя 2022 в 21:25