Вопросы внедрения о науке о данных. Наука о данных касается извлечения знаний или идей из данных в любой форме или форме. Он может содержать прогнозную аналитику и обычно требует много обработки данных. Общие вопросы о науке о данных следует размещать в соответствующих сообществах.

Подробнее про data-science...

Я работаю над заданием, собираю данные с веб-страницы. После этого я не могу сохранить данные в текстовом файле. htmldata=getdata("https://insights.blackcoffer.com/ai-in-healthcare-to-improve-patient-outcomes/") soup=BeautifulSoup(htmldata,"html.parser") data=soup.find_all("p") fun=data[16:-3] fo...
25 Май 2023 в 14:57
Есть ли доказательства того, что проблемы, описанные в "Что ожидать от результатов подобия" также применимы к модели встраивания text-embedding-ada-002 OpenAI? В основном Два документа, выражающие одно и то же значение с разной формулировкой, вернут более низкую оценку сходства, чем два документа, к...
Я хочу использовать langchain для своего проекта. Поэтому я установил его с помощью следующей команды: pip install langchain Но при импорте "langchain" я столкнулся со следующей ошибкой: File /usr/lib/python3.8/typing.py:774, in _GenericAlias.__subclasscheck__(self, cls) 772 if self._special: ...
23 Май 2023 в 13:09
import bs4 import pandas as pd import re from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.ac...
Я создал аудиопроект обучаемой машины, загрузил его и использовал URL-адрес в html-коде, который также предоставляется обучаемой машиной, и когда я запускаю в браузере, он работает. Но теперь я хочу использовать загруженную модель вместо загруженного URL: что я пробовал: вместо const URL = "https:/...
Новичок в ARIMA и попытка смоделировать набор данных в Python с использованием автоматического ARIMA. Я использую auto-ARIMA, так как считаю, что он лучше определяет значения p, d и q, однако результаты плохие, и мне нужно некоторое руководство. Пожалуйста, смотрите мои воспроизводимые попытки ниж...
21 Май 2023 в 02:02
"[{'credit_id': '52fe4284c3a36847f8024f49', 'отдел': 'Режиссура', 'пол': 2, 'id': 7879, 'должность': 'Директор', 'имя': 'Джон Лассетер', 'profile_path ': '/7EdqiNbr4FRjIhKHyPPdFfEEEFG.jpg'} ]"" набор данных['crew'] выглядит следующим образом....
20 Май 2023 в 10:07
Когда я передал данные на лист Excel, он вырезал все лишние нули, которые стоят перед числами, но некоторые из них на самом деле начинались с нулей, поэтому в некоторых строках нули отсутствуют. Я уже обрезал нули: import pandas as pd cpfs = pd.read_excel('cpfs.xlsx') cpf = cpfs.values.tolist() ze...
20 Май 2023 в 02:41
Привет, ребята, я сейчас работаю над анализом настроений. `из трубопровода импорта трансформаторов Sent_pipeline=pipeline('анализ настроений')` Это мои коды, и ошибка, которую он мне дает: Failed to import transformers.models.gpt2.modeling_gpt2 because of the following error (look up to see its tra...
19 Май 2023 в 18:47
Что делает ::Page{} в R/RStudio? Я изучаю науку о данных через сертификационный курс IBM на курсе, и примечания содержат эту строку кода во всех блоках кода и не объясняют, что делает функция «Страница». #load ggplot package library(ggplot2) ::page{title="create a scatterplot of displacement (disp...
19 Май 2023 в 12:28
У меня есть файл csv, в котором есть 3 или более заголовков в одном файле csv. Я хочу, чтобы python или pandas могли распознавать положение заголовка и извлекать информацию о заголовке в файле csv. Здесь я привожу пример файла csv, который у меня есть. "Level and Distortion",,,,,,,,,,,,,,, "Ch1 (F...
19 Май 2023 в 10:01
Я хочу классифицировать базу данных в Excel с помощью Python (Pandas или Openpyxl), где у меня есть имя поставщика в 1-м столбце, и я хочу заполнить тип во 2-м столбце. Но мне нужно указать поставщика в виде строки (поскольку ячейки поставщиков могут различаться). Как мне это сделать? Я думал, что...
18 Май 2023 в 21:16
Я хочу, чтобы пользователь вводил значения в строку, используя определяемую пользователем функцию, я хочу, чтобы она возвращала четные числа. Я пытаюсь вызвать filter_even() и передать четность в качестве аргумента. def filter_even(evens): result_list = [] for number in evens: if num...
18 Май 2023 в 15:19
Могу ли я внедрить Bard в реактивный проект? Я также искал в Google и chatGPT, чтобы найти, что можно использовать BardAPI в реактивном проекте, поэтому я не нашел ни одной статьи или каких-либо вещей, связанных с этим. Может ли кто-нибудь объяснить мне способ его реализации?...
У меня есть следующие три строки: "A randomized, prospective study of [intervention]endometrial resection[intervention] to prevent recurrent endometrial polyps in women with breast cancer receiving tamoxifen. To assess the role of endometrial resection in preventing recurrence of tamoxifen-associate...
15 Май 2023 в 14:47
У меня есть некоторые очищенные данные, которые нуждаются в некоторой очистке. После очистки я хочу создать «числовые и категориальные конвейеры» внутри ColumnTransformer, например: categorical_cols = df.select_dtypes(include='object').columns numerical_cols = df.select_dtypes(exclude='object').col...
for i in data['test preparation course']: if i == 'none': i = None Здесь я пытаюсь преобразовать строку «none» со значениями «None» в python, и все прошло хорошо. Я просто хочу активировать изменения в наборе данных...
Я пытаюсь создать цикл for, который перебирает все значения данных моего фрейма данных pandas и создает круговую диаграмму со станциями быстрой и потоковой зарядки в качестве оттенка для каждого года. Он также должен иметь процент от общего числа зарядных станций за каждый год. region powertra...
12 Май 2023 в 12:09
Я использую титанический набор данных и пытаюсь запустить команду groupby, но она не работает, как показано в бесчисленных онлайн-учебниках. Я назвал свой фрейм данных как ks_cl. Вот команда, которую я выполнил в VScode: ks_cl.groupby(['sex']).mean() Это результат: NotImplementedError ...
12 Май 2023 в 09:39
Я пытаюсь смоделировать случайное время прибытия автомобилей, которые будут парковаться на небольшой парковке. Я хочу использовать генератор случайных чисел для создания случайных событий парковки. Я не уверен, что numpy является правильной библиотекой для этой работы. Пример: я использую randint ...
Я строю регрессионную модель с некоторыми из следующих переменных: Зависимая переменная с именем «Churned». Это содержит либо 1, либо 0. 1, если они сбились, и 0, если они не сбились. Независимая переменная «Насколько доволен сервисом». Оценивается по шкале от 1 до 10, где 1 — очень несчастен, а 1...
Я пытаюсь проанализировать базу данных с координатами (X, Y). Мне нужно прочитать все данные в этом столбце и классифицировать их как север или юг, если это «Y», или восток или запад, если это «X». Итак, в основном, что я хочу сделать, это прочитать все данные в этом столбце и применить одно из эт...
10 Май 2023 в 18:00
Новое для R Я работаю с фреймворком данных, и у него есть столбец типа datetime в формате ЧЧ:ММ:СС. Я попробовал несколько функций, которые я получил из разных источников, но ничего не сработало. Столбец с именем длина поездки имеет формат чч: мм: сс, и я хочу создать новый столбец в том же фрейм...
10 Май 2023 в 10:10
Чем отличается Jupyterhub от простого Jupyter? Я хочу, чтобы вы описали более подробно...
10 Май 2023 в 01:37
Я пытаюсь создать среду conda, но у меня много проблем. Я впервые использую conda (с намерением впервые использовать блокноты Jupyter). Используя macOS, я начинаю с ввода в терминал: conda create --name test_name scikit-learn pandas matplotlib numpy scipy seaborn jupyter statsmodels Я предупрежден...