Вопросы внедрения о науке о данных. Наука о данных касается извлечения знаний или идей из данных в любой форме или форме. Он может содержать прогнозную аналитику и обычно требует много обработки данных. Общие вопросы о науке о данных следует размещать в соответствующих сообществах.
Я работаю над заданием, собираю данные с веб-страницы. После этого я не могу сохранить данные в текстовом файле.
htmldata=getdata("https://insights.blackcoffer.com/ai-in-healthcare-to-improve-patient-outcomes/")
soup=BeautifulSoup(htmldata,"html.parser")
data=soup.find_all("p")
fun=data[16:-3]
fo...
25 Май 2023 в 14:57
Есть ли доказательства того, что проблемы, описанные в "Что ожидать от результатов подобия" также применимы к модели встраивания text-embedding-ada-002 OpenAI?
В основном
Два документа, выражающие одно и то же значение с разной формулировкой, вернут более низкую оценку сходства, чем два документа, к...
24 Май 2023 в 14:16
Я хочу использовать langchain для своего проекта.
Поэтому я установил его с помощью следующей команды: pip install langchain
Но при импорте "langchain" я столкнулся со следующей ошибкой:
File /usr/lib/python3.8/typing.py:774, in _GenericAlias.__subclasscheck__(self, cls)
772 if self._special:
...
23 Май 2023 в 13:09
import bs4
import pandas as pd
import re
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.ac...
22 Май 2023 в 15:03
Я создал аудиопроект обучаемой машины, загрузил его и использовал URL-адрес в html-коде, который также предоставляется обучаемой машиной, и когда я запускаю в браузере, он работает. Но теперь я хочу использовать загруженную модель вместо загруженного URL: что я пробовал: вместо const URL = "https:/...
22 Май 2023 в 12:30
Новичок в ARIMA и попытка смоделировать набор данных в Python с использованием автоматического ARIMA. Я использую auto-ARIMA, так как считаю, что он лучше определяет значения p, d и q, однако результаты плохие, и мне нужно некоторое руководство. Пожалуйста, смотрите мои воспроизводимые попытки ниж...
21 Май 2023 в 02:02
"[{'credit_id': '52fe4284c3a36847f8024f49', 'отдел': 'Режиссура', 'пол': 2, 'id': 7879, 'должность': 'Директор', 'имя': 'Джон Лассетер', 'profile_path ': '/7EdqiNbr4FRjIhKHyPPdFfEEEFG.jpg'} ]"" набор данных['crew'] выглядит следующим образом....
20 Май 2023 в 10:07
Когда я передал данные на лист Excel, он вырезал все лишние нули, которые стоят перед числами, но некоторые из них на самом деле начинались с нулей, поэтому в некоторых строках нули отсутствуют.
Я уже обрезал нули:
import pandas as pd
cpfs = pd.read_excel('cpfs.xlsx')
cpf = cpfs.values.tolist()
ze...
20 Май 2023 в 02:41
Привет, ребята, я сейчас работаю над анализом настроений.
`из трубопровода импорта трансформаторов
Sent_pipeline=pipeline('анализ настроений')`
Это мои коды, и ошибка, которую он мне дает: Failed to import transformers.models.gpt2.modeling_gpt2 because of the following error (look up to see its tra...
19 Май 2023 в 18:47
Что делает ::Page{} в R/RStudio?
Я изучаю науку о данных через сертификационный курс IBM на курсе, и примечания содержат эту строку кода во всех блоках кода и не объясняют, что делает функция «Страница».
#load ggplot package
library(ggplot2)
::page{title="create a scatterplot of displacement (disp...
19 Май 2023 в 12:28
У меня есть файл csv, в котором есть 3 или более заголовков в одном файле csv. Я хочу, чтобы python или pandas могли распознавать положение заголовка и извлекать информацию о заголовке в файле csv. Здесь я привожу пример файла csv, который у меня есть.
"Level and Distortion",,,,,,,,,,,,,,,
"Ch1 (F...
19 Май 2023 в 10:01
Я хочу классифицировать базу данных в Excel с помощью Python (Pandas или Openpyxl), где у меня есть имя поставщика в 1-м столбце, и я хочу заполнить тип во 2-м столбце. Но мне нужно указать поставщика в виде строки (поскольку ячейки поставщиков могут различаться). Как мне это сделать?
Я думал, что...
18 Май 2023 в 21:16
Я хочу, чтобы пользователь вводил значения в строку, используя определяемую пользователем функцию, я хочу, чтобы она возвращала четные числа.
Я пытаюсь вызвать filter_even() и передать четность в качестве аргумента.
def filter_even(evens):
result_list = []
for number in evens:
if num...
18 Май 2023 в 15:19
Могу ли я внедрить Bard в реактивный проект?
Я также искал в Google и chatGPT, чтобы найти, что можно использовать BardAPI в реактивном проекте, поэтому я не нашел ни одной статьи или каких-либо вещей, связанных с этим. Может ли кто-нибудь объяснить мне способ его реализации?...
18 Май 2023 в 14:03
У меня есть следующие три строки:
"A randomized, prospective study of [intervention]endometrial resection[intervention] to prevent recurrent endometrial polyps in women with breast cancer receiving tamoxifen. To assess the role of endometrial resection in preventing recurrence of tamoxifen-associate...
15 Май 2023 в 14:47
У меня есть некоторые очищенные данные, которые нуждаются в некоторой очистке. После очистки я хочу создать «числовые и категориальные конвейеры» внутри ColumnTransformer, например:
categorical_cols = df.select_dtypes(include='object').columns
numerical_cols = df.select_dtypes(exclude='object').col...
14 Май 2023 в 12:52
for i in data['test preparation course']: if i == 'none': i = None
Здесь я пытаюсь преобразовать строку «none» со значениями «None» в python, и все прошло хорошо.
Я просто хочу активировать изменения в наборе данных...
13 Май 2023 в 22:48
Я пытаюсь создать цикл for, который перебирает все значения данных моего фрейма данных pandas и создает круговую диаграмму со станциями быстрой и потоковой зарядки в качестве оттенка для каждого года. Он также должен иметь процент от общего числа зарядных станций за каждый год.
region powertra...
12 Май 2023 в 12:09
Я использую титанический набор данных и пытаюсь запустить команду groupby, но она не работает, как показано в бесчисленных онлайн-учебниках. Я назвал свой фрейм данных как ks_cl. Вот команда, которую я выполнил в VScode:
ks_cl.groupby(['sex']).mean()
Это результат:
NotImplementedError ...
12 Май 2023 в 09:39
Я пытаюсь смоделировать случайное время прибытия автомобилей, которые будут парковаться на небольшой парковке. Я хочу использовать генератор случайных чисел для создания случайных событий парковки. Я не уверен, что numpy является правильной библиотекой для этой работы.
Пример: я использую randint ...
12 Май 2023 в 03:32
Я строю регрессионную модель с некоторыми из следующих переменных:
Зависимая переменная с именем «Churned». Это содержит либо 1, либо 0. 1, если они сбились, и 0, если они не сбились. Независимая переменная «Насколько доволен сервисом». Оценивается по шкале от 1 до 10, где 1 — очень несчастен, а 1...
11 Май 2023 в 13:29
Я пытаюсь проанализировать базу данных с координатами (X, Y). Мне нужно прочитать все данные в этом столбце и классифицировать их как север или юг, если это «Y», или восток или запад, если это «X». Итак, в основном, что я хочу сделать, это прочитать все данные в этом столбце и применить одно из эт...
10 Май 2023 в 18:00
Новое для R Я работаю с фреймворком данных, и у него есть столбец типа datetime в формате ЧЧ:ММ:СС. Я попробовал несколько функций, которые я получил из разных источников, но ничего не сработало. Столбец с именем длина поездки имеет формат чч: мм: сс, и я хочу создать новый столбец в том же фрейм...
10 Май 2023 в 10:10
Чем отличается Jupyterhub от простого Jupyter?
Я хочу, чтобы вы описали более подробно...
10 Май 2023 в 01:37
Я пытаюсь создать среду conda, но у меня много проблем. Я впервые использую conda (с намерением впервые использовать блокноты Jupyter).
Используя macOS, я начинаю с ввода в терминал:
conda create --name test_name scikit-learn pandas matplotlib numpy scipy seaborn jupyter statsmodels
Я предупрежден...
9 Май 2023 в 03:29