Все, что связано с распределением вероятностей хи-квадрат или статистическим тестом хи-квадрат (обычно это распределение, независимость или соответствие).
Хотя я дважды запускал один и тот же тест, но оказалось, что результаты разные.
Сначала я создал таблицу непредвиденных обстоятельств из своих данных:
> SAtab1 <- table(dt2$ACE_SA_BIN, dt2$IHD_other_healthy)
> SAtab1
0 1 2
0 345 577 29
1 10 25 2
А затем я запускаю тест Фишера...
16 Мар 2023 в 21:59
У меня есть набор данных, который выглядит так: Набор данных
> dput(THSWP1_23)
structure(list(`Town District` = c(1, 2, 3, 4, 5, 6, 7, 8, 9),
`health score 1` = c(50, 236, 215, 277, 261, 333, 414, 385,
358), `Health score 2 and 3` = c(51, 238, 218, 281, 266,
339, 421, 393, 367)), class = c("tbl_...
10 Мар 2023 в 18:08
У меня есть два массива с неравным размером выборки. Мне нужно проверить различия между ними, используя критерий хи-квадрат. Может ли кто-нибудь помочь мне, предоставив код Python для теста хи-квадрат с «неравными» размерами выборки. Спасибо.
x = [4, 7, 13, 6, 0, 9 , 5]
y = [25, 6, 2, 12]
#крите...
13 Фев 2023 в 19:19
Я все еще работаю над своим проектом на R. База данных моей анкеты состоит из 39 переменных, каждая из которых имеет 20 Номинальных ответов. Я создаю таблицы непредвиденных обстоятельств 2 x 2 для всех переменных и, из-за небольшого числа выборок, готов применить точный критерий Фишера для подсчета...
11 Фев 2023 в 03:01
У меня есть два набора категориальных функций, и мне нужно применить критерий хи-квадрат. Я не мог использовать и понимать тесты хи-квадрат, доступные в модулях. Можете ли вы помочь мне с функцией для получения p-значений и проверки нулевой гипотезы?...
1 Фев 2023 в 17:06
Версия этого вопроса задавалась несколько раз, но никогда не самым простым способом. По сути, функция stats::chisq.test не работает, когда размеры выборки между двумя группами неодинаковы, несмотря на то, что тесты хи-квадрат должны работать с неравными размерами выборки, насколько я понимаю.
Вот н...
11 Янв 2023 в 20:23
Я пытаюсь понять, почему chisq.test() не возвращает то же p-значение, что и функция summary() в R.
Я попытался поменять одну функцию на другую и обнаружил, что она возвращает совершенно другое значение. Я также попробовал функцию cor.test(), и она возвращает то же значение p, что и сводка.
Сводный ...
10 Янв 2023 в 01:34
Из одного набора данных я создал фильтрацию двух наборов данных по целевой переменной. Теперь я хотел бы сравнить все функции в наборе данных, используя хи-квадрат. Проблема в том, что один из двух наборов данных намного меньше другого, поэтому в некоторых функциях у меня есть некоторые значения, ...
7 Янв 2023 в 20:17
Я все еще новичок в R и анализе данных в целом. У меня есть набор данных, состоящий из 2 частей:
20 вопросов (ответы на которые даны в формате 5-балльной шкалы Лайкерта) 8 социально-демографических переменных
Вот уменьшенная примерная версия набора данных (содержит только 3 из 20 вопросов и 3 социа...
2 Янв 2023 в 19:48
Я сделал одно горячее кодирование в своем фрейме данных X_train, чтобы преобразовать категориальные переменные в фрейме данных в числовые переменные. Это привело к тому, что мои столбцы значительно увеличились с некоторыми членами/элементами некоторых столбцов, названных отдельными столбцами. Зате...
24 Дек 2022 в 20:04
У меня есть данные о растениях, выращенных в питомнике. У меня есть переменная для здоровья растений и несколько факторов.
Я хотел проверить, влияет ли какой-либо из факторов на здоровье растений, поэтому я подумал, что лучшим методом будет использование теста хи-квадрат.
Мой метод ниже, но я застр...
18 Дек 2022 в 12:13
Это может быть вопрос, на который можно было бы ответить относительно быстро, если бы я знал больше терминологии.
Правильно ли я выполняю тест хи-квадрат на независимость от переменной JOB?
CD %>% select(JOB, DEFAULT) %>%
table() %>% chisq.test()
unique(CD$JOB)
[1] SkilledEmployee/Official ...
11 Дек 2022 в 02:56
Я немного запутался в процессе оптимизации значений двух параметров, которые я дал своим оценочным значениям.
import scipy.optimize as optimize
# Define the function you want to minimize
def my_function(x, y):
return x**2 + y**2
# Use the fmin function to find the minimum of the function
resul...
10 Дек 2022 в 17:59
У меня есть данные из игры. Значения от 1 до 10, и мне нужно проверить, является ли эта игра честной игрой. Я составил таблицу частот и хочу провести тест хи-квадрат в R.
Насколько я понимаю, «справедливая вероятность» должна быть равна 1/10.
Затем я повторяю это значение 100 раз (как длина моих н...
25 Ноя 2022 в 14:39
У меня есть этот вектор значений частоты
x = c(100,400,500,600,700)
При проведении теста хи-квадрат на соответствие у меня есть этот результат, который имеет глобальное значимое значение p
chisq.test(x)
Однако я ищу апостериорную тестовую функцию в R, которая может сказать мне, какие значения зн...
17 Ноя 2022 в 18:33
Спасибо за уделенное время!
Я пытаюсь запустить тест хи-квадрат для каждой из переменных в моем наборе данных, и я выполняю его с помощью цикла, который проходит через список. Тем не менее, я пытаюсь выяснить синтаксис, чтобы цикл печатал имя переменной по мере его повторения. Вот мой код
#Definin...
14 Ноя 2022 в 19:50
После описательной статистики я использовал критерий хи-квадрат для сравнения категориальных переменных. Стьюдентный критерий независимых выборок и U-критерий Манна-Уитни для непрерывных переменных в зависимости от распределения. У меня очень большая выборка в 150 000 человек. Итак, я получаю оче...
3 Ноя 2022 в 18:05
У меня есть эти наборы данных: df в качестве основного фрейма данных (но давайте представим их все как очень большие наборы данных).
df = data.frame(x = seq(1,20,2),
y = c('a','a','b','c','a','a','b','c','a','a'),
z = c('d','e','e','d','f','e','e','d','e','f') )
stage1 = data.frame(xx = c(2,3,4,5,7...
24 Окт 2022 в 12:35
Я написал тест в соответствии с найденным подходом. При просмотре Stack Overflow я увидел другой подход (можно увидеть здесь ), который был немного сложнее, и заставил меня задуматься, правильный ли я выбрал. Я ищу способы проверить правильность моего расчета.
Вот соответствующий код:
from scipy....
18 Окт 2022 в 11:25
Пожалуйста, см. «Приложение 3»
Я пытаюсь выполнить тест ANOVA в R, чтобы увидеть, есть ли различия между избирателями 5 основных политических партий на всеобщих выборах в Испании 2019 года в соответствии с переменной «возраст» (P20_range обозначает разные возрастные интервалы в мой код).
Мой код вы...
9 Окт 2022 в 22:04
Проблема
У меня есть список с тремя векторами, где two are categorical (Whistle_Type and Country) и один numeric (counts of whistle types A-F) (см. ниже), который я создал с помощью dplyr() with the count() function (см. ниже сильный>). Я хочу запустить Chi-Square test, чтобы определить, есть ли ...
6 Окт 2022 в 09:01
Проблема
У меня есть группа под названием Country, которая имеет два уровня (Испания и Германия), и у меня есть nine parameters, которые представляют собой измерения, взятые из спектрограмм для свистков дельфинов. Я хочу определить, различаются ли какие-либо параметры между странами.
Для этого ан...
27 Сен 2022 в 15:49
Здесь я сделал data следующим образом:
data<-data.frame(alzheimer=c(1,1,0,1,0,0,1,0,0,0),
asthma=c(1,1,0,0,1,1,1,1,0,0),
points=c(0,1,3,5,3,2,1,2,1,5),
sex=c(1,1,0,0,0,0,1,1,1,0))
Я хочу знать, влияет ли sex на alzheimer, asthma или points. Поэтом...
27 Сен 2022 в 08:27
У меня больше похоже на статистический вопрос... У меня есть такой фрейм данных:
ID diagnosis Q1 Q2 Q3 Q4
1 x yes A D B B
2 y no B D B A
3 z yes A D C C
4 ad yes <NA> C A C
5 tgfg yes C ...
14 Сен 2022 в 23:23
Я написал код ниже, который запускает тест chi sq, извлекает соответствующие коляски из результатов и помещает их в фрейм данных, переименовывает столбцы и разбивает первый столбец на два столбца, затем я делаю то же самое для второго теста chisq , и строка связывает два результата. я попытался со...
2 Сен 2022 в 05:15