У меня есть файл CSV, содержащий столбец / атрибут «дельта», содержащий разницу в часах между двумя столбцами даты и времени. Я использую Python3. Когда я применяю к нему value_count () после удаления небольших значений, я получаю следующее:

delta_filtered['difference'].value_counts()
0    44895
1     8605
2     4624
3     2759
4     1829
5     1449
6     1015
Name: difference, dtype: int64

difference distribution

На рисунке ось X содержит часы, а ось Y - счетчик. Судя по визуализации, это бета-версия. Теперь я заинтересован в вычислении pdf и cdf для него, используя бета-версию от scipy.

Как мне вычислить параметры 'a' и 'b' для этого распределения, необходимые для функции scipy.stats.beta ()?

Благодарность

0
Arun 10 Фев 2021 в 10:23

1 ответ

Лучший ответ

В общем, вы можете вычислить параметры следующим образом:

from scipy.stats import beta
a, b, loc, scale = beta.fit(x)

См. Документацию здесь.

Однако бета-распределение определяется только между 0 и 1.

1
David M. 10 Фев 2021 в 14:28