Мне нужно сопоставить некоторые точки из разных наборов данных прямыми линиями. Из каждого набора данных я хочу разместить линию. Итак, я получил параметры ai и bi, которые описывают i-строку: ai + bi * x. Проблема в том, что я хочу наложить, что все ai равны, потому что мне нужен один и тот же перехватчик. Я нашел здесь руководство: http://www.scipy.org/Cookbook/FittingData# head-a44b49d57cf0165300f765e8f1b011876776502f. Разница в том, что я не знаю заранее, сколько у меня наборов данных. Мой код такой:
from numpy import *
from scipy import optimize
# here I have 3 dataset, but in general I don't know how many dataset are they
ypoints = [array([0, 2.1, 2.4]), # first dataset, 3 points
array([0.1, 2.1, 2.9]), # second dataset
array([-0.1, 1.4])] # only 2 points
xpoints = [array([0, 2, 2.5]), # first dataset
array([0, 2, 3]), # second, also x coordinates are different
array([0, 1.5])] # the first coordinate is always 0
fitfunc = lambda a, b, x: a + b * x
errfunc = lambda p, xs, ys: array([ yi - fitfunc(p[0], p[i+1], xi)
for i, (xi,yi) in enumerate(zip(xs, ys)) ])
p_arrays = [r_[0.]] * len(xpoints)
pinit = r_[[ypoints[0][0]] + p_arrays]
fit_parameters, success = optimize.leastsq(errfunc, pinit, args = (xpoints, ypoints))
Я получил
Traceback (most recent call last):
File "prova.py", line 19, in <module>
fit_parameters, success = optimize.leastsq(errfunc, pinit, args = (xpoints, ypoints))
File "/usr/lib64/python2.6/site-packages/scipy/optimize/minpack.py", line 266, in leastsq
m = check_func(func,x0,args,n)[0]
File "/usr/lib64/python2.6/site-packages/scipy/optimize/minpack.py", line 12, in check_func
res = atleast_1d(thefunc(*((x0[:numinputs],)+args)))
File "prova.py", line 14, in <lambda>
for i, (xi,yi) in enumerate(zip(xs, ys)) ])
ValueError: setting an array element with a sequence.
2 ответа
Если вам просто нужна линейная аппроксимация, то лучше оценить ее с помощью линейной регрессии, а не нелинейного оптимизатора. Более точную статистику можно получить, используя вместо этого scikits.statsmodels.
import numpy as np
from numpy import array
ypoints = np.r_[array([0, 2.1, 2.4]), # first dataset, 3 points
array([0.1, 2.1, 2.9]), # second dataset
array([-0.1, 1.4])] # only 2 points
xpoints = [array([0, 2, 2.5]), # first dataset
array([0, 2, 3]), # second, also x coordinates are different
array([0, 1.5])] # the first coordinate is always 0
xp = np.hstack(xpoints)
indicator = []
for i,a in enumerate(xpoints):
indicator.extend([i]*len(a))
indicator = np.array(indicator)
x = xp[:,None]*(indicator[:,None]==np.arange(3)).astype(int)
x = np.hstack((np.ones((xp.shape[0],1)),x))
print np.dot(np.linalg.pinv(x), ypoints)
# [ 0.01947973 0.98656987 0.98481549 0.92034684]
Матрица регрессоров имеет общий перехват, но разные столбцы для каждого набора данных:
>>> x
array([[ 1. , 0. , 0. , 0. ],
[ 1. , 2. , 0. , 0. ],
[ 1. , 2.5, 0. , 0. ],
[ 1. , 0. , 0. , 0. ],
[ 1. , 0. , 2. , 0. ],
[ 1. , 0. , 3. , 0. ],
[ 1. , 0. , 0. , 0. ],
[ 1. , 0. , 0. , 1.5]])
(Примечание: используйте def
, а не lambda
, назначенный имени - это совершенно глупо и не имеет ничего, кроме недостатков, lambda
использует только анонимный сильный > функции!).
Ваш errfunc
должен возвращать последовательность (массив или иначе) чисел с плавающей запятой, но это не так, потому что вы пытаетесь поместить в качестве элементов своих массивов массивы, которые являются различиями каждой точки y
(помните, ypoints
он же ys
- это список массивов!) и результаты подходящих функций. Поэтому вам нужно "свернуть" выражение yi - fitfunc(p[0], p[i+1], xi)
до одного числа с плавающей запятой, например norm(yi - fitfunc(p[0], p[i+1], xi))
.
Похожие вопросы
Новые вопросы
python
Python - это многопарадигмальный, динамически типизированный, многоцелевой язык программирования. Он разработан для быстрого изучения, понимания и использования, а также для обеспечения чистого и единообразного синтаксиса. Обратите внимание, что Python 2 официально не поддерживается с 01.01.2020. Тем не менее, для вопросов о Python, связанных с версией, добавьте тег [python-2.7] или [python-3.x]. При использовании варианта Python (например, Jython, PyPy) или библиотеки (например, Pandas и NumPy) включите его в теги.