Hướng dẫn goodness of fit python curve_fit - sự tốt lành của vừa vặn với python curve_fit

Tôi đang buộc để tìm ra sự phù hợp nhất cho dữ liệu được đưa ra. Những gì tôi đã làm là tôi lặp qua các giá trị khác nhau của N và tính toán dư ở mỗi p bằng cách sử dụng công thức ((y_fit - y_actual) / y_actual) x 100. Sau đó, tôi tính trung bình của mỗi n và sau đó tìm giá trị trung bình còn lại tối thiểu còn lại và giá trị N tương ứng và phù hợp bằng cách sử dụng giá trị này. Một mã có thể tái tạo bao gồm:

import numpy as np
import matplotlib.pyplot as plt
from scipy import optimize   

x = np.array([12.4, 18.2, 20.3, 22.9, 27.7, 35.5, 53.9])
y = np.array([1, 50, 60, 70, 80, 90, 100])
y_residual = np.empty(shape=(1, len(y)))
residual_mean = []

n = np.arange(0.01, 10, 0.01)

def fit(x, a, b):
    return a * x + b
for i in range (len(n)):
    x_fit = 1 / np.log(x) ** n[i]
    y_fit = y
    fit_a, fit_b = optimize.curve_fit(fit, x_fit, y_fit)[0]
    y_fit = (fit_a * x_fit) + fit_b
    y_residual = (abs(y_fit - y) / y) * 100
    residual_mean = np.append(residual_mean, np.mean(y_residual[np.isfinite(y_residual)]))
p = n[np.where(residual_mean == residual_mean.min())]
p = p[0]
print p
x_fit = 1 / np.log(x) ** p
y_fit = y
fit_a, fit_b = optimize.curve_fit(fit, x_fit, y_fit)[0]
y_fit = (fit_a * x_fit) + fit_b
y_residual = (abs(y_fit - y) / y) * 100

fig = plt.figure(1, figsize=(5, 5))
fig.clf()
plot = plt.subplot(111)
plot.plot(x, y, linestyle = '', marker='^')
plot.plot(x, y_fit, linestyle = ':')
plot.set_ylabel('y')
plot.set_xlabel('x')
plt.show()

fig_1 = plt.figure(2, figsize=(5, 5))
fig_1.clf()
plot_1 = plt.subplot(111)
plot_1.plot(1 / np.log(x) ** p, y, linestyle = '-')
plot_1.set_xlabel('pow(x, -p)' )
plot_1.set_ylabel('y' )
plt.show()

fig_2 = plt.figure(2, figsize=(5, 5))
fig_2.clf()
plot_2 = plt.subplot(111)
plot_2.plot(n, residual_mean, linestyle = '-')
plot_2.set_xlabel('n' )
plot_2.set_ylabel('Residual mean')
plt.show()

Vẽ đồ thị có nghĩa là còn lại với N, đây là những gì tôi nhận được:

Hướng dẫn goodness of fit python curve_fit - sự tốt lành của vừa vặn với python curve_fit

Tôi cần biết nếu phương pháp này là chính xác để xác định phù hợp nhất. Và nếu nó có thể được thực hiện với một số chức năng khác trong SCIPY hoặc bất kỳ gói nào khác. Về bản chất, những gì tôi muốn là biết một cách định lượng đó là phù hợp nhất. Tôi đã trải qua những bài kiểm tra phù hợp ở Scipy nhưng điều đó không giúp được gì cho tôi nhiều.

scipy.optimize.curve_fit (f, xdata, ydata, p0 = none, sigma = none , ** kwargs) [nguồn]#curve_fit(f, xdata, ydata, p0=None, sigma=None, absolute_sigma=False, check_finite=True, bounds=(- inf, inf), method=None, jac=None, *, full_output=False, **kwargs)[source]#

Sử dụng bình phương tối thiểu phi tuyến tính để phù hợp với một hàm, f, vào dữ liệu.

Giả sử ydata = f(xdata, *params) + eps.

Tham sốfcallablefcallable

Hàm mô hình, F (x, xông). Nó phải lấy biến độc lập làm đối số đầu tiên và các tham số để phù hợp như các đối số còn lại riêng biệt.

xdataarray_like hoặc đối tượngarray_like or object

Biến độc lập nơi dữ liệu được đo. Thường nên là một chuỗi độ dài m hoặc một mảng (k, m) cho các hàm với các dự đoán k, nhưng thực sự có thể là bất kỳ đối tượng nào.

ydataarray_likearray_like

Dữ liệu phụ thuộc, một mảng m chiều dài - trên danh nghĩa f(xdata, ...).

p0array_like, tùy chọnarray_like, optional

Dự đoán ban đầu cho các tham số (độ dài n). Nếu không có, thì tất cả các giá trị ban đầu sẽ là 1 (nếu số lượng tham số cho hàm có thể được xác định bằng cách sử dụng hướng nội, nếu không một giá trị được nâng lên).

Sigmanone hoặc chuỗi độ dài hoặc mảng MXM, tùy chọnNone or M-length sequence or MxM array, optional

Xác định sự không chắc chắn trong ydata. Nếu chúng ta xác định phần dư là r = ydata - f(xdata, *popt), thì việc giải thích Sigma phụ thuộc vào số lượng kích thước của nó:

  • Một sigma 1-D nên chứa các giá trị độ lệch chuẩn của các lỗi trong ydata. Trong trường hợp này, hàm tối ưu hóa là

    >>> import matplotlib.pyplot as plt
    >>> from scipy.optimize import curve_fit
    
    0.

  • Một sigma 2 chiều phải chứa ma trận sai số hiệp phương sai trong ydata. Trong trường hợp này, hàm được tối ưu hóa là

    >>> import matplotlib.pyplot as plt
    >>> from scipy.optimize import curve_fit
    
    1.

    Mới trong phiên bản 0.19.

Không có (mặc định) tương đương với Sigma 1-D chứa đầy những cái.

Tuyệt đối_sigmabool, tùy chọnbool, optional

Nếu đúng, Sigma được sử dụng theo nghĩa tuyệt đối và PCOV hiệp phương sai tham số ước tính phản ánh các giá trị tuyệt đối này.

Nếu sai (mặc định), chỉ có cường độ tương đối của các giá trị Sigma có vấn đề. Ma trận hiệp phương sai tham số được trả về dựa trên tỷ lệ sigma theo hệ số không đổi. Hằng số này được đặt bằng cách yêu cầu Chisq giảm cho các tham số tối ưu POPT khi sử dụng sigma được chia tỷ lệ bằng với sự thống nhất. Nói cách khác, Sigma được chia tỷ lệ để phù hợp với phương sai mẫu của phần dư sau khi phù hợp. Mặc định là sai. Về mặt toán học,

>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
2

Check_finitebool, tùy chọnbool, optional

Nếu đúng, hãy kiểm tra xem các mảng đầu vào không chứa NAN của INF và tăng giá trị horror nếu chúng làm được. Đặt tham số này thành sai có thể âm thầm tạo ra kết quả vô nghĩa nếu các mảng đầu vào có chứa NAN. Mặc định là đúng.

Bound2-Tuple của Array_Like, Tùy chọn2-tuple of array_like, optional

Giới hạn dưới và trên trên các tham số. Mặc định không có giới hạn. Mỗi phần tử của tuple phải là một mảng có độ dài bằng số lượng tham số hoặc vô hướng (trong trường hợp giới hạn được coi là giống nhau cho tất cả các tham số). Sử dụng

>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
3 với một dấu hiệu thích hợp để vô hiệu hóa giới hạn trên tất cả hoặc một số tham số.

Mới trong phiên bản 0.17.

Phương pháp {‘LM,‘ TRF, ‘Dogbox,}, tùy chọn{‘lm’, ‘trf’, ‘dogbox’}, optional

Phương pháp sử dụng để tối ưu hóa. Xem

>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
4 để biết thêm chi tiết. Mặc định là ‘LM, đối với các vấn đề không bị ràng buộc và‘ TRF, nếu giới hạn được cung cấp. Phương pháp ‘LM, đã giành được công việc khi số lượng quan sát nhỏ hơn số lượng biến, sử dụng‘ TRF, hoặc ‘Dogbox, trong trường hợp này.

Mới trong phiên bản 0.17.

Phương pháp {‘LM,‘ TRF, ‘Dogbox,}, tùy chọncallable, string or None, optional

Phương pháp sử dụng để tối ưu hóa. Xem

>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
4 để biết thêm chi tiết. Mặc định là ‘LM, đối với các vấn đề không bị ràng buộc và‘ TRF, nếu giới hạn được cung cấp. Phương pháp ‘LM, đã giành được công việc khi số lượng quan sát nhỏ hơn số lượng biến, sử dụng‘ TRF, hoặc ‘Dogbox, trong trường hợp này.

jacballable, chuỗi hoặc không, tùy chọn

Chức năng với chữ ký
>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
5 tính toán ma trận Jacobian của hàm mô hình liên quan đến các tham số như một cấu trúc mảng dense_like. Nó sẽ được thu nhỏ theo Sigma được cung cấp. Nếu không có (mặc định), Jacobian sẽ được ước tính bằng số. Các từ khóa chuỗi cho các phương thức ‘TRF và‘ Dogbox, có thể được sử dụng để chọn sơ đồ khác biệt hữu hạn, xem
>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
4.
boolean, optional

Mới trong phiên bản 0.18.

full_outputboolean, tùy chọn

**kwargs

Nếu đúng, chức năng này trả về thông tin additioal: Infodict, Mesg và IER.

ReturnSpopTarraypoptarray

Các giá trị tối ưu cho các tham số để tổng số dư bình phương của

>>> def func(x, a, b, c):
...     return a * np.exp(-b * x) + c
0 được giảm thiểu.

Mảng PCOV2-D2-D array

Hiệp phương sai ước tính của popt. Các đường chéo cung cấp phương sai của ước tính tham số. Để tính toán một lỗi độ lệch chuẩn trên các tham số sử dụng

>>> def func(x, a, b, c):
...     return a * np.exp(-b * x) + c
1.

Làm thế nào tham số Sigma ảnh hưởng đến hiệp phương sai ước tính phụ thuộc vào đối số tuyệt đối_sigma, như được mô tả ở trên.

Nếu ma trận Jacobian tại giải pháp không có thứ hạng đầy đủ, thì phương thức LM LM trả về một ma trận chứa đầy

>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
3, mặt khác, các phương pháp Trf, và ‘Dogbox, sử dụng moore-Penrose pseudoinverse để tính toán ma trận hiệp phương sai.

InfodictDict (chỉ trả về nếu full_output là đúng)dict (returned only if full_output is True)

Một từ điển của các đầu ra tùy chọn với các khóa:

>>> def func(x, a, b, c):
...     return a * np.exp(-b * x) + c
3

Số lượng các cuộc gọi chức năng. Các phương pháp ‘TRF, và‘ Dogbox, không đếm các chức năng gọi cho xấp xỉ bằng số Jacobian, trái ngược với phương thức ‘LM.

>>> def func(x, a, b, c):
...     return a * np.exp(-b * x) + c
4

Các giá trị hàm được đánh giá tại giải pháp.

>>> def func(x, a, b, c):
...     return a * np.exp(-b * x) + c
5

Một hoán vị của ma trận R của hệ số QR của ma trận Jacobian gần đúng cuối cùng, cột được lưu trữ khôn ngoan. Cùng với IPVT, hiệp phương sai của ước tính có thể được xấp xỉ. Phương pháp ‘LM chỉ cung cấp thông tin này.

>>> def func(x, a, b, c):
...     return a * np.exp(-b * x) + c
6

Một mảng nguyên có chiều dài n xác định ma trận hoán vị, p, sao cho fjac*p = q*r, trong đó r là hình tam giác trên với các phần tử chéo có cường độ không tăng. Cột J của P là cột IPVT (J) của ma trận nhận dạng. Phương pháp ‘LM chỉ cung cấp thông tin này.

>>> def func(x, a, b, c):
...     return a * np.exp(-b * x) + c
7

Vectơ (chuyển vị (q) * fvec). Phương pháp ‘LM chỉ cung cấp thông tin này.

Mới trong phiên bản 1.9.

mesgstr (chỉ trả về nếu full_output là đúng)str (returned only if full_output is True)

Một thông báo chuỗi cung cấp thông tin về giải pháp.

Mới trong phiên bản 1.9.

mesgstr (chỉ trả về nếu full_output là đúng)int (returnned only if full_output is True)

Một thông báo chuỗi cung cấp thông tin về giải pháp.

Mới trong phiên bản 1.9.

mesgstr (chỉ trả về nếu full_output là đúng)

Một thông báo chuỗi cung cấp thông tin về giải pháp.

ierint (chỉ được trả lại nếu full_output là đúng)

Một lá cờ số nguyên. Nếu nó bằng 1, 2, 3 hoặc 4, giải pháp đã được tìm thấy. Nếu không, giải pháp đã không được tìm thấy. Trong cả hai trường hợp, biến đầu ra tùy chọn MESG cung cấp thêm thông tin.

RAISEVALUEERROR

Nếu YDATA hoặc XDATA chứa Nans hoặc nếu các tùy chọn không tương thích được sử dụng.

Lỗi runtime

Nếu tối thiểu hóa bình phương nhỏ nhất thất bại.

Tối ưu hóa

Nếu hiệp phương sai của các tham số không thể ước tính được.

Ghi chú

>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit

>>> def func(x, a, b, c):
...     return a * np.exp(-b * x) + c

Người dùng nên đảm bảo rằng đầu vào XDATA, YDATA và đầu ra của F là

>>> def func(x, a, b, c):
...     return a * np.exp(-b * x) + c
8, hoặc nếu không thì tối ưu hóa có thể trả về kết quả không chính xác.

>>> xdata = np.linspace(0, 4, 50)
>>> y = func(xdata, 2.5, 1.3, 0.5)
>>> rng = np.random.default_rng()
>>> y_noise = 0.2 * rng.normal(size=xdata.size)
>>> ydata = y + y_noise
>>> plt.plot(xdata, ydata, 'b-', label='data')

Với

>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
8, thuật toán sử dụng thuật toán Levenberg-Marquest thông qua
>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
7. Lưu ý rằng thuật toán này chỉ có thể giải quyết các vấn đề không bị ràng buộc.

>>> popt, pcov = curve_fit(func, xdata, ydata)
>>> popt
array([2.56274217, 1.37268521, 0.47427475])
>>> plt.plot(xdata, func(xdata, *popt), 'r-',
...          label='fit: a=%5.3f, b=%5.3f, c=%5.3f' % tuple(popt))

Các ràng buộc hộp có thể được xử lý bằng các phương pháp ‘TRF, và‘ Dogbox. Tham khảo tài liệu của

>>> import matplotlib.pyplot as plt
>>> from scipy.optimize import curve_fit
4 để biết thêm thông tin.

>>> popt, pcov = curve_fit(func, xdata, ydata, bounds=(0, [3., 1., 0.5]))
>>> popt
array([2.43736712, 1.        , 0.34463856])
>>> plt.plot(xdata, func(xdata, *popt), 'g--',
...          label='fit: a=%5.3f, b=%5.3f, c=%5.3f' % tuple(popt))

>>> plt.xlabel('x')
>>> plt.ylabel('y')
>>> plt.legend()
>>> plt.show()

Hướng dẫn goodness of fit python curve_fit - sự tốt lành của vừa vặn với python curve_fit

Curve_fit trong Python là gì?

Phù hợp với đường cong là một loại tối ưu hóa tìm thấy một tập hợp các tham số tối ưu cho một hàm được xác định phù hợp nhất với một tập hợp các quan sát nhất định. Không giống như học tập có giám sát, đường cong phù hợp đòi hỏi bạn phải xác định chức năng ánh xạ các ví dụ về đầu vào cho đầu ra.a type of optimization that finds an optimal set of parameters for a defined function that best fits a given set of observations. Unlike supervised learning, curve fitting requires that you define the function that maps examples of inputs to outputs.

P0 trong curve_fit là gì?

Tham số 'P0' là dự đoán ban đầu độ dài n cho các tham số.Nó là một tham số tùy chọn và do đó, nếu nó không được cung cấp, thì giá trị ban đầu sẽ là 1. hàm curve_fit () sẽ trả về hai giá trị;Popt và PCOV.an N length initial guess for the parameters. It is an optional parameter, and hence, if it is not provided, then the initial value will be 1. The curve_fit() function will return the two values; popt and pcov.

POPT và PCOV có nghĩa là gì?

POPT và PCOV có nghĩa là gì?POPT- Một mảng các giá trị tối ưu cho các tham số giảm thiểu tổng bình phương của phần dư.pcov-2D mảng chứa hiệp phương sai ước tính của POPT.Các đường chéo cung cấp phương sai của ước tính tham số.popt- An array of optimal values for the parameters which minimizes the sum of squares of residuals. pcov-2d array which contains the estimated covariance of popt. The diagonals provide the variance of the parameter estimate.

Làm thế nào để bạn phù hợp với một chức năng dữ liệu trong Python?

Các bước cơ bản để phù hợp với dữ liệu là:..
Nhập hàm Curve_Fit từ Scipy ..
Tạo một danh sách hoặc mảng numpy của biến độc lập của bạn (giá trị x của bạn).....
Tạo một danh sách các mảng numpy của các biến expedent của bạn (giá trị y của bạn).....
Tạo một hàm cho phương trình bạn muốn phù hợp ..