Hướng dẫn multiple linear regression residual plot python - hồi quy tuyến tính nhiều phần còn lại python


A & NBSP; Biểu đồ dư & NBSP; là một loại lô hiển thị các giá trị được trang bị so với các giá trị còn lại cho mô hình hồi quy.residual plot is a type of plot that displays the fitted values against the residual values for a regression model.

Kiểu cốt truyện này thường được sử dụng để đánh giá xem mô hình hồi quy tuyến tính có phù hợp cho một bộ dữ liệu nhất định hay không và để kiểm tra tính không đồng nhất của phần dư.

Hướng dẫn này giải thích cách tạo ra một biểu đồ dư cho mô hình hồi quy tuyến tính trong Python.

Ví dụ: Biểu đồ còn lại trong Python

Đối với ví dụ này, chúng tôi sẽ sử dụng một bộ dữ liệu mô tả các thuộc tính của 10 cầu thủ bóng rổ:

import numpy as np
import pandas as pd

#create dataset
df = pd.DataFrame({'rating': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view dataset
df

	rating	points	assists	rebounds
0	90	25	5	11
1	85	20	7	8
2	82	14	7	10
3	88	16	8	6
4	94	27	5	6
5	90	20	7	9
6	76	12	6	6
7	75	15	9	10
8	87	14	9	10
9	86	19	5	7

Biểu đồ còn lại cho hồi quy tuyến tính đơn giản

Giả sử chúng ta phù hợp với mô hình hồi quy tuyến tính đơn giản bằng cách sử dụng & nbsp; điểm & nbsp; làm biến dự đoán và & nbsp; xếp hạng & nbsp; là biến phản hồi:

#import necessary libraries 
import matplotlib.pyplot as plt
import statsmodels.api as sm
from statsmodels.formula.api import ols

#fit simple linear regression model
model = ols('rating ~ points', data=df).fit()

#view model summary
print(model.summary())

Chúng ta có thể tạo một biểu đồ còn lại so với được trang bị bằng cách sử dụng chức năng Plot_regry_Exog () từ thư viện StatSmodels:

#define figure size
fig = plt.figure(figsize=(12,8))

#produce regression plots
fig = sm.graphics.plot_regress_exog(model, 'points', fig=fig)

Hướng dẫn multiple linear regression residual plot python - hồi quy tuyến tính nhiều phần còn lại python

Bốn lô được sản xuất. Một ở góc trên cùng bên phải là cốt truyện còn lại so với được trang bị. Trục X trên biểu đồ này hiển thị các giá trị thực cho các điểm biến dự đoán và trục y hiển thị phần dư cho giá trị đó.

Vì phần dư dường như được phân tán ngẫu nhiên xung quanh 0, đây là một dấu hiệu cho thấy tính không đồng nhất không phải là vấn đề với biến dự đoán.

Sơ đồ dư cho hồi quy tuyến tính nhiều

Thay vào đó, chúng tôi phù hợp với mô hình hồi quy tuyến tính nhiều người sử dụng & nbsp; hỗ trợ & nbsp; và & nbsp; rebound & nbsp; là biến dự đoán và & nbsp; xếp hạng & nbsp; là biến phản hồi:

#fit multiple linear regression model
model = ols('rating ~ assists + rebounds', data=df).fit()

#view model summary
print(model.summary())

Một lần nữa, chúng ta có thể tạo một biểu đồ dự đoán còn lại so với dự đoán cho từng yếu tố dự đoán riêng lẻ bằng cách sử dụng hàm Plot_regric_Exog () từ thư viện StatSmodels.

Ví dụ, ở đây, những gì mà cốt truyện còn lại so với dự đoán trông giống như biến dự đoán & nbsp; hỗ trợ: hỗ trợ: hỗ trợ: hỗ trợ: hỗ trợ:

#create residual vs. predictor plot for 'assists'
fig = plt.figure(figsize=(12,8))
fig = sm.graphics.plot_regress_exog(model, 'assists', fig=fig)

Hướng dẫn multiple linear regression residual plot python - hồi quy tuyến tính nhiều phần còn lại python

Và ở đây, những gì mà cốt truyện còn lại so với dự đoán trông giống như biến dự đoán & nbsp; rebound:

#create residual vs. predictor plot for 'assists'
fig = plt.figure(figsize=(12,8))
fig = sm.graphics.plot_regress_exog(model, 'rebounds', fig=fig)

Hướng dẫn multiple linear regression residual plot python - hồi quy tuyến tính nhiều phần còn lại python

Trong cả hai ô, phần dư dường như được phân tán ngẫu nhiên xung quanh 0, đó là một dấu hiệu cho thấy tính không đồng nhất không phải là vấn đề với biến dự đoán trong mô hình.

Làm thế nào để bạn vẽ phần dư trong hồi quy tuyến tính trong Python?

Hãy xem làm thế nào để tạo ra một cốt truyện còn lại trong Python ...
X: Tên cột của biến độc lập (dự đoán) hoặc một vectơ ..
Y: Tên cột của biến phụ thuộc (phản hồi) hoặc một vectơ ..
Dữ liệu: Tham số tùy chọn. khung dữ liệu..
Lowess: Theo mặc định, nó sai ..

Chúng ta có thể vẽ nhiều hồi quy tuyến tính trong Python không?

Vẽ kết quả Sử dụng XLabel để gắn nhãn trục X và sử dụng YLabel để gắn nhãn trục y.Cốt truyện hồi quy của mô hình của chúng tôi.Một âm mưu hồi quy rất hữu ích để hiểu mối quan hệ tuyến tính giữa hai tham số.Nó tạo ra một dòng hồi quy ở giữa các tham số đó và sau đó vẽ một biểu đồ phân tán của các điểm dữ liệu đó.Use xlabel to label the x-axis and use ylabel to label the y-axis. Regression plot of our model. A regression plot is useful to understand the linear relationship between two parameters. It creates a regression line in-between those parameters and then plots a scatter plot of those data points.

Làm thế nào để bạn tìm thấy cốt truyện còn lại trong Python?

ResidPlot (): Phương pháp này được sử dụng để vẽ phần dư của hồi quy tuyến tính.Phương pháp này sẽ hồi quy y trên X và sau đó vẽ một biểu đồ phân tán của phần dư.Bạn có thể tùy chọn phù hợp với mức thấp hơn với sơ đồ dư, có thể giúp xác định xem có cấu trúc cho phần dư hay không. : This method is used to plot the residuals of linear regression. This method will regress y on x and then draw a scatter plot of the residuals. You can optionally fit a lowess smoother to the residual plot, which can help in determining if there is a structure to the residuals.

Làm thế nào để bạn tìm thấy phần còn lại trong hồi quy bội?

Phần dư cho mỗi quan sát là sự khác biệt giữa các giá trị dự đoán của y (biến phụ thuộc) và các giá trị quan sát của y.Dư = giá trị y thực tế - giá trị y dự đoán, ri = yi−^yi.Residual=actual y value−predicted y value,ri=yi−^yi.