Hướng dẫn linear regression in python statsmodels - hồi quy tuyến tính trong mô hình thống kê python
Các mô hình tuyến tính với các lỗi phân phối độc lập và giống hệt nhau và cho các lỗi với tính không đồng nhất hoặc tự tương quan. Mô -đun này cho phép ước tính bằng bình phương tối thiểu (OLS), bình phương tối thiểu có trọng số (WLS), bình phương tối thiểu tổng quát (GLS) và bình phương nhỏ nhất khả thi với các lỗi AR (P) tự động tương quan. Xem tham chiếu mô -đun cho các lệnh và đối số. Các ví dụ chi tiết có thể được tìm thấy ở đây:
Tài liệu kỹ thuật¶Mô hình thống kê được giả định là
Tùy thuộc vào các thuộc tính của \ (\ sigma \), chúng tôi hiện có bốn lớp có sẵn:\(\Sigma\), we have currently four classes available:
Tất cả các mô hình hồi quy xác định các phương pháp tương tự và tuân theo cùng một cấu trúc, và có thể được sử dụng theo cách tương tự. Một số trong số chúng chứa các phương thức và thuộc tính cụ thể mô hình bổ sung. GLS là siêu lớp của các lớp hồi quy khác ngoại trừ các đệ quy, rollingwls và rollingols. Người giới thiệu¶Tài liệu tham khảo chung cho các mô hình hồi quy:
Tài liệu tham khảo kinh tế lượng cho các mô hình hồi quy:
Thuộc tính¶Sau đây là mô tả dài dòng hơn về các thuộc tính chủ yếu là phổ biến cho tất cả các lớp hồi quy pinv_wexogarrayarrayP x N Moore-Penrose Pseudoinverse của ma trận thiết kế trắng. Nó xấp xỉ bằng \ (\ left (x^{t} \ sigma^{-1} x \ right)^{-1} x^{t} \ psi \), trong đó \ (\ psi \) sao cho \ (\ psi \ psi^{t} = \ sigma^{-1} \).\(\left(X^{T}\Sigma^{-1}X\right)^{-1}X^{T}\Psi\), where \(\Psi\) is defined such that \(\Psi\Psi^{T}=\Sigma^{-1}\). CholsimgainvarrayarrayMa trận hình tam giác n x n trên \ (\ psi^{t} \) thỏa mãn \ (\ psi \ psi^{t} = \ sigma^{-1} \).\(\Psi^{T}\) that satisfies \(\Psi\Psi^{T}=\Sigma^{-1}\). df_modelfloatfloatMức độ tự do mô hình. Điều này bằng P - 1, trong đó p là số lượng hồi quy. Lưu ý rằng việc chặn không được tính là sử dụng một mức độ tự do ở đây. df_residfloatfloatMức độ tự do còn lại. Đây là N - P bằng nhau trong đó n là số lượng quan sát và P là số lượng tham số. Lưu ý rằng việc chặn được tính là sử dụng một mức độ tự do ở đây. llffloatfloatGiá trị của hàm khả năng của mô hình được trang bị. NobsfloatfloatSố lượng quan sát n normalized_cov_paramsarrayarrayMột mảng p x p bằng \ ((x^{t} \ sigma^{-1} x)^{-1} \).\((X^{T}\Sigma^{-1}X)^{-1}\). SigmaarrayarrayMa trận hiệp phương sai n x\(\mu\sim N\left(0,\Sigma\right)\). WexogarrayarrayMa trận thiết kế trắng \ (\ psi^{t} x \).\(\Psi^{T}X\). WendogarrayarrayBiến phản ứng trắng \ (\ psi^{t} y \).\(\Psi^{T}Y\). Tham chiếu mô -đunCác lớp học mô hình
Các lớp kết quả LớpPhù hợp với mô hình hồi quy tuyến tính trả về một lớp kết quả. OLS có một lớp kết quả cụ thể với một số phương pháp bổ sung so với lớp kết quả của các mô hình tuyến tính khác.
Sự khác biệt giữa StatSmodels và Sklearn Repression tuyến tính là gì?Một sự khác biệt chính giữa hai thư viện là cách chúng xử lý các hằng số. Scikit-LEARN cho phép người dùng chỉ định xem có nên thêm hằng số thông qua tham số hay không, trong khi lớp OLS của StatSmodels có chức năng thêm hằng số vào một mảng nhất định.Scikit-learn allows the user to specify whether or not to add a constant through a parameter, while statsmodels' OLS class has a function that adds a constant to a given array.
Làm thế nào để bạn thực hiện hồi quy tuyến tính trong Python?Hồi quy tuyến tính với scikit-learn.. Bước 1 và 2: Nhập các gói và lớp và cung cấp dữ liệu.Đầu tiên, bạn nhập Numpy và Sklearn.linear_model.linearregression và cung cấp các đầu vào và đầu ra đã biết: .... Bước 3: Tạo một mô hình và phù hợp với nó..... Bước 4: Nhận kết quả..... Bước 5: Dự đoán phản hồi .. Làm thế nào để bạn sử dụng StatSmodels trong Python?Phù hợp với một mô hình trong StatSmodels thường liên quan đến 3 bước dễ dàng: Sử dụng lớp mô hình để mô tả mô hình.Lắp mô hình bằng phương pháp lớp.Kiểm tra kết quả bằng phương pháp tóm tắt.Use the model class to describe the model. Fit the model using a class method. Inspect the results using a summary method.
Python Statsmodels có tốt không?Khi bạn cần một loạt các mô hình hồi quy tuyến tính, các mô hình tuyến tính hỗn hợp, hồi quy với các biến phụ thuộc riêng biệt và nhiều hơn - StatSmodels có các tùy chọn.Nó cũng có một cú pháp gần gũi hơn với R vì vậy, đối với những người đang chuyển sang Python, StatSmodels là một lựa chọn tốt.StatsModels is a good choice. |