Hồi quy hàm mũ python

Hệ số xác định, hay $R^2$, là thước đo cung cấp thông tin về mức độ phù hợp của một mô hình. Trong bối cảnh hồi quy, nó là thước đo thống kê về mức độ đường hồi quy gần đúng với dữ liệu thực tế. Do đó, điều quan trọng là khi một mô hình thống kê được sử dụng để dự đoán kết quả trong tương lai hoặc trong việc kiểm tra các giả thuyết. Có một số biến thể (xem bình luận bên dưới);

\begin{align} R^2&=1-\frac{\text{hồi quy tổng bình phương (SSR)}}{\text{tổng bình phương (SST)}},\\ &=1-\frac{\sum . \end{align} Hồi quy tổng bình phương là tổng bình phương của phần dư và tổng bình phương là tổng khoảng cách mà dữ liệu cách xa giá trị trung bình của tất cả bình phương. Vì là tỷ lệ phần trăm nên nó sẽ nhận các giá trị từ $0$ đến $1$

Diễn giải giá trị $R^2$

Dưới đây là một số ví dụ về diễn giải giá trị $R^2$

$R^2=1$

Tất cả các biến thể trong các giá trị $y$ được tính bởi các giá trị $x$

Hồi quy hàm mũ python

$R^2=0. 83$

$83$% biến thể trong các giá trị $y$ được tính bởi các giá trị $x$

Hồi quy hàm mũ python

$R^2=0$

Không có biến thể nào trong các giá trị $y$ được tính bởi các giá trị $x$

Hồi quy hàm mũ python

Ví dụ đã làm việc

Ví dụ đã làm việc

Dưới đây là biểu đồ cho thấy số lượng bài giảng mỗi ngày ảnh hưởng đến số giờ ở trường đại học mỗi ngày. Phương trình của được vẽ trên đồ thị và nó có phương trình $\hat{y}=0. 143+1. 229x$. Tính $R^2$

Hồi quy hàm mũ python

văn bản trên cùng. 400px

Giải pháp

Để tính $R^2$, bạn cần tìm tổng bình phương của số dư và tổng bình phương

Bắt đầu bằng cách tìm phần dư, là khoảng cách từ mỗi điểm dữ liệu. Tìm ra giá trị $y$ được dự đoán bằng cách thay giá trị $x$ tương ứng vào phương trình đường hồi quy

\begin{align} \hat{y}&=0. 143+1. 229x\\ &=0. 143+(1. 229\times2)\\ &=0. 143+2. 458\\ &=2. 601 \end{align}

Giá trị thực của $y$ là $2$. \begin{align} \text{Residual}&=\text{actual } y \text{ value} - \text{predicted }y \text{ value}\\ r_1&=y_i-\hat{y_i}\\ &= . 601\\ &=-0. 601 \end{align} Như bạn có thể thấy từ biểu đồ, điểm thực tế nằm bên dưới đường hồi quy, do đó, có nghĩa là phần dư âm

\begin{align} \hat{y}&=0. 143+1. 229x\\ &=0. 143+(1. 229\times3)\\ &=0. 143+3. 687\\ &=3. 83 \end{align}

Giá trị thực của $y$ là $4$

\begin{align} \text{Residual}&=\text{actual } y \text{ value} - \text{predicted }y \text{ value}\\ r_2&=y_i-\hat{y_i}\\ &= . 3. 83\\ &=0. 17 \end{align} Như bạn có thể thấy từ biểu đồ, điểm thực tế nằm trên đường hồi quy, do đó, có nghĩa là phần dư dương

\begin{align} \hat{y}&=0. 143+1. 229x\\ &=0. 143+(1. 229\times4)\\ &=0. 143+4. 916\\ &=5. 059 \end{align}

Giá trị thực của $y$ là $6$

\begin{align} \text{Residual}&=\text{actual } y \text{ value} - \text{predicted }y \text{ value}\\ r_3&=y_i-\hat{y_i}\\ &= . 059\\ &=0. 941 \end{align}

\begin{align} \hat{y}&=0. 143+1. 229x\\ &=0. 143+(1. 229\times6)\\ &=0. 143+7. 374\\ &=7. 517 \end{align}

Giá trị thực của $y$ là $7$. \begin{align} \text{Residual}&=\text{actual } y \text{ value} - \text{predicted }y \text{ value}\\ r_4&=y_i-\hat{y_i}\\ &= . 517\\ &=-0. 517 \end{align} Để tìm số dư đã bình phương, chúng ta cần bình phương từng $r_1$ thành $r_4$ và tính tổng chúng

\begin{align} \sum({y_i}-\hat{y_i})^2&=\sum{r_i}\\ &={r_1}^2+{r_2}^2+{r_3}^2+{r_4 . 601)^2+(0. 17)^2+(0. 941)^2-(-0. 517)^2\\ &=1. 542871 \end{align}

Để tìm $\sum(y_i-\bar{y})^2$ trước tiên bạn cần tìm các giá trị $y$

\begin{align} \bar{y}&=\frac{\sum{y} }{n}\\ &=\frac{2+4+6+7}{4}\\ &=\frac{19 . 75 \end{align}

Bây giờ chúng ta có thể tính $\sum(y_i-\bar{y})^2$

\begin{align} \sum(y_i-\bar{y})^2&=(2-4. 75)^2+(4-4. 75)^2+(6-4. 75)^2+(7-4. 75)^2\\ &=(-2. 75)^2+(-0. 75)^2+(1. 25)^2+(2. 25)^2\\ &=14. 75 \end{align}

Vì thế;

\begin{align} R^2&=1-\frac{\text{hồi quy tổng bình phương (SSR)} }{\text{tổng bình phương (SST)} }\\ &=1-\frac{\sum( . 542871}{14. 75}\\ &=1-0. 105\ \text{(3. s. f)}\\ &=0. 895\văn bản{ (3. s. f)} \end{align}

Điều này có nghĩa là số bài giảng mỗi ngày chiếm $89. 5$% của sự thay đổi trong số giờ mọi người dành cho trường đại học mỗi ngày

Một thuộc tính kỳ lạ của $R^2$ là nó tăng theo số biến. Do đó, trong ví dụ trên, nếu chúng ta thêm một biến khác đo lường chiều cao trung bình của giảng viên, thì $R^2$ sẽ không thấp hơn và rất có thể cao hơn - mặc dù đây không phải là một cải tiến trong mô hình. Để giải thích cho điều này, một phiên bản điều chỉnh của hệ số xác định đôi khi được sử dụng. Để biết thêm thông tin, vui lòng xem [http. //www. giáo viên thống kê. AC. uk/resources/uploaded/correlation. pdf

Video ví dụ

ví dụ 1

Đây là video do Alissa Grant-Walker trình bày về cách tính hệ số xác định