Cải thiện bài viết
Lưu bài viết
Trong bài viết này, chúng ta sẽ xem làm thế nào để thực hiện một bài kiểm tra phù hợp chi bình phương trong Python
Độ tốt của bình phương của bài kiểm tra FIT là một bài kiểm tra giả thuyết thống kê không tham số mà Lôi sử dụng để xác định giá trị quan sát của một sự kiện khác với giá trị dự kiến như thế nào. Nó giúp chúng tôi kiểm tra xem một biến có đến từ một phân phối nhất định hay nếu một mẫu đại diện cho dân số. Phân phối xác suất quan sát được so sánh với phân phối xác suất dự kiến. & NBSP;Chi-Square Goodness of fit test is a non-parametric statistical hypothesis test that’s used to determine how considerably the observed value of an event differs from the expected value. it helps us check whether a variable comes from a certain distribution or if a sample represents a population. The observed probability distribution is compared with the expected probability distribution.
Giả thuyết null: & nbsp; Một biến có phân phối được xác định trước. A variable has a predetermined distribution.
Các giả thuyết thay thế: Một biến lệch khỏi phân phối dự kiến. A variable deviates from the expected distribution.
Ví dụ 1: Sử dụng hàm stats.chisquare []
Trong cách tiếp cận này, chúng tôi sử dụng phương thức statS.chisquare [] từ mô-đun scipy.stats giúp chúng tôi xác định mức độ tốt của chi bình phương của thống kê phù hợp và giá trị p. & NBSP;
Cú pháp: StatS.Chisquare [F_OBS, F_EXP]stats.chisquare[f_obs, f_exp]
parameters:
- F_OBS: Tham số này chứa một mảng các giá trị quan sát được.this parameter contains an array of observed values.
- F_EXP: Tham số này chứa một mảng các giá trị dự kiến.this parameter contains an array of expected values.
Trong ví dụ dưới đây, chúng tôi cũng sử dụng phương thức StatS.ppf [] lấy mức độ ý nghĩa và mức độ tự do của các tham số làm đầu vào và cho chúng tôi giá trị của giá trị quan trọng chi bình phương. Nếu chi_square_ value> Giá trị tới hạn, giả thuyết null bị từ chối. Nếu chi_square_ giá trị
Python3
import
scipy.stats as stats
import
numpy as np
observed_data
=
Các
import
0=
import
2
import
3import
4
import
5import
6import
7 import
8
import
9numpy as np
0numpy as np
1
import
5import
6numpy as np
4 import
8 numpy as np
0numpy as np
7
import
5numpy as np
9observed_data
0observed_data
1observed_data
2observed_data
3=
chi square value determined by formula : 5.0127344877344875 12.5915872437439771
observed_data
6Output:
chi_square_test_statistic is : 5.0127344877344875 p_value : 0.542180861413329 12.591587243743977
Ví dụ 2: Xác định thống kê kiểm tra chi bình phương bằng cách thực hiện công thức
Trong phương pháp này, chúng tôi trực tiếp thực hiện công thức. Chúng ta có thể thấy rằng chúng ta nhận được các giá trị tương tự của chi_square. & nbsp;
Python3
import
scipy.stats as stats
import
numpy as np
observed_data
=
Các
import
0=
import
2
import
5import
6import
7 import
8
import
5import
6numpy as np
4 import
8 numpy as np
0numpy as np
7
Ví dụ 2: Xác định thống kê kiểm tra chi bình phương bằng cách thực hiện công thức
Trong phương pháp này, chúng tôi trực tiếp thực hiện công thức. Chúng ta có thể thấy rằng chúng ta nhận được các giá trị tương tự của chi_square. & nbsp;
import
9numpy as np
0
chi square value determined by formula : 5.0127344877344875 12.59158724374397733
import
5numpy as np
9observed_data
0observed_data
1observed_data
2observed_data
3=
chi square value determined by formula : 5.0127344877344875 12.5915872437439771
observed_data
6Output:
chi square value determined by formula : 5.0127344877344875 12.591587243743977