Hướng dẫn goodness of fit test for normal distribution python - mức độ phù hợp của bài kiểm tra đối với python phân phối bình thường

Cải thiện bài viết

Lưu bài viết

Trong bài viết này, chúng ta sẽ xem làm thế nào để thực hiện một bài kiểm tra phù hợp chi bình phương trong Python

Độ tốt của bình phương của bài kiểm tra FIT là một bài kiểm tra giả thuyết thống kê không tham số mà Lôi sử dụng để xác định giá trị quan sát của một sự kiện khác với giá trị dự kiến ​​như thế nào. Nó giúp chúng tôi kiểm tra xem một biến có đến từ một phân phối nhất định hay nếu một mẫu đại diện cho dân số. Phân phối xác suất quan sát được so sánh với phân phối xác suất dự kiến. & NBSP;Chi-Square Goodness of fit test is a non-parametric statistical hypothesis test that’s used to determine how considerably the observed value of an event differs from the expected value. it helps us check whether a variable comes from a certain distribution or if a sample represents a population. The observed probability distribution is compared with the expected probability distribution. 

Giả thuyết null: & nbsp; Một biến có phân phối được xác định trước. A variable has a predetermined distribution.

Các giả thuyết thay thế: Một biến lệch khỏi phân phối dự kiến. A variable deviates from the expected distribution.

Ví dụ 1: Sử dụng hàm stats.chisquare []

Trong cách tiếp cận này, chúng tôi sử dụng phương thức statS.chisquare [] từ mô-đun scipy.stats giúp chúng tôi xác định mức độ tốt của chi bình phương của thống kê phù hợp và giá trị p. & NBSP;

Cú pháp: StatS.Chisquare [F_OBS, F_EXP]stats.chisquare[f_obs, f_exp]

parameters:

  • F_OBS: Tham số này chứa một mảng các giá trị quan sát được.this parameter contains an array of observed values.
  • F_EXP: Tham số này chứa một mảng các giá trị dự kiến.this parameter contains an array of expected values.

Trong ví dụ dưới đây, chúng tôi cũng sử dụng phương thức StatS.ppf [] lấy mức độ ý nghĩa và mức độ tự do của các tham số làm đầu vào và cho chúng tôi giá trị của giá trị quan trọng chi bình phương. Nếu chi_square_ value> Giá trị tới hạn, giả thuyết null bị từ chối. Nếu chi_square_ giá trị

Python3

import scipy.stats as stats

import numpy as np

observed_data =

Các

import0= import2

import3import4

import5import6import7 import8

import9numpy as np0numpy as np1

import5import6numpy as np4 import8 numpy as np0numpy as np7

import5numpy as np9observed_data 0observed_data 1observed_data 2observed_data 3=

chi square value determined by formula : 5.0127344877344875
12.591587243743977
1observed_data 6

Output:

chi_square_test_statistic is : 5.0127344877344875
p_value : 0.542180861413329
12.591587243743977

Ví dụ 2: Xác định thống kê kiểm tra chi bình phương bằng cách thực hiện công thức

Trong phương pháp này, chúng tôi trực tiếp thực hiện công thức. Chúng ta có thể thấy rằng chúng ta nhận được các giá trị tương tự của chi_square. & nbsp;

Python3

import scipy.stats as stats

import numpy as np

observed_data =

Các

import0= import2

import5import6import7 import8

import5import6numpy as np4 import8 numpy as np0numpy as np7

Ví dụ 2: Xác định thống kê kiểm tra chi bình phương bằng cách thực hiện công thức

Trong phương pháp này, chúng tôi trực tiếp thực hiện công thức. Chúng ta có thể thấy rằng chúng ta nhận được các giá trị tương tự của chi_square. & nbsp;

import9numpy as np0

chi square value determined by formula : 5.0127344877344875
12.591587243743977
33

import5numpy as np9observed_data 0observed_data 1observed_data 2observed_data 3=

chi square value determined by formula : 5.0127344877344875
12.591587243743977
1observed_data 6

Output:

chi square value determined by formula : 5.0127344877344875
12.591587243743977

Bài kiểm tra nào được sử dụng để kiểm tra mức độ phù hợp của phân phối?

Độ tốt của bình phương của bài kiểm tra FIT là một bài kiểm tra giả thuyết thống kê được sử dụng để xác định xem một biến có khả năng đến từ một phân phối được chỉ định hay không.Nó thường được sử dụng để đánh giá liệu dữ liệu mẫu có đại diện cho toàn bộ dân số hay không.Chi-square goodness of fit test is a statistical hypothesis test used to determine whether a variable is likely to come from a specified distribution or not. It is often used to evaluate whether sample data is representative of the full population.

Chúng ta có thể sử dụng chi không

Khả năng chi trả của bài kiểm tra Chi-vuông là nó cho phép chúng tôi đánh giá dữ liệu mà chúng tôi biết rằng nó không được phân phối bình thường.it is not normally distributed.

Công thức cho sự tốt đẹp của sự phù hợp là gì?

= [r - 1] [c - 1].Độ tốt của bình phương của bài kiểm tra phù hợp cũng có thể được áp dụng cho các phân phối liên tục.Trong trường hợp này, dữ liệu được quan sát được nhóm thành các thùng riêng biệt để có thể tính toán thống kê chi bình phương.. The chi-square goodness of fit test may also be applied to continuous distributions. In this case, the observed data are grouped into discrete bins so that the chi-square statistic may be calculated.

Chủ Đề