Bác bỏ giả thuyết h0 khi pvalue như thế nào
Thí dụ: Trọng lượng của những con gà khi xuất chuồng là đại lượng ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 0,32. Trước đây trọng lượng trung bình khi xuất chuồng của một con gà ở trại chăn nuôi này là 3,4 kg. Năm nay người ta áp dụng thử một phương pháp chăn nuôi mới. Sau một thời gian áp dụng thử, người ta chọn ngẫu nhiên 50 con đem cân và tính được trung bình mẫu là 3,5 kg. Hãy cho biết phương pháp chăn nuôi mới có tác dụng làm tăng trọng lượng của gà khi xuất chuồng hay không ?
Giải:
\({H_0}:\mu = 3,4;{H_1}:\mu > 3,4\) Đây là bài toán kiểm định giả thiết về trung bình tổng thể (kiểm định giả thiết một phía), \({\sigma ^2}\) chưa biết. Từ các giả thiết của bài toán, ta tính được giá trị của tiêu chuẩn kiểm định : \(z = \frac{{\left( {\overline x - {m_0}} \right)\sqrt n }}{\sigma } = \frac{{(3,5 - 3,4)\sqrt {50} }}{{0,32}} = 2,21\) p-value của kiểm định (tức là xác suất mắc phải sai lầm loại 1 nếu ta bác bỏ giả thiết H0) chính là : P(Z > 2,21) Để tính xác suất này ta có thể dùng bảng hàm Laplace hoặc dùng hàm NORMSDIST trong Excel.
\(p - value = P\left( {Z > 2,21} \right) = 0,5 - {\rm{ }}\varphi (2,21) = 0,5 - 0,48645 = 0,01355\)
\(p-value = P(Z > 2,21) = 1- NORMSDIST(2,21) = 0,01355\) Ta có thể minh họa giá trị p-value trên đồ thị như sau: Như vậy, với mẫu đã cho ở thí dụ này, nếu ta bác bỏ giả thiết H0, tức cho rằng việc áp dụng phương pháp chăn nuôi mới có tác dụng làm tăng trọng lượng trung bình của gà khi xuất chuồng thì khả năng mắc phải sai lầm loại 1 là 0,01355 (hay 1,355%). Nếu trung bình mẫu là 3,6 , tức \(\overline X = 3,6\), khi đó ta tính được: \(z = \frac{{\left( {\overline x - {m_0}} \right)\sqrt n }}{\sigma } = \frac{{(3,6 - 3,4)\sqrt {50} }}{{0,32}} = 4,419\) Khi đó ta có: p-value = P(Z > 4,419) = 1-NORMSDIST(4.419) = 4.962E-06. 4.962E-06 = 4,962x 10-6 = 0,000004962 < 0,00001. Tức p-value ứng với z = 4,419 rất nhỏ (có thể coi bằng 0 nếu là lấy 5 số thập phân). Như vậy p-value càng nhỏ thì mức độ khẳng định của mẫu về việc bác bỏ giả thiết H0 càng rõ rệt hơn, nói cách khác, giả thiết H0 càng kém tin cậy hơn. Chẳng hạn p-value = 0,01 cho thấy mức độ khẳng định để bác bỏ giả thiết H0 càng rõ ràng hơn so với giá trị p-value = 0,1. Ở trên là p-value trong kiểm định một phía (phía bên phải). Nếu kiểm định già thiết về phía bên trái hoặc kiểm định giả thiết hai phía thì ta cũng tìm được giá trị p-value tương ứng. Công thức tính p-value cho kiểm định giả thiết về trung bình tổng thể như sau: Trường hợp đã biết \({\sigma ^2}\).
Trường hợp chưa biết \({\sigma ^2}\).
Trên đây là nội dung bài giảng Bài 3: Kiểm định giả thiết bằng p-value mà eLib.VN muốn chia sẻ đến các bạn sinh viên. Hy vọng đây sẽ là tư liệu hữu ích giúp các bạn nắm được nội dung bài học tốt hơn. Chúc các bạn học tốt. Bài viết cung cấp cho người đọc kiến thức về Module 8 môn Quantitative Methods của chương trình CFA level I[LOS 8.a] Định nghĩa giả thuyết và các cấu phần của chúng, bao gồm lỗi loại I và loại II, mức ý nghĩa, cách sử dụng mức ý nghĩa trong kiểm định giả thuyết và lực kiểm định1. Kiểm định giả thuyết (Hypothesis testing) Đánh giá thống kê về một tuyên bố hoặc ý tưởng liên quan đến tổng thể. Quy trình kiểm định giả thuyết sẽ bao gồm các bước sau:
2. Giả thuyết không và giả thuyết thay thế Null hypothesis: Là giả thuyết mà nhà nghiên cứu muốn bác bỏ. Ký hiệu: . có thể phát biểu dưới 3 dạng sau:
Alternative hypothesis: Là giả thuyết được kết luận nếu bị bác bỏ. Ký hiệu: . có thể được phát biểu dưới 3 dạng sau:
3. So sánh và đối chiếu giữa kiểm định một phía và kiểm định hai phía Cấu trúc kiểm định của One-tailed test: Cấu trúc kiểm định Two-tailed test: 4. Giải thích thống kê kiểm định, lỗi loại I và loại II, mức ý nghĩa, cách sử dụng mức ý nghĩa trong kiểm định giả thuyết và lực kiểm định 4.1. Thống kê kiểm định (Test statistic) Là một giá trị được tính toán dựa trên dữ liệu thống kê của mẫu, là cơ sở để quyết định cho việc có bác bỏ giả thuyết hay không. Công thức: 4.2. Kiểm tra lỗi (Testing errors) Quyết định Tình huống thực tế Ho đúng Ho sai Không bác bỏ được Ho Quyết định đúng P = 1 - α Quyết định sai: Lỗi loại II P = β Bác bỏ Ho Quyết định sai: Lỗi loại I P = α Quyết định đúng P = 1 - β 5. Giải thích quy tắc quyết định, mối quan hệ giữa khoảng tin cậy và kiểm định giả thuyết; xác định một kết quả có ý nghĩa thống kê và ý nghĩa kinh tế hay không 5.1. Quy tắc quyết định cho kiểm định một phía và hai phía One-tailed test bao gồm: Right tail - : μ ≤ với : μ >
Left tail - : μ ≥ với : μ <
Two-tailed test - : μ = với : μ ≠
5.2. Phân biệt quyết định thống kê và quyết định kinh tế Statistical decision (Quyết định thống kê): Nếu tính toán giá trị của test statistic lớn hơn critical value, thì quyết định thống kê là có đủ cơ sở để bác bỏ giả thuyết Ho. Economic decision (Quyết định kinh tế): Quyết định kinh tế không chỉ xem xét quyết định thống kê mà còn xem xét tất cả các vấn đề kinh tế thích hợp. [LOS 8.b] Xây dựng giả thuyết và xác định liệu kiểm định có mang ý nghĩa thống kê, liên quan đến lỗi loại I và loại II và lực kiểm định dựa trên mức ý nghĩa đã cho1. Giải thích và diễn giải p-value liên quan đến kiểm định giả thuyết P-values: Là mức ý nghĩa nhỏ nhất mà giả thuyết có thể bị bác bỏ Đối với kiểm định 1 phía: Đối với kiểm định hai phía:
2. Giải thích mức ý nghĩa thống kê khi kiểm định nhiều lần Quy trình của phương pháp tiếp cận phát hiện sai được trình bày theo các bước sau:
3. Xác định mức thống kê kiểm định phù hợp và giải thích kết quả của kiểm định giả thuyết trong các trường hợp trung bình tổng thể có mẫu lớn và nhỏ khi tổng thể phân phối chuẩn hoặc gần chuẩn và phương sai (1) biết và (2) chưa biết Áp dụng 6 bước cơ bản của kiểm định để đánh giá thống kê liên quan. Quy trình cụ thể bao gồm như sau:
Thống kê thử nghiệm của kiểm định này có thể tuân theo phân phối T (t-distribution) hoặc Z (z-distribution). T-test Z-test Các trường hợp sử dụng t-statistic hoặc z-statistic: Khi lấy mẫu từ Test statistic Mẫu nhỏ (n < 30) Mẫu lớn (n ≥ 30) Tổng thể là một phân phối chuẩn đã biết phương sai z-statistic z-statistic Tổng thể là một phân phối chuẩn chưa biết phương sai t-statistic t-statistic Tổng thể không phải là một phân phối chuẩn đã biết phương sai Not available z-statistic Tổng thể không phải là một phân phối chuẩn chưa biết phương sai Not available t-statistic [LOS 8.b] Xây dựng giả thuyết và xác định liệu kiểm định có mang ý nghĩa thống kê, liên quan đến lỗi loại I và loại II và lực kiểm định dựa trên mức ý nghĩa đã choÁp dụng 6 bước cơ bản của kiểm định để đánh giá thống kê liên quan. Quy trình cụ thể bao gồm như sau:
Nội dung bài học trong Module này bao gồm các kiểm định sau: What we want to test Test statistic Probability distribution of the statistic Degree of Freedom Test of the difference in means (kiểm định giả thuyết liên quan tới kiểm định trung bình bằng nhau của hai tổng thể dựa trên hai mẫu ngẫu nhiên độc lập có phân phối chuẩn và phương sai bằng nhau) t-distributed Test of the means of difference (kiểm định giả thuyết liên quan tới kiểm định trung bình của chênh lệch giữa hai tổng thể có phân phối chuẩn) t-distributed n - 1 Test of single variance (kiểm định giả thuyết liên quan tới kiểm định phương sai của một tổng thể phân phối chuẩn) Chi-squared distributed n - 1 Test of the difference in variances (kiểm định giả thuyết liên quan tới kiểm định phương sai của hai tổng thể phân phối chuẩn dựa trên các mẫu ngẫu nhiên độc lập) |