Bác bỏ giả thuyết h0 khi pvalue như thế nào

Thí dụ: Trọng lượng của những con gà khi xuất chuồng là đại lượng ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 0,32. Trước đây trọng lượng trung bình khi xuất chuồng của một con gà ở trại chăn nuôi này là 3,4 kg. Năm nay người ta áp dụng thử một phương pháp chăn nuôi mới. Sau một thời gian áp dụng thử, người ta chọn ngẫu nhiên 50 con đem cân và tính được trung bình mẫu là 3,5 kg. Hãy cho biết phương pháp chăn nuôi mới có tác dụng làm tăng trọng lượng của gà khi xuất chuồng hay không ?

  1. Hãy xác định p-value của kiểm định ?
  1. p-value sẽ thay đổi như thế nào nếu trung bình mẫu không phải là 3,5 mà là 3,6 ?

Giải:

  1. Gọi \(\mu\) là trọng lượng của một con gà khi xuất chuồng của trại chăn nuôi sau khi áp dụng phương pháp chăn nuôi mới (\(\mu\) chưa biết). Ta cần kiểm định giả thiết:

\({H_0}:\mu = 3,4;{H_1}:\mu > 3,4\)

Đây là bài toán kiểm định giả thiết về trung bình tổng thể (kiểm định giả thiết một phía), \({\sigma ^2}\) chưa biết.

Từ các giả thiết của bài toán, ta tính được giá trị của tiêu chuẩn kiểm định :

\(z = \frac{{\left( {\overline x - {m_0}} \right)\sqrt n }}{\sigma } = \frac{{(3,5 - 3,4)\sqrt {50} }}{{0,32}} = 2,21\)

p-value của kiểm định (tức là xác suất mắc phải sai lầm loại 1 nếu ta bác bỏ giả thiết H0) chính là : P(Z > 2,21)

Để tính xác suất này ta có thể dùng bảng hàm Laplace hoặc dùng hàm NORMSDIST trong Excel.

  • Nếu dùng bảng hàm Laplace thì:

\(p - value = P\left( {Z > 2,21} \right) = 0,5 - {\rm{ }}\varphi (2,21) = 0,5 - 0,48645 = 0,01355\)

  • Nếu dùng hàm NORMSDIST thì:

\(p-value = P(Z > 2,21) = 1- NORMSDIST(2,21) = 0,01355\)

Ta có thể minh họa giá trị p-value trên đồ thị như sau:

Bác bỏ giả thuyết h0 khi pvalue như thế nào

Như vậy, với mẫu đã cho ở thí dụ này, nếu ta bác bỏ giả thiết H0, tức cho rằng việc áp dụng phương pháp chăn nuôi mới có tác dụng làm tăng trọng lượng trung bình của gà khi xuất chuồng thì khả năng mắc phải sai lầm loại 1 là 0,01355 (hay 1,355%).

Nếu trung bình mẫu là 3,6 , tức \(\overline X = 3,6\), khi đó ta tính được:

\(z = \frac{{\left( {\overline x - {m_0}} \right)\sqrt n }}{\sigma } = \frac{{(3,6 - 3,4)\sqrt {50} }}{{0,32}} = 4,419\)

Khi đó ta có:

p-value = P(Z > 4,419) = 1-NORMSDIST(4.419) = 4.962E-06.

4.962E-06 = 4,962x 10-6 = 0,000004962 < 0,00001. Tức p-value ứng với z = 4,419 rất nhỏ (có thể coi bằng 0 nếu là lấy 5 số thập phân).

Như vậy p-value càng nhỏ thì mức độ khẳng định của mẫu về việc bác bỏ giả thiết H0 càng rõ rệt hơn, nói cách khác, giả thiết H0 càng kém tin cậy hơn. Chẳng hạn p-value = 0,01 cho thấy mức độ khẳng định để bác bỏ giả thiết H0 càng rõ ràng hơn so với giá trị p-value = 0,1.

Ở trên là p-value trong kiểm định một phía (phía bên phải). Nếu kiểm định già thiết về phía bên trái hoặc kiểm định giả thiết hai phía thì ta cũng tìm được giá trị p-value tương ứng.

Công thức tính p-value cho kiểm định giả thiết về trung bình tổng thể như sau:

Trường hợp đã biết \({\sigma ^2}\).

  • Nếu \({H_1}:\mu > {m_0}\) thì p-value = P(Z>z) (8.4)
  • Nếu \({H_1}:\mu < {m_0}\) thì p-value = P(Z
  • Nếu \({H_1}:\mu \ne {m_0}\) thì p-value = P(Z>|z|) (8.6)

Trường hợp chưa biết \({\sigma ^2}\).

  • Nếu \({H_1}:\mu > {m_0}\) thì p-value = P(T>t) (8.7)
  • Nếu \({H_1}:\mu < {m_0}\) thì p-value = P(T (8.8)

​Trên đây là nội dung bài giảng Bài 3: Kiểm định giả thiết bằng p-value mà eLib.VN muốn chia sẻ đến các bạn sinh viên. Hy vọng đây sẽ là tư liệu hữu ích giúp các bạn nắm được nội dung bài học tốt hơn. Chúc các bạn học tốt.

Bài viết cung cấp cho người đọc kiến thức về Module 8 môn Quantitative Methods của chương trình CFA level I

[LOS 8.a] Định nghĩa giả thuyết và các cấu phần của chúng, bao gồm lỗi loại I và loại II, mức ý nghĩa, cách sử dụng mức ý nghĩa trong kiểm định giả thuyết và lực kiểm định

1. Kiểm định giả thuyết (Hypothesis testing)

Đánh giá thống kê về một tuyên bố hoặc ý tưởng liên quan đến tổng thể. Quy trình kiểm định giả thuyết sẽ bao gồm các bước sau:

  • Bước 1: Nêu giả thuyết
  • Bước 2: Xác định thống kê thử nghiệm thích hợp
  • Bước 3: Chỉ định mức ý nghĩa
  • Bước 4: Phát biểu quy tắc quyết định
  • Bước 5: Thu thập dữ liệu và tính toán thống kê thử nghiệm
  • Bước 6: Đưa ra quyết định liên quan đến giả thuyết

2. Giả thuyết không và giả thuyết thay thế

Null hypothesis: Là giả thuyết mà nhà nghiên cứu muốn bác bỏ.

Ký hiệu: . có thể phát biểu dưới 3 dạng sau:

  • μ =
    Bác bỏ giả thuyết h0 khi pvalue như thế nào
  • μ ≤
  • μ ≥

Alternative hypothesis: Là giả thuyết được kết luận nếu bị bác bỏ.

Ký hiệu: . có thể được phát biểu dưới 3 dạng sau:

  • μ ≠
  • μ >
  • μ <

3. So sánh và đối chiếu giữa kiểm định một phía và kiểm định hai phía

Cấu trúc kiểm định của One-tailed test:

Cấu trúc kiểm định Two-tailed test:

4. Giải thích thống kê kiểm định, lỗi loại I và loại II, mức ý nghĩa, cách sử dụng mức ý nghĩa trong kiểm định giả thuyết và lực kiểm định

4.1. Thống kê kiểm định (Test statistic)

Là một giá trị được tính toán dựa trên dữ liệu thống kê của mẫu, là cơ sở để quyết định cho việc có bác bỏ giả thuyết hay không.

Công thức:

Bác bỏ giả thuyết h0 khi pvalue như thế nào

4.2. Kiểm tra lỗi (Testing errors)

Bác bỏ giả thuyết h0 khi pvalue như thế nào

Quyết định

Tình huống thực tế

Ho đúng

Ho sai

Không bác bỏ được Ho

Quyết định đúng

P = 1 - α

Quyết định sai: Lỗi loại II

P = β

Bác bỏ Ho

Quyết định sai: Lỗi loại I

P = α

Quyết định đúng

P = 1 - β

5. Giải thích quy tắc quyết định, mối quan hệ giữa khoảng tin cậy và kiểm định giả thuyết; xác định một kết quả có ý nghĩa thống kê và ý nghĩa kinh tế hay không

5.1. Quy tắc quyết định cho kiểm định một phía và hai phía

One-tailed test bao gồm:

Right tail - : μ ≤ với : μ >

  • Bác bỏ nếu: Test statistic > Upper critical value
  • Không bác bỏ nếu: Test statistic ≤ Upper critical value

Left tail - : μ ≥ với : μ <

  • Bác bỏ nếu: Test statistic < Lower critical value
  • Không bác bỏ nếu: Test statistic ≥ Lower critical value

Two-tailed test - : μ =

Bác bỏ giả thuyết h0 khi pvalue như thế nào
với : μ ≠

  • Bác bỏ nếu Test statistic > Upper critical value hoặc Test statistics < Lower critical value
  • Không bác bỏ nếu Lower critical value ≤ Test statistics ≤ Upper critical value

5.2. Phân biệt quyết định thống kê và quyết định kinh tế

Statistical decision (Quyết định thống kê): Nếu tính toán giá trị của test statistic lớn hơn critical value, thì quyết định thống kê là có đủ cơ sở để bác bỏ giả thuyết Ho.

Economic decision (Quyết định kinh tế): Quyết định kinh tế không chỉ xem xét quyết định thống kê mà còn xem xét tất cả các vấn đề kinh tế thích hợp.

[LOS 8.b] Xây dựng giả thuyết và xác định liệu kiểm định có mang ý nghĩa thống kê, liên quan đến lỗi loại I và loại II và lực kiểm định dựa trên mức ý nghĩa đã cho

1. Giải thích và diễn giải p-value liên quan đến kiểm định giả thuyết

P-values: Là mức ý nghĩa nhỏ nhất mà giả thuyết có thể bị bác bỏ

Đối với kiểm định 1 phía:

Bác bỏ giả thuyết h0 khi pvalue như thế nào

Đối với kiểm định hai phía:

Bác bỏ giả thuyết h0 khi pvalue như thế nào

  • Bác bỏ khi p-value < significance level.
  • Không bác bỏ khi p-value > significance level.

2. Giải thích mức ý nghĩa thống kê khi kiểm định nhiều lần

Quy trình của phương pháp tiếp cận phát hiện sai được trình bày theo các bước sau:

  • Bước 1: Xếp hạng các p-value từ các kiểm định khác nhau từ thấp đến cao
  • Bước 2: Tính p-value theo tiêu chí BH:

Bác bỏ giả thuyết h0 khi pvalue như thế nào

  • Bước 3: So sánh p-value gốc với p-value theo tiêu chí BH.

3. Xác định mức thống kê kiểm định phù hợp và giải thích kết quả của kiểm định giả thuyết trong các trường hợp trung bình tổng thể có mẫu lớn và nhỏ khi tổng thể phân phối chuẩn hoặc gần chuẩn và phương sai (1) biết và (2) chưa biết

Áp dụng 6 bước cơ bản của kiểm định để đánh giá thống kê liên quan. Quy trình cụ thể bao gồm như sau:

  • Bước 1: Nêu giả thuyết
  • Bước 2: Xác định thống kê thử nghiệm thích hợp
  • Bước 3: Chỉ định mức ý nghĩa
  • Bước 4: Phát biểu quy tắc quyết định
  • Bước 5: Thu thập dữ liệu và tính toán thống kê thử nghiệm
  • Bước 6: Đưa ra quyết định liên quan đến giả thuyết

Thống kê thử nghiệm của kiểm định này có thể tuân theo phân phối T (t-distribution) hoặc Z (z-distribution).

T-test

Z-test

Bác bỏ giả thuyết h0 khi pvalue như thế nào

Bác bỏ giả thuyết h0 khi pvalue như thế nào

Các trường hợp sử dụng t-statistic hoặc z-statistic:

Khi lấy mẫu từ

Test statistic

Mẫu nhỏ

(n < 30)

Mẫu lớn

(n ≥ 30)

Tổng thể là một phân phối chuẩn đã biết phương sai

z-statistic

z-statistic

Tổng thể là một phân phối chuẩn chưa biết phương sai

t-statistic

t-statistic

Tổng thể không phải là một phân phối chuẩn đã biết phương sai

Not available

z-statistic

Tổng thể không phải là một phân phối chuẩn chưa biết phương sai

Not available

t-statistic

[LOS 8.b] Xây dựng giả thuyết và xác định liệu kiểm định có mang ý nghĩa thống kê, liên quan đến lỗi loại I và loại II và lực kiểm định dựa trên mức ý nghĩa đã cho

Áp dụng 6 bước cơ bản của kiểm định để đánh giá thống kê liên quan. Quy trình cụ thể bao gồm như sau:

  • Bước 1: Nêu giả thuyết
  • Bước 2: Xác định thống kê thử nghiệm thích hợp
  • Bước 3: Chỉ định mức ý nghĩa
  • Bước 4: Phát biểu quy tắc quyết định
  • Bước 5: Thu thập dữ liệu và tính toán thống kê thử nghiệm
  • Bước 6: Đưa ra quyết định liên quan đến giả thuyết

Nội dung bài học trong Module này bao gồm các kiểm định sau:

What we want to test

Test statistic

Probability distribution of the statistic

Degree of Freedom

Test of the difference in means (kiểm định giả thuyết liên quan tới kiểm định trung bình bằng nhau của hai tổng thể dựa trên hai mẫu ngẫu nhiên độc lập có phân phối chuẩn và phương sai bằng nhau)

Bác bỏ giả thuyết h0 khi pvalue như thế nào

t-distributed

Bác bỏ giả thuyết h0 khi pvalue như thế nào

Test of the means of difference (kiểm định giả thuyết liên quan tới kiểm định trung bình của chênh lệch giữa hai tổng thể có phân phối chuẩn)

Bác bỏ giả thuyết h0 khi pvalue như thế nào

t-distributed

n - 1

Test of single variance (kiểm định giả thuyết liên quan tới kiểm định phương sai của một tổng thể phân phối chuẩn)

Bác bỏ giả thuyết h0 khi pvalue như thế nào

Chi-squared distributed

n - 1

Test of the difference in variances (kiểm định giả thuyết liên quan tới kiểm định phương sai của hai tổng thể phân phối chuẩn dựa trên các mẫu ngẫu nhiên độc lập)