Cách tính hệ số hồi quy chuẩn hóa năm 2024

Trong thống kê, điểm chuẩn là số độ lệch chuẩn, mà theo đó giá trị của điểm thô [Giá trị được quan sát hoặc được ghi nhận trong dữ liệu] cao hơn hoặc thấp hơn giá trị trung bình của những gì đang được quan sát hoặc đo lường. Điểm thô trên trung bình có điểm tiêu chuẩn dương, trong khi những điểm dưới trung bình có điểm tiêu chuẩn âm.

Nó được tính bằng cách lấy điểm thô của từng cá nhân trừ đi giá trị trung bình của mẫu và sau đó chia hiệu đó cho độ lệch chuẩn của mẫu. Quá trình chuyển đổi điểm thô thành điểm tiêu chuẩn này được gọi là chuẩn hóa.

Điểm tiêu chuẩn thường được gọi là điểm z [Z-score]; hai thuật ngữ có thể được sử dụng thay thế cho nhau. Các thuật ngữ tương đương khác được sử dụng bao gồm giá trị z [z-values], điểm số bình thường [normal scores], biến tiêu chuẩn hóa [standardized variables].

Việc tính toán điểm số z yêu cầu kiến thức về giá trị trung bình và độ lệch chuẩn của tổng thể hoàn chỉnh mà điểm dữ liệu thuộc về; nếu một người chỉ có một mẫu quan sát từ dân số, thì phép tính tương tự sử dụng giá trị trung bình mẫu và độ lệch chuẩn mẫu sẽ sinh ra thống kê t.

Công thức:

Nếu biết giá trị trung bình của tổng thể và độ lệch chuẩn của tổng thể, điểm thô x được chuyển đổi thành điểm chuẩn bởi công thức sau:

$z={x-\mu \over \sigma }$

Trong đó:

$\mu$ là giá trị trung bình của mẫu,

$\sigma$ là độ lệch chuẩn của tổng thể.

Giá trị tuyệt đối của z biểu thị khoảng cách giữa thô x và trung bình của mẫu theo đơn vị của độ lệch chuẩn. z âm khi điểm thô thấp hơn giá trị trung bình, dương khi cao hơn.

Việc tính z bằng công thức này yêu cầu sử dụng giá trị trung bình tổng thể và độ lệch chuẩn tổng thể, chứ không phải giá trị trung bình của mẫu nhỏ, cũng như độ lệch của mẫu nhỏ. Tuy nhiên, việc biết giá trị trung bình thực và độ lệch chuẩn của tổng thể thường là một kỳ vọng không thực tế, ngoại trừ các trường hợp như thử nghiệm tiêu chuẩn hóa, trong đó toàn bộ tổng thể được đo lường.

Trong thực tế, khi chưa biết giá trị trung bình của tổng thể và độ lệch chuẩn của tổng thể, điểm chuẩn có thể được ước tính bằng cách sử dụng giá trị trung bình mẫu và độ lệch chuẩn mẫu làm ước tính của các giá trị tổng thể.

Trong những trường hợp này, điểm số z được xác định bởi

${\displaystyle z={x-{\bar {x}} \over S}}$

Trong đó:

${\bar {x}}$ là giá trị trung bình của mẫu,

S là độ lệch chuẩn của mẫu.

Mặc dù điều này phải luôn được nêu rõ, nhưng sự khác biệt giữa việc sử dụng thống kê mẫu thường không được thực hiện. Trong cả hai trường hợp, tử số và mẫu số của các phương trình có cùng đơn vị đo sao cho các đơn vị triệt tiêu nhau qua phép chia và z được để lại dưới dạng đại lượng không thứ nguyên.

Các ứng dụng của chuẩn hóa Z-score

1. Z-test

Thử nghiệm Z [z-test] là bất kỳ thử nghiệm thống kê nào mà phân phối của thống kê thử nghiệm theo giả thuyết không, có thể được xấp xỉ bằng phân phối chuẩn. Z-test kiểm tra giá trị trung bình của một phân phối. Đối với mỗi mức ý nghĩa trong khoảng tin cậy, Z-test có một giá trị tới hạn duy nhất [ví dụ: 1,96 cho 5% hai đuôi], Z-test giúp xác định tầm quan trọng của một tập hợp dữ liệu. Tuy nhiên, z-test ít được sử dụng trong thực tế vì khó xác định được độ lệch trên toàn tập tổng thể.

2. Khoảng dự đoán

z-score có thể được sử dụng để tính khoảng dự đoán. Khoảng dự đoán [L,U], bao gồm điểm cuối thấp hơn được chỉ định là L và điểm cuối cao hơn được chỉ định là U, là một khoảng sao cho quan sát trong tương lai X sẽ nằm trong khoảng có xác suất cao $\gamma$, tức là

$P[L

Chủ Đề