Hệ số xác định cho phép đánh giá mức độ chặt chẽ và chiều hưởng của mối liên hệ

Như chúng ta đều đã biết, phân tích hệ số tương quan pearson là một trong những bước quan trọng trong phân tích định lượng. Ngay sau bước phân tích nhân tố khám phá EFA, việc cần làm tiếp theo chính là tạo biến đại diện cho mỗi nhóm nhân tố và tiến hành phân tích tương quan Pearson. Và để bạn đọc hiểu rõ hơn về khái niệm này, Luận Văn 2S xin gửi đến bạn bài viết về lý thuyết cũng như cách tiến hành phân tích tương quan pearson trong SPSS

Hệ số tương quan pearson là gì?

Hệ số tương quan Pearson [Pearson correlation coefficient, ký hiệu r] là số liệu thống kê kiểm tra đo lường mối quan hệ thống kê hoặc liên kết giữa các biến phụ thuộc với các biến liên tục. Hệ số tương quan sẽ trả lời cho các câu hỏi chẳng hạn như: Có mối quan hệ tương quan giữa nhiệt độ và doanh thu bán kem?; Có mối quan hệ tương quan giữa sự hài lòng công việc, năng suất và thu nhập? hay Hai biến nào có mối liên hệ chặt chẽ nhất giữa tuổi, chiều cao, cân nặng, quy mô gia đình và thu nhập gia đình?...

Tương quan pearson được biết đến như là phương pháp tốt nhất để đo lường mối liên hệ giữa các biến quan tâm bởi vì nó dựa trên phương pháp hiệp phương sai. Nó cung cấp thông tin về mức độ quan trọng của mối liên hệ, hoặc mối tương quan, cũng như hướng của mối quan hệ. Ngoài ra, việc kiểm tra hệ số tương quan pearson còn giúp chúng ta sớm nhận diễn được sự xảy ra của vấn đề đa cộng tuyến khi các biến độc lập có sự tương quan mạnh với nhau.

Ý nghĩa hệ số tương quan pearson

Hệ số tương quan Pearson [r] có giá trị giao động trong khoảng liên tục từ -1 đến +1:

  • r = 0: Hai biến không có tương quan tuyến tính
  • r = 1; r = -1: Hai biến có mối tương quan tuyến tính tuyệt đối. 
  • r < 0: Hệ số tương quan âm. Nghĩa là giá trị biến x tăng thì giá trị biến y giảm và ngược lại, giá trị biến y tăng thì giá trị biến x giảm.
  • r > 0: Hệ số tương quan dương. Nghĩa là giá trị biến x tăng thì giá trị biến y tăng và ngược lại, giá trị biến y tăng thì giá trị biến x cũng tăng. 

Lưu ý:

  • Hệ số tương quan pearson [r] chỉ có ý nghĩa khi và chỉ khi mức ý nghĩa quan sát [sig.] nhỏ hơn mức ý nghĩa α = 5%.
  • Nếu r nằm trong khoảng từ 0,50 đến ± 1, thì nó được cho là tương quan mạnh.
  • Nếu r nằm trong khoảng từ 0,30 đến ± 0,49, thì nó được gọi là tương quan trung bình.
  • Nếu r nằm dưới ±  .29, thì nó được gọi là một mối tương quan yếu.
  • Trên đồ thị phân tán Scatter, nếu r = -1 dữ liệu sẽ phân bổ trên một đường thẳng với độ dốc âm, r = 1 dữ liệu sẽ phân bổ trên một đường thẳng với độ dốc dương.


Hệ số tương quan biểu thị trên đồ thị phân tán Scatter

Thực hành phân tích hệ số tương quan pearson trong SPSS

Để kiểm định hệ số tương quan pearson trong SPSS. Đầu tiên, tại thanh công cụ ta nhấp chọn: Analyze > Correlate > Bivariate.


Cửa sổ Bivariate Correlations mở ra, nơi bạn sẽ chỉ định các biến được sử dụng trong phân tích. Tất cả các biến trong tập dữ liệu của bạn xuất hiện trong danh sách ở phía bên trái. Để chọn các biến cho phân tích, chọn các biến trong danh sách bên trái và nhấp vào nút mũi tên để di chuyển chúng sang phải, trong trường Variables.

[A] Variables: Các biến được sử dụng trong Tương quan Pearson bivariate. Bạn phải chọn ít nhất hai biến liên tục, nhưng có thể chọn nhiều hơn hai biến. Thử nghiệm sẽ tạo ra các hệ số tương quan cho từng cặp biến trong danh sách này. Lưu ý: Bạn nên sắp xếp biến phụ thuộc nằm trên cùng trong bảng Variables.

[B] Correlation Coefficients: Có nhiều loại hệ số tương quan. Theo mặc định, Pearson được chọn. 

[C] Test of Significance: Nhấp vào Two-tailed hoặc One-tailed , tùy thuộc vào thử nghiệm ý nghĩa mong muốn của bạn. SPSS sử dụng thử nghiệm two-tailed theo mặc định.

[D] Flag significant correlations: Kiểm tra tùy chọn này sẽ bao gồm các dấu sao [**] bên cạnh các tương quan có ý nghĩa thống kê trong đầu ra.

Cuối cùng là nhấp OK để xuất kết quả ra output. 

Đọc ý nghĩa hệ số tương quan pearson trong SPSS

Bảng kết quả Correlations

Đầu tiên, khi nhìn vào bảng kết quả Correlations, chúng ta cần quan tâm đến giá trị sig. 

Sig. phải nhỏ hơn α = 0.05 thì tương quan r mới có ý nghĩa.

  • Đối với dòng giá trị sig. được tô màu cam: Giá trị nào < 0.05 thì ta kết luận rằng biến độc lập có tương quan tuyến tính với biến phụ thuộc và ngược lại [giá trị nào > 0.05 thì không có sự tương quan giữa biến độc lập và biến phụ thuộc]. Lưu ý, chúng ta sẽ dựa trên sự so sánh giá trị sig. với mức ý nghĩa 0.05 để đánh giá sự tương quan giữa cặp biến chứ không loại biến không đạt và chạy lần 2 nhé.

    Sau khi đánh giá xong sự tương quan giữa cặp biến, ta sẽ dựa vào giá trị r để đánh giá mức độ tương quan mạnh/ yếu giữa biến phụ thuộc và các biến độc lập theo ý nghĩa hệ số tương quan pearson đã nêu ở phần trên.

  • Đối với dòng giá trị sig. được tô màu hồng: Giá trị ở dòng này thể hiện cho sự tương quan giữa các biến độc lập với nhau. Chúng ta cũng xét tương tự như đối với đánh giá sự tương quan giữa biến độc lập và biến phụ thuộc. Tuy nhiên, nếu như r > 0.4 và sig. < 0.05 thì bạn cần lưu ý đến việc xảy ra đa cộng tuyến.

Trên đây là những kiến thức về lý thuyết cũng như cách thực hiện, đọc ý nghĩa hệ số tương quan pearson. Trong quá trình thực hiện, nếu bạn gặp phải khó khăn cần hỗ trợ, hãy liên hệ dịch vụ xử lý số liệu SPSS nhé!

Bài viết cùng chuyên mục:

Cronbach’s Alpha là gì? Phân tích độ tin cậy Cronbach’s Alpha trong SPSS

Correlation Coefficient là gì? Nó được ứng dụng như thế nào trong các lĩnh vực? Hãy cùng tham khảo nội dung sau đây nhé.

Correlation Coefficient là gì?

Hệ số tương quan là một thước đo thống kê về độ mạnh yếu của mối quan hệ giữa các chuyển động tương đối của hai biến. Các giá trị nằm trong khoảng từ -1,0 đến 1,0. Một số được tính toán lớn hơn 1,0 hoặc nhỏ hơn -1,0 có nghĩa là đã xảy ra lỗi trong phép đo tương quan. Tương quan -1,0 cho thấy mối tương quan âm tuyệt đối, trong khi mức tương quan 1,0 cho thấy mối tương quan dương tuyệt đối. Tương quan 0,0 cho thấy không có mối quan hệ tuyến tính giữa chuyển động của hai biến. 

Có một số loại hệ số tương quan, nhưng loại phổ biến nhất là hệ số tương quan Pearson [R]. Hệ số này chỉ ra độ mạnh và hướng của quan hệ tuyến tính giữa hai biến. 

Giá trị chính xác bằng 1,0 có nghĩa là có một mối quan hệ dương tuyệt đối giữa hai biến. Đối với một biến số tăng dương, thì biến số thứ hai cũng tăng dương. Giá trị -1,0 có nghĩa là có một mối quan hệ âm tuyệt đối giữa hai biến. Điều này cho thấy rằng các biến chuyển động ngược chiều nhau - đối với một biến số tăng dương thì biến số thứ hai sẽ giảm xuống. Nếu mối tương quan giữa hai biến là 0 thì kết luận không có mối quan hệ tuyến tính giữa chúng.

Độ mạnh của mối quan hệ thay đổi theo mức độ dựa trên giá trị của hệ số tương quan. Ví dụ, giá trị 0,2 cho thấy có mối tương quan dương giữa hai biến, nhưng nó yếu và có thể không quan trọng. Các nhà phân tích trong một số lĩnh vực nghiên cứu không coi các mối tương quan là quan trọng cho đến khi giá trị vượt qua ít nhất 0,8. Tuy nhiên, hệ số tương quan có giá trị tuyệt đối từ 0,9 trở lên sẽ thể hiện một mối quan hệ rất chặt chẽ.

Công thức tính Correlation Coefficient

Hệ số tương quan cho biết độ mạnh của mối quan hệ giữa hai biến có thể được tìm thấy bằng công thức sau:

Trong đó:

rxy - hệ số tương quan của mối quan hệ tuyến tính giữa các biến x và y

xi - các giá trị của biến x trong dữ liệu

x̅ - giá trị trung bình của các giá trị của biến x

yi - các giá trị của biến y trong dữ liệu

ȳ - giá trị trung bình của biến y

Để tính toán hệ số tương quan bằng công thức trên, bạn phải thực hiện các bước sau:

-       Lấy một mẫu dữ liệu với các giá trị của biến x và biến y.

-       Tính giá trị trung bình [trung bình] x̅ cho biến x và ȳ cho biến y.

-       Đối với biến x, trừ giá trị trung bình của mỗi giá trị của biến x [chúng ta hãy gọi biến mới này là “a”]. Làm tương tự với biến y [chúng ta hãy gọi biến này là “b”].

-       Nhân mỗi giá trị a với giá trị b tương ứng và tìm tổng của các phép nhân này [giá trị cuối cùng là tử số trong công thức].

-       Bình phương mỗi giá trị a và tính tổng kết quả

-       Tìm căn bậc hai của giá trị thu được ở bước trước [đây là mẫu số trong công thức].

-       Chia giá trị thu được ở bước 4 cho giá trị thu được ở bước 7.

Biết công thức tính Correlation Coefficient là gì, bạn có thể thấy rằng việc tính toán thủ công hệ số tương quan là một quá trình cực kỳ tẻ nhạt, đặc biệt nếu với dữ liệu lớn. Tuy nhiên, có rất nhiều công cụ phần mềm có thể giúp bạn tiết kiệm thời gian khi tính toán hệ số.

“Hàm Correl trong Excel là một trong những cách dễ nhất để nhanh chóng tính toán mối tương quan giữa hai biến cho một lượng dữ liệu lớn.”

Thống kê tương quan và đầu tư

Hệ số tương quan là một thước đo thống kê được sử dụng rộng rãi trong đầu tư. Chúng đóng một vai trò rất quan trọng trong các lĩnh vực như thành phần danh mục đầu tư, giao dịch định lượng và đánh giá hiệu suất. Chẳng hạn, một số nhà đầu tư sẽ theo dõi hệ số tương quan của các tài sản riêng lẻ trong danh mục đầu tư của họ, để đảm bảo rằng tổng mức biến động của danh mục đầu tư của họ được duy trì trong giới hạn có thể chấp nhận được. Tương tự, các nhà phân tích đôi khi sẽ sử dụng hệ số tương quan để dự đoán cách một tài sản cụ thể sẽ bị tác động bởi sự thay đổi đối với yếu tố bên ngoài, chẳng hạn như giá hàng hóa hoặc lãi suất.

Mối tương quan giữa hai biến đặc biệt hữu ích khi đầu tư vào thị trường tài chính. Ví dụ, mối tương quan có thể hữu ích trong việc xác định mức độ hoạt động của một quỹ tương hỗ so với chỉ số chuẩn của nó hoặc một quỹ hoặc loại tài sản khác. Bằng cách thêm một quỹ tương hỗ có tương quan thấp hoặc tương quan âm vào danh mục đầu tư hiện có, nhà đầu tư sẽ thu được lợi ích đa dạng hóa.

Nói cách khác, các nhà đầu tư có thể sử dụng các tài sản hoặc chứng khoán có tương quan âm để bảo vệ danh mục đầu tư của họ và giảm mức độ rủi do thay đổi giá. Correlation Coefficient cũng giúp nhà đầu tư biết được thời điểm mối tương quan giữa hai biến số thay đổi.

Ví dụ, cổ phiếu ngân hàng thường có mối tương quan tích cực cao với lãi suất vì lãi suất cho vay thường được tính dựa trên lãi suất thị trường. Nếu giá cổ phiếu của một ngân hàng giảm trong khi lãi suất tăng, các nhà đầu tư có thể nhận ra điều gì đó không ổn. Nếu giá cổ phiếu của các ngân hàng đều tăng, có thể thấy rằng giá cổ phiếu giảm không phải do lãi suất. Thay vào đó, ngân hàng hoạt động kém có khả năng đang giải quyết một vấn đề nội bộ.

Mong rằng với những chia sẻ về Correlation Coefficient là gì trên đây, bạn sẽ biết được các thông tin thật hữu ích.

Hà Phương

Video liên quan

Chủ Đề