Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Có hai cách để vẽ đồ thị tương quan trong R. Một mặt, bạn có thể vẽ biểu đồ tương quan giữa hai biến trong R bằng biểu đồ phân tán. Lưu ý rằng dòng cuối cùng của khối mã sau đây cho phép bạn thêm hệ số tương quan vào biểu đồ

# Data generation
set.seed(1)
x <- 1:100
y <- x + rnorm(100, mean = 0, sd = 15)

# Creating the plot
plot(x, y, pch = 19, col = "lightblue")

# Regression line
abline(lm(y ~ x), col = "red", lwd = 3)

# Pearson correlation
text(paste("Correlation:", round(cor(x, y), 2)), x = 25, y = 95)

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Bạn cũng có thể tính toán tương quan Kendall và Spearman bằng hàm

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
7, đặt đối số
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
8 thành
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
9 hoặc
# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
0. Ví dụ.
# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
1

Mặt khác, nếu bạn có nhiều hơn hai biến, có một số hàm để trực quan hóa ma trận tương quan trong R, mà chúng ta sẽ xem xét trong các phần sau

Vẽ đồ thị tương quan theo cặp. chức năng cặp và cpair

Hàm phổ biến nhất để tạo ma trận biểu đồ phân tán là hàm

# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
2. Đối với mục đích giải thích, chúng tôi sẽ sử dụng bộ dữ liệu
# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
3 nổi tiếng

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)

Với hàm

# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
2, bạn có thể tạo biểu đồ cặp hoặc biểu đồ tương quan từ khung dữ liệu. Lưu ý rằng bạn cũng có thể chỉ định một công thức nếu muốn

# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Chức năng có thể được tùy chỉnh với một số đối số. Trong ví dụ sau, chúng tôi chỉ cho bạn cách tùy chỉnh đầy đủ biểu đồ ma trận phân tán, tô màu các điểm dữ liệu theo nhóm

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
1

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Hàm

# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
2 cũng cho phép bạn chỉ định các hàm tùy chỉnh trên các đối số
# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
6,
# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
7 và
# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
8. Lưu ý rằng nếu bạn muốn xóa một số bảng, bạn có thể đặt chúng thành
# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
9

Một mặt, bạn có thể thêm biểu đồ và đường mật độ vào đường chéo bằng đoạn mã sau

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
7

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Mặt khác, bạn có thể thêm các hệ số tương quan theo giá trị tuyệt đối, thay đổi kích thước theo mức độ tương quan, với mã của khối sau. Lưu ý rằng bạn có thể thêm các đường hồi quy được làm mịn chuyển hàm

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
10 vào đối số
# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
7

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
0

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

chức năng cpairs từ gói gclus

Hàm

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
12 của gói
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
13 rất giống với gói trước. Sự khác biệt chính là hàm
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
12 nâng cao chức năng trước đó cho phép bạn sắp xếp thứ tự các biến và tô màu các ô con theo tương quan

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
4

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Hàm này cho phép bạn chỉ định tất cả các đối số có sẵn trên hàm

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
15

đồ thị. Hàm tương quan

Hàm

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
16 của gói
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
17 là một phím tắt để tạo biểu đồ tương quan trong R với biểu đồ, hàm mật độ, đường hồi quy được làm trơn và hệ số tương quan với các mức ý nghĩa tương ứng (nếu không có sao thì biến không có ý nghĩa thống kê, còn một, hai

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
8

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Hàm này cũng cho phép bạn chỉ định các đối số của hàm

# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
2

biểu đồ tương quan tâm lý

Gói

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
19 cung cấp hai chức năng thú vị để tạo các biểu đồ tương quan trong R. Hàm
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
70 là phần mở rộng của hàm
# Plot correlation matrix
pairs(data)

# Equivalent with a formula
pairs(~ Sepal.Length + Sepal.Width + Petal.Length + Petal.Width, data = iris)

# Equivalent but using the plot function
plot(data) 
2 cho phép bạn dễ dàng thêm các đường hồi quy, biểu đồ, khoảng tin cậy, … và tùy chỉnh một số đối số bổ sung

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
3

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Hàm

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
72 tạo biểu đồ ma trận tương quan, tô màu các vùng theo mức độ tương quan

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
5

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Nhớ lại gõ

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
73 để biết thêm đối số và chi tiết

Biểu đồ tương quan với các gói corrgram và corrplot

chức năng chỉnh sửa

Một mặt, gói

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
74 tính toán mối tương quan của dữ liệu và vẽ biểu đồ tương quan. Chức năng cùng tên cho phép tùy chỉnh thông qua các chức năng của bảng điều khiển. Ví dụ: bạn có thể tạo biểu đồ tương quan trong R trong đó bảng phía trên hiển thị biểu đồ hình tròn và bảng phía dưới hiển thị các hộp được tô bóng với mã sau

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
0

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Có một số chức năng bảng điều khiển mà bạn có thể sử dụng. Sử dụng chức năng

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
75, bạn có thể liệt kê tất cả chúng

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
1
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
2

Bạn không thể sử dụng tất cả các loại bảng điều khiển trên tất cả các đối số bảng điều khiển. Nhớ gõ

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
76 hoặc
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
77 để biết thêm chi tiết và lập luận

corrplot và corrplot. chức năng hỗn hợp

Mặt khác, gói

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
78 là một gói rất linh hoạt, cho phép tạo nhiều biểu đồ tương quan với một chức năng duy nhất. Các đối số phổ biến nhất của hàm chính được mô tả bên dưới, nhưng chúng tôi khuyên bạn nên gọi cho
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
79 để biết thêm chi tiết. Lưu ý rằng đối với chức năng này, bạn cần chuyển ma trận tương quan thay vì các biến

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
3

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Bạn có thể sử dụng hàm

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
00 để tạo phổ màu

Đối số

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
8 cho phép bạn chọn giữa
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
02 (mặc định),
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
03,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
04,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
05,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
06,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
07 và
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
08. Vì trước đây chúng tôi đã sử dụng phương pháp tô bóng, chúng tôi hiển thị phần còn lại trên biểu đồ sau

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
4

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Chức năng này cũng cho phép phân cụm dữ liệu. Các phương pháp phân cụm theo tài liệu là.

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
09 (thứ tự mặc định),
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
40 (thứ tự góc của các vectơ riêng),
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
41 (thứ tự thành phần chính đầu tiên),
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
42 (thứ tự phân cụm theo thứ bậc) và
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
43 (thứ tự bảng chữ cái)

Nếu bạn chọn phân cụm theo thứ bậc, bạn có thể chọn giữa các phương pháp sau.

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
44,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
45,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
46,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
47,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
48,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
49,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
80,
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
81 và
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
82. Trong trường hợp này, bạn cũng có thể tạo phân cụm bằng hình chữ nhật. Một ví dụ được hiển thị trong khối mã sau

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
5

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Cuối cùng, hàm

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
83 của gói cho phép vẽ biểu đồ tương quan bằng các phương pháp hỗn hợp. Trong trường hợp này, bạn có thể kết hợp các phương pháp biểu đồ tương quan thiết lập mong muốn cho các đối số
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
84 (đường chéo bên dưới) và
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
85 (đường chéo bên trên)

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
6

Phương pháp tốt nhất để hình dung mối tương quan giữa hai biến là gì?

Vì khả năng tùy chỉnh các chức năng của gói

data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
78 là rất lớn, chúng tôi khuyên bạn nên nhập
data <- iris[, 1:4] # Numerical variables
groups <- iris[, 5] # Factor variable (groups)
87 để biết thêm chi tiết

Kỹ thuật nào được sử dụng để trực quan hóa mối tương quan giữa hai biến?

Biểu đồ phân tán (scattergram) . Sự hiện diện của một loại mối quan hệ nhất định chỉ đơn giản có nghĩa là những thay đổi trong biến độc lập dẫn đến thay đổi giá trị của biến phụ thuộc.

Loại trực quan nào thường được sử dụng trong phân tích tương quan?

Biểu đồ phân tán chủ yếu được sử dụng để phân tích tương quan và phân phối. Tốt để hiển thị mối quan hệ giữa hai biến khác nhau trong đó một biến tương quan với biến khác (hoặc không).

Cốt truyện nào là tốt nhất để hình dung một ma trận tương quan?

Đồ thị tương quan là đồ thị của ma trận tương quan. Rất hữu ích để làm nổi bật các biến tương quan nhất trong bảng dữ liệu. Trong biểu đồ này, các hệ số tương quan được tô màu theo giá trị.