Hướng dẫn dùng seaborn tutorial python
Trong bài viết này mình giới thiệu với mọi người các biểu đồ mình hay dùng để visualize dữ liệu bằng seaborn. Show
Vì là intro nên để hiểu rõ hơn ý nghĩa của từng biểu đồ, mọi người có thể đọc thêm tại series data visualization của anh Ngọc tại đây và của anh Khánh tại đây I. Seaborn vs MatplotlibSeaborn là mở rộng của matplotlib, có nghĩa là seaborn kế thừa từ matplotlib và cũng chính vì vậy, seaborn khong thể thay thế hoàn toàn được matplotlib. Mình sẽ so sánh nhanh giữa 2 tools visualize này nhé!
Đại khái là thế . Nào bắt đầu thôi!!II. Các biểu đồ thường dùng trong seabornTrong bài viết này mình sẽ sử dụng data tips, iris vaf planets nhé!
2.1. Pair plotsKhi muốn nhìn tổng quan dữ liệu và mối tương quan giữa các chiều dữ liệu theo từng cặp với nhau, thì pair plots là lựa chọn vô cùng hoàn hảo (Các features dạng số, hiển nhiên :v):
2.2. CountplotCountplot sẽ trả về số lượng của từng category dưới dạng cột
Và với một chút điều chỉnh, chúng ta có thể sắp xếp các cột theo thứ tự tăng hoặc giảm (Có trường hợp xấp xỉ mà nhìn ko ra chả hạn ):
Hoặc cũng có thể dùng countplot để xem tương quan giữa 2 features: Ví dụ : Xem các ngày trong tuần nam, nữ ai trả nhiều hơn
2.3. Histplot và Distplot (Trong version cũ của seaborn)Displot giúp ta xem được sự phân phối (Distribution) của dữ liệu
Sử
dụng
2.4. Joint distributionsTương tự như pairplot, chúng ta có thể sử dụng
Hoặc:
Hoặc:
Có rất nhiều lựa chọn có thể thử, tùy vào việc bạn nhìn vào biểu đồ nào thấy dễ hình dung về phân phối hơn! 2.5. Bar plotsTime series data có thể biểu diễn thông qua
Thử catplot với 2.6. HeatmapCái này chắc quá quen thuộc với mọi người khi muốn plot Correlation Matrix rồi nhỉ?
2.7. Box plot, Swarm plot và Violin plotÝ tưởng chung là giúp ta dễ hình dung hơn phân phối dữ liệu và phát hiện outlier 2.7.1. Box plot
Và với
2.7.2. Swarm plot
2.7.3. Violin plot ()
2.8. Pie chart(Đổi gió dùng chút matplotlib.pyplot ))
III. Kết luậnVậy là mình đã giới thiệu đơn giản với mọi người các biểu đồ mình thường dùng khi sử dụng seaborn, để hiểu rõ hơn cách dùng mọi người có thể xem tại source code của seaborn. Cảm ơn đã dành thời gian đọc bài viết của mình. See ya!!! (KxSS) Referencehttps://jakevdp.github.io/PythonDataScienceHandbook/04.14-visualization-with-seaborn.html |