Lô đẹp trong python
Tổng hợp 50 sơ đồ matplotlib hàng đầu hữu ích nhất trong phân tích và trực quan hóa dữ liệu. Danh sách này cho phép bạn chọn hình ảnh hóa nào sẽ hiển thị cho tình huống nào bằng cách sử dụng thư viện matplotlib và seaborn của python Show
Giới thiệuCác biểu đồ được nhóm lại dựa trên 7 mục đích khác nhau của mục tiêu trực quan hóa của bạn. Ví dụ: nếu bạn muốn hình dung mối quan hệ giữa 2 biến, hãy xem biểu đồ trong phần 'Tương quan'. Hoặc nếu bạn muốn hiển thị cách một giá trị thay đổi theo thời gian, hãy xem phần 'Thay đổi', v.v. Một biểu đồ hiệu quả là một biểu đồ mà
Matplotlib được sử dụng phổ biến để trực quan hóa các ô. Hãy xem các video hướng dẫn miễn phí này để tìm hiểu cách thực hiện và __Bài viết liên quan. __ nội dung(nhấp chuột phải và mở trong trang mới nếu các liên kết không hoạt động) tương quan độ lệch xếp hạng Phân bổ Thành phần Biến đổi Các nhóm Cài đặtChạy cái này một lần trước mã cốt truyện. Tuy nhiên, các biểu đồ riêng lẻ có thể xác định lại tính thẩm mỹ của chính nó Nếu bạn muốn xem video hướng dẫn về , hãy xem bài học video miễn phí này Nhận khóa học Python hoàn chỉnh miễn phíĐối mặt với tình huống tương tự như những người khác? Xây dựng sự nghiệp khoa học dữ liệu của bạn với bằng cấp được ngành công nhận trên toàn cầu. Có được tư duy, sự tự tin và các kỹ năng khiến Nhà khoa học dữ liệu trở nên có giá trị Nhận khóa học Python hoàn chỉnh miễn phíXây dựng sự nghiệp khoa học dữ liệu của bạn với bằng cấp được ngành công nhận trên toàn cầu. Có được tư duy, sự tự tin và các kỹ năng khiến Nhà khoa học dữ liệu trở nên có giá trị
tương quanCác biểu đồ tương quan được sử dụng để trực quan hóa mối quan hệ giữa 2 hoặc nhiều biến. Đó là, một biến thay đổi như thế nào đối với một biến khác 1. âm mưu phân tánBiểu đồ phân tán là một biểu đồ cổ điển và cơ bản được sử dụng để nghiên cứu mối quan hệ giữa hai biến. Nếu bạn có nhiều nhóm trong dữ liệu của mình, bạn có thể muốn trực quan hóa từng nhóm bằng một màu khác. Trong 7, bạn có thể thực hiện việc này một cách thuận tiện bằng cách sử dụng 8Hiển thị mã
2. Âm mưu bong bóng với EncirclingĐôi khi bạn muốn hiển thị một nhóm điểm trong ranh giới để nhấn mạnh tầm quan trọng của chúng. Trong ví dụ này, bạn lấy các bản ghi từ khung dữ liệu cần được bao quanh và chuyển nó tới 9 được mô tả trong mã bên dướiHiển thị mã
3. Biểu đồ phân tán với đường hồi quy tuyến tính phù hợp nhấtNếu bạn muốn hiểu hai biến thay đổi như thế nào đối với nhau, thì đường phù hợp nhất là cách để đi. Biểu đồ dưới đây cho thấy dòng phù hợp nhất khác nhau như thế nào giữa các nhóm khác nhau trong dữ liệu. Để vô hiệu hóa các nhóm và chỉ vẽ một dòng phù hợp nhất cho toàn bộ tập dữ liệu, hãy xóa tham số 0 khỏi lệnh gọi 1 bên dướiHiển thị mã________số 8 Mỗi đường hồi quy trong cột riêng của nóNgoài ra, bạn có thể hiển thị dòng phù hợp nhất cho từng nhóm trong cột riêng của mình. Bạn có thể làm điều này bằng cách đặt tham số ________ 62 bên trong ________ 61 Hiển thị mã 14. Jittering với thoát yThường thì nhiều điểm dữ liệu có các giá trị X và Y giống hệt nhau. Kết quả là, nhiều điểm được vẽ chồng lên nhau và ẩn. Để tránh điều này, hãy rung nhẹ các điểm để bạn có thể nhìn thấy chúng một cách trực quan. Điều này thuận tiện khi sử dụng 4 của seabornHiển thị mã
5. âm mưu đếmMột tùy chọn khác để tránh vấn đề trùng lặp điểm là tăng kích thước của dấu chấm tùy thuộc vào số lượng điểm nằm trong điểm đó. Vì vậy, kích thước của điểm càng lớn thì nồng độ của các điểm xung quanh điểm đó càng lớn
6. Biểu đồ cận biênBiểu đồ biên có biểu đồ dọc theo các biến trục X và Y. Điều này được sử dụng để trực quan hóa mối quan hệ giữa X và Y cùng với phân phối đơn biến của X và Y riêng lẻ. Biểu đồ này thường được sử dụng trong phân tích dữ liệu khám phá (EDA) Hiển thị mã 57. Boxplot cận biênBoxplot biên phục vụ một mục đích tương tự như biểu đồ biên. Tuy nhiên, boxplot giúp xác định trung vị, phân vị thứ 25 và 75 của X và Y Hiển thị mã 68. biểu đồ tương quanBiểu đồ tương quan được sử dụng để xem trực quan số liệu tương quan giữa tất cả các cặp biến số có thể có trong một khung dữ liệu nhất định (hoặc mảng 2D) 79. Lô theo cặpBiểu đồ theo cặp được yêu thích trong phân tích khám phá để hiểu mối quan hệ giữa tất cả các cặp biến số có thể có. Nó là một công cụ phải có để phân tích hai biến 0 1độ lệch10. thanh phân kỳNếu bạn muốn xem các mục thay đổi như thế nào dựa trên một số liệu duy nhất và trực quan hóa thứ tự cũng như số lượng của phương sai này, thì các thanh phân kỳ là một công cụ tuyệt vời. Nó giúp nhanh chóng phân biệt hiệu suất của các nhóm trong dữ liệu của bạn và khá trực quan và truyền đạt quan điểm ngay lập tức 211. Văn bản phân kỳCác văn bản phân kỳ tương tự như các thanh phân kỳ và nó được ưu tiên nếu bạn muốn hiển thị giá trị của từng mục trong biểu đồ theo cách đẹp mắt và dễ nhìn 312. Biểu đồ chấm phân kỳBiểu đồ chấm phân kỳ cũng tương tự như các thanh phân kỳ. Tuy nhiên, so với các thanh phân kỳ, việc không có các thanh làm giảm mức độ tương phản và chênh lệch giữa các nhóm Hiển thị mã 413. Biểu đồ Lollipop phân kỳ với các điểm đánh dấuLollipop với các điểm đánh dấu cung cấp một cách linh hoạt để trực quan hóa sự phân kỳ bằng cách nhấn mạnh vào bất kỳ điểm dữ liệu quan trọng nào bạn muốn thu hút sự chú ý và đưa ra lý do phù hợp trong biểu đồ Hiển thị mã 514. Biểu đồ khu vựcBằng cách tô màu khu vực giữa trục và các đường, biểu đồ vùng nhấn mạnh hơn không chỉ vào các đỉnh và đáy mà còn cả khoảng thời gian của các đỉnh và đáy. Thời lượng của các mức cao càng dài, diện tích dưới đường càng lớn Hiển thị mã 6xếp hạng15. Biểu đồ thanh có thứ tựBiểu đồ thanh có thứ tự truyền đạt thứ tự xếp hạng của các mục một cách hiệu quả. Nhưng khi thêm giá trị của số liệu phía trên biểu đồ, người dùng sẽ nhận được thông tin chính xác từ chính biểu đồ đó. Đó là một cách cổ điển để trực quan hóa các mục dựa trên số lượng hoặc bất kỳ số liệu cụ thể nào. Kiểm tra video hướng dẫn miễn phí này trên Hiển thị mã 716. Bảng xếp hạng LollipopBiểu đồ Lollipop phục vụ mục đích tương tự như biểu đồ thanh được sắp xếp theo cách trực quan dễ chịu Hiển thị mã 817. Châm điểmBiểu đồ dấu chấm truyền tải thứ tự xếp hạng của các mục. Và vì nó được căn dọc theo trục hoành, bạn có thể hình dung các điểm cách nhau bao xa dễ dàng hơn 918. Biểu đồ độ dốcBiểu đồ độ dốc phù hợp nhất để so sánh vị trí 'Trước' và 'Sau' của một người/vật cụ thể Hiển thị mã 019. Âm mưu quả tạBiểu đồ quả tạ truyền đạt vị trí 'trước' và 'sau' của các vật phẩm khác nhau cùng với thứ tự xếp hạng của các vật phẩm. Nó rất hữu ích nếu bạn muốn hình dung tác động của một dự án/sáng kiến cụ thể đối với các đối tượng khác nhau Hiển thị mã 1Phân bổ20. Biểu đồ cho biến liên tụcBiểu đồ hiển thị phân phối tần số của một biến nhất định. Biểu diễn bên dưới nhóm các thanh tần số dựa trên một biến phân loại giúp hiểu rõ hơn về biến liên tục và biến phân loại song song. trong video hướng dẫn miễn phí này Hiển thị mã 221. Biểu đồ cho biến phân loạiBiểu đồ của một biến phân loại cho thấy phân phối tần số của một biến đó. Bằng cách tô màu các thanh, bạn có thể trực quan hóa phân phối liên quan đến một biến phân loại khác đại diện cho màu sắc Hiển thị mã 322. Biểu đồ mật độBiểu đồ mật độ là một công cụ thường được sử dụng trực quan hóa phân phối của một biến liên tục. Bằng cách nhóm chúng theo biến 'phản hồi', bạn có thể kiểm tra mối quan hệ giữa X và Y. Trường hợp dưới đây nếu nhằm mục đích đại diện để mô tả cách phân bổ số dặm trong thành phố thay đổi theo số lượng xi lanh 4s23. Đường cong mật độ với Biểu đồĐường cong mật độ với biểu đồ tập hợp thông tin chung được truyền tải bởi hai biểu đồ để bạn có thể có cả hai biểu đồ trong một hình duy nhất thay vì hai biểu đồ Hiển thị mã 524. âm mưu niềm vuiJoy Plot cho phép các đường cong mật độ của các nhóm khác nhau chồng lên nhau, đây là một cách tuyệt vời để hình dung sự phân bố của một số lượng lớn các nhóm trong mối quan hệ với nhau. Nó trông đẹp mắt và truyền tải đúng thông tin một cách rõ ràng. Nó có thể được xây dựng dễ dàng bằng cách sử dụng gói 5 dựa trên 7 625. Biểu đồ điểm phân tánBiểu đồ chấm phân tán hiển thị phân phối đơn biến của các điểm được phân đoạn theo nhóm. Các điểm càng tối thì mức độ tập trung của các điểm dữ liệu trong vùng đó càng nhiều. Bằng cách tô màu trung bình khác nhau, vị trí thực sự của các nhóm trở nên rõ ràng ngay lập tức Hiển thị mã 726. Lô hộpBiểu đồ hộp là một cách tuyệt vời để trực quan hóa phân phối, lưu ý đến phần tư trung bình, phần tư thứ 25 thứ 75 và các giá trị ngoại lai. Tuy nhiên, bạn cần cẩn thận trong việc giải thích kích thước của các hộp có khả năng làm sai lệch số lượng điểm có trong nhóm đó. Vì vậy, việc cung cấp thủ công số lượng quan sát trong mỗi hộp có thể giúp khắc phục nhược điểm này. Kiểm tra điều này Ví dụ: hai hộp đầu tiên bên trái có các hộp có cùng kích thước mặc dù chúng có 5 và 47 obs tương ứng. Vì vậy, việc viết số lượng quan sát trong nhóm đó trở nên cần thiết 827. Dấu chấm + ô vuôngDấu chấm + Biểu đồ hộp Truyền tải thông tin tương tự như biểu đồ hộp được chia theo nhóm. Ngoài ra, các dấu chấm còn cho biết có bao nhiêu điểm dữ liệu nằm trong mỗi nhóm 928. Âm mưu vĩ cầmCốt truyện violin là một sự thay thế trực quan dễ chịu cho các ô hộp. Hình dạng hoặc diện tích của đàn violon phụ thuộc vào số lượng quan sát mà nó nắm giữ. Tuy nhiên, các ô vĩ cầm có thể khó đọc hơn và nó không được sử dụng phổ biến trong môi trường chuyên nghiệp. Video hướng dẫn miễn phí bằng tiếng Thái sẽ đào tạo bạn 029. Kim tự tháp dân sốTháp dân số có thể được sử dụng để chỉ ra sự phân bố của các nhóm được sắp xếp theo khối lượng. Hoặc nó cũng có thể được sử dụng để hiển thị quá trình lọc dân số theo từng giai đoạn như được sử dụng dưới đây để cho biết có bao nhiêu người đi qua từng giai đoạn của phễu tiếp thị 130. lô phân loạiBiểu đồ phân loại do thư viện 7 cung cấp có thể được sử dụng để trực quan hóa phân phối số đếm của 2 hoặc nhiều biến phân loại hơn trong mối quan hệ với nhau 2 3Thành phần31. Biểu đồ bánh quếBiểu đồ 8 có thể được tạo bằng gói 9 và được sử dụng để hiển thị thành phần của các nhóm trong một quần thể lớn hơnHiển thị mã 4 532. Biểu đồ trònBiểu đồ hình tròn là một cách cổ điển để hiển thị thành phần của các nhóm. Tuy nhiên, ngày nay nó không được khuyến khích sử dụng vì diện tích của các phần bánh đôi khi có thể bị sai lệch. Vì vậy, nếu bạn định sử dụng biểu đồ hình tròn, bạn nên viết rõ ràng tỷ lệ phần trăm hoặc số cho từng phần của hình tròn 6 733. sơ đồ câyBản đồ cây tương tự như biểu đồ hình tròn và nó hoạt động tốt hơn mà không làm sai lệch đóng góp của từng nhóm 834. Biểu đồ cộtBiểu đồ thanh là một cách cổ điển để hình dung các mục dựa trên số lượng hoặc bất kỳ số liệu cụ thể nào. Trong biểu đồ bên dưới, tôi đã sử dụng một màu khác cho từng mục, nhưng thông thường bạn có thể muốn chọn một màu cho tất cả các mục trừ khi bạn tô màu chúng theo nhóm. Tên màu được lưu trữ bên trong 50 trong mã bên dưới. Bạn có thể thay đổi màu của các thanh bằng cách đặt tham số 51 trong 52Hiển thị mã 9Biến đổi35. Cốt truyện chuỗi thời gianBiểu đồ chuỗi thời gian được sử dụng để trực quan hóa cách một số liệu nhất định thay đổi theo thời gian. Tại đây bạn có thể thấy lưu lượng Hành khách Hàng không đã thay đổi như thế nào giữa năm 1949 và 1969. Kiểm tra video hướng dẫn miễn phí này để phân tích chuỗi thời gian Hiển thị mã 1036. Chuỗi thời gian với các đỉnh và đáy được chú thíchChuỗi thời gian dưới đây biểu thị tất cả các đỉnh và đáy và chú thích sự xuất hiện của các sự kiện đặc biệt đã chọn Hiển thị mã 1137. Đồ thị tự tương quan (ACF) và tự tương quan một phần (PACF)Biểu đồ ACF cho thấy mối tương quan của chuỗi thời gian với độ trễ của chính nó. Mỗi đường thẳng đứng (trên biểu đồ tự tương quan) biểu thị mối tương quan giữa chuỗi và độ trễ của nó bắt đầu từ độ trễ 0. Vùng bóng mờ màu xanh lam trong cốt truyện là mức ý nghĩa. Những độ trễ nằm trên đường màu xanh là độ trễ đáng kể Vậy làm thế nào để giải thích điều này? Đối với AirPassengers, chúng tôi thấy có tới 14 độ trễ đã vượt qua đường màu xanh lam và điều này rất đáng kể. Điều này có nghĩa là, lưu lượng Hành khách Hàng không được thấy cho đến 14 năm trước có ảnh hưởng đến lưu lượng được thấy ngày nay Mặt khác, PACF đã cho thấy sự tự tương quan của bất kỳ độ trễ nhất định nào (của chuỗi thời gian) so với chuỗi hiện tại, nhưng với sự đóng góp của độ trễ ở giữa đã bị loại bỏ Ghi chú. Nếu bạn muốn, hãy xem video hướng dẫn miễn phí này 1238. Biểu đồ tương quan chéoBiểu đồ tương quan chéo cho thấy độ trễ của hai chuỗi thời gian với nhau Hiển thị mã 1339. Biểu đồ phân tách chuỗi thời gianBiểu đồ phân tách chuỗi thời gian cho thấy sự phân chia chuỗi thời gian thành các thành phần xu hướng, theo mùa và phần còn lại 1440. Nhiều chuỗi thời gianBạn có thể vẽ nhiều chuỗi thời gian đo lường cùng một giá trị trên cùng một biểu đồ như hình bên dưới Hiển thị mã 1541. Vẽ đồ thị với các tỷ lệ khác nhau bằng trục Y thứ cấpNếu bạn muốn hiển thị hai chuỗi thời gian đo hai đại lượng khác nhau tại cùng một thời điểm, bạn có thể vẽ lại chuỗi thứ hai trên trục Y phụ ở bên phải Học cách vẽ bằng video hướng dẫn miễn phí này Hiển thị mã 1642. Chuỗi thời gian có dải lỗiChuỗi thời gian với các dải lỗi có thể được tạo nếu bạn có tập dữ liệu chuỗi thời gian với nhiều quan sát cho từng điểm thời gian (ngày/dấu thời gian). Dưới đây bạn có thể xem một vài ví dụ dựa trên các đơn đặt hàng đến vào các thời điểm khác nhau trong ngày. Và một ví dụ khác về số lượng đơn đặt hàng đến trong khoảng thời gian 45 ngày Theo cách tiếp cận này, giá trị trung bình của số lượng đơn đặt hàng được biểu thị bằng đường trắng. Và một dải tin cậy 95% được tính toán và vẽ xung quanh giá trị trung bình Hiển thị mã 17 1843. Biểu đồ vùng xếp chồng lên nhauBiểu đồ vùng xếp chồng cung cấp biểu diễn trực quan về mức độ đóng góp từ nhiều chuỗi thời gian để dễ dàng so sánh với nhau Hiển thị mã 1944. Biểu đồ khu vực không được xếp chồng lên nhauBiểu đồ vùng không xếp chồng được sử dụng để trực quan hóa tiến trình (lên và xuống) của hai hoặc nhiều chuỗi đối với nhau. Trong biểu đồ bên dưới, bạn có thể thấy rõ tỷ lệ tiết kiệm cá nhân giảm như thế nào khi thời gian thất nghiệp trung bình tăng lên. Biểu đồ khu vực chưa được xếp chồng đưa ra hiện tượng này một cách độc đáo Hiển thị mã 045. Bản đồ nhiệt lịchBản đồ lịch là một tùy chọn thay thế và ít được ưu tiên hơn để trực quan hóa dữ liệu dựa trên thời gian so với chuỗi thời gian. Mặc dù có thể hấp dẫn trực quan, nhưng các giá trị số không hoàn toàn rõ ràng. Tuy nhiên, nó hiệu quả trong việc hình dung độc đáo các giá trị cực đoan và hiệu ứng kỳ nghỉ. 146. Cốt truyện theo mùaCốt truyện theo mùa có thể được sử dụng để so sánh chuỗi thời gian được thực hiện như thế nào vào cùng một ngày trong mùa trước (năm/tháng/tuần, v.v.) Hiển thị mã 2Các nhóm47. chương trình dendroMột Dendrogram nhóm các điểm tương tự lại với nhau dựa trên một số liệu khoảng cách nhất định và sắp xếp chúng theo dạng cây giống như các liên kết dựa trên sự giống nhau của điểm 348. Lô cụmBiểu đồ cụm có thể được sử dụng để phân định các điểm thuộc cùng một cụm. Dưới đây là một ví dụ đại diện để nhóm các bang của Hoa Kỳ thành 5 nhóm dựa trên bộ dữ liệu USArrests. Biểu đồ cụm này sử dụng các cột 'giết người' và 'tấn công' làm trục X và Y. Ngoài ra, bạn có thể sử dụng thành phần đầu tiên cho thành phần chính làm trục X và Y Hiển thị mã 449. Đường cong AndrewsAndrews Curve giúp hình dung nếu có các nhóm vốn có của các tính năng số dựa trên một nhóm nhất định. Nếu các tính năng (cột trong tập dữ liệu) không giúp phân biệt nhóm ( 53, thì các dòng sẽ không được phân tách rõ ràng như bạn thấy bên dưới 550. Tọa độ song songCác tọa độ song song giúp hình dung nếu một tính năng giúp tách biệt các nhóm một cách hiệu quả. Nếu một sự phân biệt được thực hiện, tính năng đó có thể sẽ rất hữu ích trong việc dự đoán nhóm đó 6Đó là tất cả cho bây giờ. Nếu bạn gặp một số lỗi hoặc lỗi, vui lòng thông báo tại đây Selva PrabhakaranSelva là Tác giả chính và Biên tập viên của Machine Learning Plus, với hơn 4 triệu độc giả. Anh ấy là tác giả của các khóa học và sách với hơn 100 nghìn sinh viên và là Nhà khoa học dữ liệu chính của một công ty toàn cầu |