Vẽ biểu đồ phân phối chuẩn trên biểu đồ python
Biểu đồ được sử dụng để biểu thị dữ liệu liên tục. Điều này trái ngược với các biểu đồ thanh biểu thị dữ liệu phân loại
Về mặt khái niệm, biểu đồ giống như sự kết hợp của biểu đồ đường và biểu đồ thanh. dữ liệu có thể được hiển thị dưới dạng một đường liên tục đang được nhóm thành các thanh. Đây là một ví dụ bắt nguồn từ một ví dụ được hiển thị trên chính trang web Matplotlib minh họa liên kết này giữa biểu đồ đường, biểu đồ thanh và biểu đồ Bài kiểm tra chỉ số thông minh (IQ) là một bài đánh giá trong đó, theo thiết kế, kết quả của mọi người tuân theo phân phối chuẩn với giá trị trung bình là 100 và độ lệch chuẩn là 15. Do đó, sự phân bố điểm số của mọi người sẽ có xu hướng thành một đường liên tục vì số lượng người được kiểm tra có xu hướng vô hạn (giả sử rằng các bài kiểm tra cho điểm chính xác vô hạn), và do đó, nó có thể được biểu diễn trên biểu đồ như vậy. Loại biểu đồ này được gọi là hàm mật độ xác suất (PDF) và hàm để tạo ra nó được cung cấp bởi gói "thống kê" của Scipy
Điều này sau đó có thể được vẽ bằng gói Matplotlib. Hàm 1 vẽ đồ thị dữ liệu x 2 dựa trên dữ liệu y 3 và do có 1.000 điểm được vẽ đồ thị nên đường kết quả có vẻ mượt mà (mặc dù về mặt kỹ thuật, nó được tạo thành từ 999 đoạn thẳng). Các hàm 4, 5 và 6 sau đó tạo tiêu đề ô và nhãn trục
Tuy nhiên, khi chúng tôi được cung cấp một mẫu hữu hạn điểm số của mọi người, chúng tôi chỉ có thể tính gần đúng phân phối này bằng cách đặt điểm số vào 'thùng', nhóm các điểm số có độ lớn tương tự lại với nhau và biểu thị điểm số trên biểu đồ dưới dạng các thanh thẳng đứng có chiều cao bằng số Đối với ví dụ này, chúng tôi sẽ tạo 1.000 số bằng cách lấy ngẫu nhiên các giá trị từ phân phối chuẩn của giá trị trung bình 100 và độ lệch chuẩn 15. Điều này sẽ cung cấp cho chúng tôi 1.000 điểm giả định từ các bài kiểm tra IQ. Các chức năng từ gói Numpy sẽ được sử dụng để làm điều này
0Bây giờ chúng ta có thể sử dụng hàm 7 từ Matplotlib để nhóm 1.000 điểm này vào các thùng và vẽ chúng. Theo mặc định, nó sẽ tạo 10 thùng có chiều rộng bằng nhau 2Lưu ý định dạng Latex đang được sử dụng trong tiêu đề; Tiếp theo, chúng ta có thể chỉ ra rằng biểu đồ thực sự xấp xỉ một phân phối bình thường bằng cách lấy hàm mật độ xác suất được tạo trước đó và vẽ nó lên trên cùng. Tuy nhiên, tệp PDF này sẽ có tỷ lệ hoàn toàn khác với biểu đồ. cái trước có tổng diện tích bên dưới là 1 trong khi cái sau đạt gần 250 ở điểm cao nhất. Để có thể hiển thị chúng cùng nhau, chúng ta cần chuẩn hóa biểu đồ bằng cách đặt đối số từ khóa 9 thành 0 khi gọi hàm 7. Điều này chuyển đổi biểu đồ thành mật độ xác suất. kích thước của các thanh được thay đổi sao cho tổng diện tích của chúng là 1. Chúng tôi cũng sẽ sử dụng 20 thùng cho biểu đồ lần này, chỉ để làm cho nó trông đẹp hơn một chút 7Biểu đồ có thể được tùy chỉnh bằng cách sử dụng các đối số từ khóa của nó (xem tại đây để biết tài liệu về tất cả các tùy chọn)
Các chức năng khác được sử dụng bên dưới bao gồm
Các chức năng trên có thể được tùy chỉnh bằng cách sử dụng các đối số từ khóa Matplotlib chung
0Mặc dù các tiêu đề của các ô trên đã sử dụng chế độ toán học của Latex để nhận các chữ cái Hy Lạp mu và sigma, nhưng chức năng bổ sung của Latex (và kiểm soát nhiều hơn về kích thước và chất lượng của hình) có thể được mở khóa bằng cách sử dụng mã sau |