Làm thế nào để bạn tìm thấy giá trị trung bình và độ lệch chuẩn của một khung dữ liệu trong python?
Trong hướng dẫn hôm nay, chúng ta sẽ tìm hiểu cách tính độ lệch chuẩn của Khung dữ liệu Pandas. Chúng tôi sẽ tính độ lệch chuẩn cho một số trường hợp Show
Khung dữ liệu mẫuChúng tôi sẽ bắt đầu bằng cách nhập thư viện Pandas và đọc tệp csv có dữ liệu của chúng tôi vào DataFrame mới
Đây là Khung dữ liệu Tính độ lệch tiêu chuẩn của Sê-ri PandasTrong ví dụ đơn giản này, chúng ta sẽ gọi phương thức std trên một Sê-ri (cột)
Độ lệch chuẩn của một hoặc nhiều cột DataFrameTrong trường hợp này, chúng tôi sẽ tính toán tiêu chuẩn cho tất cả hoặc các cột cụ thể Đối với tất cả DataFrame
Đối với các cột cụ thể Trước tiên, chúng tôi sẽ tập hợp DataFrame theo các nhãn cột cụ thể và sau đó gọi phương thức std()
Độ lệch tiêu chuẩn cho mỗi hàng trong Khung dữ liệu PythonVì chúng tôi muốn tính toán stdev của các hàng, chúng tôi sẽ chuyển tham số axis=1
Std dev của các đối tượng Pandas GroupbyTrong ví dụ này, chúng tôi sẽ
Vẽ một độ lệch chuẩnNếu chúng tôi muốn nhanh chóng vẽ các số liệu của nhà phát triển tiêu chuẩn thành một biểu đồ đơn giản, chúng tôi có thể sử dụng Pandas DataFrame. phương thức cốt truyện () Lưu ý rằng chúng ta cũng có thể tạo các biểu đồ phức tạp hơn bằng cách tận dụng tối đa các thư viện Matplotlib và Seaborn Độ lệch chuẩn cho biết các giá trị trong tập dữ liệu được trải rộng như thế nào. Chúng cũng cho biết các giá trị trong tập dữ liệu cách trung bình cộng của các cột trong tập dữ liệu bao xa Đôi khi, có thể được yêu cầu lấy độ lệch chuẩn của một cột cụ thể có bản chất là số. Đây là nơi có thể sử dụng chức năng std(). Cột có giá trị trung bình cần được tính toán có thể được lập chỉ mục cho khung dữ liệu và hàm trung bình có thể được gọi trên cột này bằng cách sử dụng toán tử dấu chấm Chỉ số của cột cũng có thể được thông qua để tìm độ lệch chuẩn Chúng ta hãy xem một cuộc biểu tình tương tự - Thí dụBản thử trực tiếp import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])} print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The standard deviation of column 'Age' is :") print(my_df['Age'].std()) print("The standard deviation of column 'value' is :") print(my_df['value'].std()) đầu raThe dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The standard deviation of column 'Age' is : 31.499206339207976 The standard deviation of column 'value' is : 35.747101700697364 Giải trình
|