Thật không may khi đề cập đến 'hàng' và 'cột' trong gấu trúc có thể gây nhầm lẫn. Cách tôi nghĩ là 'bạn muốn vượt qua trục nào để lấy giá trị trung bình?'
Có nghĩa là, nếu bạn muốn vượt qua các hàng và lấy giá trị trung bình của cột, thì bạn cần đặt axis='index' hoặc axis=0. Điều này có nghĩa là bạn nhảy qua các hàng và lấy cột trung bình
Tiếp theo, bạn sẽ thấy một ví dụ với các bước để lấy giá trị trung bình của từng cột và hàng cho một DataFrame nhất định
Các bước để lấy Trung bình của từng Cột và Hàng trong Pandas DataFrame
Bước 1. Chuẩn bị dữ liệu
Để bắt đầu, hãy chuẩn bị dữ liệu cần tính trung bình
Ví dụ: giả sử bạn có dữ liệu sau về tiền hoa hồng mà 3 người kiếm được [trong 6 tháng đầu năm]
Mục tiêu là để có được mức trung bình của hoa hồng kiếm được
- Đối với mỗi người trong 6 tháng đầu tiên [trung bình theo cột]
- Mỗi tháng cho tất cả mọi người [trung bình theo hàng]
Bước 2. Tạo một khung dữ liệu
Tiếp theo, tạo DataFrame để thu thập dữ liệu trên bằng Python
import pandas as pd data = {'month': ['Jan ','Feb ','Mar ','Apr ','May ','Jun '], 'a_commission': [7000,5500,6000,4500,8000,6000], 'b_commission': [10000,7500,6500,6000,9000,8500], 'c_commission': [3000,6000,4500,4500,4000,5500] } df = pd.DataFrame[data] print [df]
Chạy mã bằng Python và bạn sẽ nhận được DataFrame sau
month a_commission b_commission c_commission
0 Jan 7000 10000 3000
1 Feb 5500 7500 6000
2 Mar 6000 6500 4500
3 Apr 4500 6000 4500
4 May 8000 9000 4000
5 Jun 6000 8500 5500
Bước 3. Lấy giá trị trung bình của từng cột và hàng trong Pandas DataFrame
Sau đó, bạn có thể áp dụng cú pháp sau để lấy giá trị trung bình của mỗi cột
df.mean[axis=0]
Đây là mã Python hoàn chỉnh để nhận hoa hồng trung bình mà mỗi người kiếm được trong 6 tháng đầu tiên [trung bình theo cột]
import pandas as pd data = {'month': ['Jan ','Feb ','Mar ','Apr ','May ','Jun '], 'a_commission': [7000,5500,6000,4500,8000,6000], 'b_commission': [10000,7500,6500,6000,9000,8500], 'c_commission': [3000,6000,4500,4500,4000,5500] } df = pd.DataFrame[data] av_column = df.mean[axis=0] print [av_column]
Chạy mã và bạn sẽ nhận được hoa hồng trung bình cho mỗi người
a_commission 6166.666667
b_commission 7916.666667
c_commission 4583.333333
Ngoài ra, bạn có thể lấy giá trị trung bình của mỗi hàng bằng cú pháp sau
df.mean[axis=1]
Đây là mã để nhận hoa hồng trung bình kiếm được mỗi tháng cho tất cả mọi người [trung bình theo hàng]
import pandas as pd data = {'month': ['Jan ','Feb ','Mar ','Apr ','May ','Jun '], 'a_commission': [7000,5500,6000,4500,8000,6000], 'b_commission': [10000,7500,6500,6000,9000,8500], 'c_commission': [3000,6000,4500,4500,4000,5500] } df = pd.DataFrame[data, index =['Jan ','Feb ','Mar ','Apr ','May ','Jun ']] av_row = df.mean[axis=1] print [av_row]
Khi bạn chạy mã bằng Python, bạn sẽ nhận được hoa hồng trung bình kiếm được mỗi tháng
Jan 6666.666667
Feb 6333.333333
Mar 5666.666667
Apr 5000.000000
May 7000.000000
Jun 6666.666667
Bạn cũng có thể muốn xem hướng dẫn sau giải thích các bước để lấy tổng của từng cột và hàng trong Pandas DataFrame
Pandas là một thư viện python tuyệt vời để thao tác dữ liệu trong tập dữ liệu. Để làm được như vậy có rất nhiều hàm trong đó và thực hiện các thao tác. Giả sử bạn có một tập dữ liệu số hoặc khung dữ liệu và muốn tìm giá trị trung bình trên toàn bộ hoặc cột cụ thể của tập dữ liệu thì bạn có thể làm như vậy bằng cách sử dụng gấu trúc. Trong toàn bộ hướng dẫn này, bạn sẽ biết cách tính trung bình cộng của các cột trong pandas với các bước
Các bước để tính trung bình của cột trong gấu trúc
Trong phần này, bạn sẽ biết tất cả các bước cần thiết để tìm giá trị trung bình của cột trong pandas
Bước 1. Nhập thư viện
Bước đầu tiên là nhập tất cả các thư viện cần thiết để triển khai. Tôi chỉ đang sử dụng thư viện gấu trúc nên hãy nhập nó. Trong python, bạn có thể nhập các gói bằng câu lệnh nhập
________số 8Bước 2. Tạo một khung dữ liệu giả
Bước thứ hai là tạo một khung dữ liệu mẫu nơi bạn sẽ tìm thấy giá trị trung bình. Đảm bảo tập dữ liệu phải chứa các bản ghi số trên ít nhất một cột, nếu không, giá trị trung bình sẽ không được tính