Làm thế nào để bạn kiểm tra ý nghĩa của một cột trong python?

Thật không may khi đề cập đến 'hàng' và 'cột' trong gấu trúc có thể gây nhầm lẫn. Cách tôi nghĩ là 'bạn muốn vượt qua trục nào để lấy giá trị trung bình?'

Có nghĩa là, nếu bạn muốn vượt qua các hàng và lấy giá trị trung bình của cột, thì bạn cần đặt axis='index' hoặc axis=0. Điều này có nghĩa là bạn nhảy qua các hàng và lấy cột trung bình

Tiếp theo, bạn sẽ thấy một ví dụ với các bước để lấy giá trị trung bình của từng cột và hàng cho một DataFrame nhất định

Các bước để lấy Trung bình của từng Cột và Hàng trong Pandas DataFrame

Bước 1. Chuẩn bị dữ liệu

Để bắt đầu, hãy chuẩn bị dữ liệu cần tính trung bình

Ví dụ: giả sử bạn có dữ liệu sau về tiền hoa hồng mà 3 người kiếm được [trong 6 tháng đầu năm]

montha_commission b_commission c_commission Jan7000100003000Feb550075006000Mar600065004500Apr450060004500May800090004000Jun600085005500

Mục tiêu là để có được mức trung bình của hoa hồng kiếm được

  • Đối với mỗi người trong 6 tháng đầu tiên [trung bình theo cột]
  • Mỗi tháng cho tất cả mọi người [trung bình theo hàng]

Bước 2. Tạo một khung dữ liệu

Tiếp theo, tạo DataFrame để thu thập dữ liệu trên bằng Python

import pandas as pd

data = {'month': ['Jan ','Feb ','Mar ','Apr ','May ','Jun '],
        'a_commission': [7000,5500,6000,4500,8000,6000],
        'b_commission': [10000,7500,6500,6000,9000,8500], 
        'c_commission': [3000,6000,4500,4500,4000,5500]
        }

df = pd.DataFrame[data]
print [df]

Chạy mã bằng Python và bạn sẽ nhận được DataFrame sau

  month  a_commission  b_commission  c_commission
0  Jan           7000         10000          3000
1  Feb           5500          7500          6000
2  Mar           6000          6500          4500
3  Apr           4500          6000          4500
4  May           8000          9000          4000
5  Jun           6000          8500          5500

Bước 3. Lấy giá trị trung bình của từng cột và hàng trong Pandas DataFrame

Sau đó, bạn có thể áp dụng cú pháp sau để lấy giá trị trung bình của mỗi cột

df.mean[axis=0]

Đây là mã Python hoàn chỉnh để nhận hoa hồng trung bình mà mỗi người kiếm được trong 6 tháng đầu tiên [trung bình theo cột]

import pandas as pd

data = {'month': ['Jan ','Feb ','Mar ','Apr ','May ','Jun '],
        'a_commission': [7000,5500,6000,4500,8000,6000],
        'b_commission': [10000,7500,6500,6000,9000,8500], 
        'c_commission': [3000,6000,4500,4500,4000,5500]
        }

df = pd.DataFrame[data]

av_column = df.mean[axis=0]
print [av_column]

Chạy mã và bạn sẽ nhận được hoa hồng trung bình cho mỗi người

a_commission    6166.666667
b_commission    7916.666667
c_commission    4583.333333

Ngoài ra, bạn có thể lấy giá trị trung bình của mỗi hàng bằng cú pháp sau

df.mean[axis=1]

Đây là mã để nhận hoa hồng trung bình kiếm được mỗi tháng cho tất cả mọi người [trung bình theo hàng]

import pandas as pd

data = {'month': ['Jan ','Feb ','Mar ','Apr ','May ','Jun '],
        'a_commission': [7000,5500,6000,4500,8000,6000],
        'b_commission': [10000,7500,6500,6000,9000,8500], 
        'c_commission': [3000,6000,4500,4500,4000,5500]
        }

df = pd.DataFrame[data, index =['Jan ','Feb ','Mar ','Apr ','May ','Jun ']]

av_row = df.mean[axis=1]
print [av_row]

Khi bạn chạy mã bằng Python, bạn sẽ nhận được hoa hồng trung bình kiếm được mỗi tháng

Jan     6666.666667
Feb     6333.333333
Mar     5666.666667
Apr     5000.000000
May     7000.000000
Jun     6666.666667

Bạn cũng có thể muốn xem hướng dẫn sau giải thích các bước để lấy tổng của từng cột và hàng trong Pandas DataFrame

Pandas là một thư viện python tuyệt vời để thao tác dữ liệu trong tập dữ liệu. Để làm được như vậy có rất nhiều hàm trong đó và thực hiện các thao tác. Giả sử bạn có một tập dữ liệu số hoặc khung dữ liệu và muốn tìm giá trị trung bình trên toàn bộ hoặc cột cụ thể của tập dữ liệu thì bạn có thể làm như vậy bằng cách sử dụng gấu trúc. Trong toàn bộ hướng dẫn này, bạn sẽ biết cách tính trung bình cộng của các cột trong pandas với các bước

Các bước để tính trung bình của cột trong gấu trúc

Trong phần này, bạn sẽ biết tất cả các bước cần thiết để tìm giá trị trung bình của cột trong pandas

Bước 1. Nhập thư viện

Bước đầu tiên là nhập tất cả các thư viện cần thiết để triển khai. Tôi chỉ đang sử dụng thư viện gấu trúc nên hãy nhập nó. Trong python, bạn có thể nhập các gói bằng câu lệnh nhập

________số 8

Bước 2. Tạo một khung dữ liệu giả

Bước thứ hai là tạo một khung dữ liệu mẫu nơi bạn sẽ tìm thấy giá trị trung bình. Đảm bảo tập dữ liệu phải chứa các bản ghi số trên ít nhất một cột, nếu không, giá trị trung bình sẽ không được tính

Chủ Đề