Hướng dẫn how do i display a specific column in python? - làm cách nào để hiển thị một cột cụ thể trong python?

Đôi khi, bạn có rất nhiều cột trong DataFrame của mình và chỉ muốn sử dụng một số cột.

Chọn các cột cụ thể

DF [‘COL1]

Lệnh này chọn một cột và trả về nó như một chuỗi

Cột được trả về dưới dạng một loạt

DF [[‘col1]]]

Ở đây, tôi đã chọn cột và tôi nhận được một khung dữ liệu

Cột được trả về dưới dạng DataFrame

DF [[‘col1,‘ col2,]]

Đây là cùng một lệnh như trên - nhưng lần này, tôi đang chọn nhiều hơn một cột

Hai cột được trả về dưới dạng DataFrame

Chọn một số giá trị nhất định từ một cột

df [df1 [‘col1,] == value]

Bạn chọn tất cả các giá trị trong cột 1 bằng giá trị.

df [df1 [‘col1,]! = value]

Tất cả các giá trị trong cột 1 không bằng giá trị.

df [df1 [‘col1,]

Tất cả các giá trị trong cột 1 nhỏ hơn giá trị.

df [df1 [‘col1,]> giá trị] giá trị]

Tất cả các giá trị trong cột 1 lớn hơn giá trị.

Tất cả các giá trị trong ‘Cảnh sát quận là 8

DF1 [‘col1,] == Giá trị

Tương tự như các lệnh trên, chỉ ở đây bạn nhận được các giá trị Boolean.

Cột được trả về dưới dạng boolean

Chọn một số hàng nhất định

df.ix[index]

Bạn thực sự có thể chọn một hàng bằng cách sử dụng chỉ mục của nó (số ở phía bên trái).

Tôi đã chọn một hàng với chỉ mục ‘0

df.ix [‘tên chỉ mục]]

Lệnh này thực hiện chính xác điều tương tự như trên nhưng bạn sử dụng nó khi bạn thực sự đặt tên cho các chỉ số của mình.

Xóa cột

df.drop ([‘col1, thì col2 '], trục = 1)

Lệnh này xóa các cột cụ thể khỏi DataFrame

Bạn có thể thấy rằng ở đây tôi không có hai hàng mà tôi đã bỏ

del df [‘col1,]

Lệnh này xóa một cột cụ thể khỏi DataFrame và sửa đổi nó - vì vậy hãy cẩn thận cách bạn sử dụng nó.

Bạn có thể thấy rằng cột này đã biến mất

Tất cả các mã có thể được tìm thấy trên github của tôi: https://github.com/kasiarachuta/blog/blob/master/choosing%20specific%20columns

Ảnh của Cristina Gottardi trên unplash

Thao tác khung dữ liệu gấu trúc là một nhiệm vụ phổ biến trong quá trình phân tích khám phá hoặc tiền xử lý trong một dự án khoa học dữ liệu. Lọc và thiết lập tiểu dữ liệu cũng phổ biến. Theo thời gian, tôi đã thấy mình cần chọn các cột dựa trên các tiêu chí khác nhau. Tôi hy vọng độc giả tìm thấy bài viết này như một tài liệu tham khảo.

Ví dụ dữ liệu

Nếu bạn muốn sử dụng dữ liệu tôi đã sử dụng để kiểm tra các phương thức chọn các cột từ khung dữ liệu gấu trúc này, hãy sử dụng đoạn mã bên dưới để đưa bộ dữ liệu rượu vào IDE hoặc máy tính xách tay của bạn.

from sklearn.datasets import load_wine
import pandas as pd
import numpy as np
import re
X = load_wine()
df = pd.DataFrame(X.data, columns = X.feature_names)
df.head()
0Screenshot của tác giả của bộ dữ liệu rượu vang trong một cuốn sổ Jupyter

Bây giờ, tùy thuộc vào những gì bạn muốn làm, hãy xem từng đoạn mã bên dưới và thử cho chính mình!

Chọn các cột dựa trên tên của chúng

Đây là cách cơ bản nhất để chọn một cột duy nhất từ ​​DataFrame, chỉ cần đặt tên chuỗi của cột vào dấu ngoặc. Trả lại một loạt gấu trúc.

df['hue']

Vượt qua danh sách trong dấu ngoặc cho phép bạn chọn nhiều cột cùng một lúc.

df[['alcohol','hue']]

Chọn một tập hợp các cột được tìm thấy trong danh sách

Tương tự như ví dụ trước, nhưng ở đây bạn có thể tìm kiếm trên tất cả các cột trong DataFrame.

df[df.columns[df.columns.isin(['alcohol','hue','NON-EXISTANT COLUMN'])]]

Chọn một tập hợp các cột dựa trên sự khác biệt của các cột

Hãy để nói rằng bạn biết những cột bạn không muốn trong DataFrame. Chuyển những thứ đó làm danh sách cho phương thức khác biệt và bạn sẽ lấy lại mọi thứ trừ chúng.

df[df.columns.difference([‘alcohol’,’hue’])]

Chọn một tập hợp các cột không có trong danh sách

Trả về một khung dữ liệu có các cột không có trong danh sách mà bạn muốn tìm kiếm.

df[df.columns[~df.columns.isin(['alcohol','hue'])]]

Chọn các cột dựa trên kiểu dữ liệu của họ

Các loại dữ liệu bao gồm ‘float64, và‘ đối tượng và được suy ra từ các cột được truyền đến phương thức DTYPES. Bằng cách khớp trên các cột là cùng loại dữ liệu, bạn sẽ nhận được một loạt đúng/sai. Sử dụng phương thức giá trị để chỉ nhận các giá trị đúng/sai chứ không phải chỉ mục.

df.loc[:,(df.dtypes=='float64').values]

Chọn các cột dựa trên tên cột của chúng chứa một chuỗi con

Nếu bạn có hàng tấn cột trong khung dữ liệu và tên cột của chúng đều có một nền tảng tương tự mà bạn quan tâm, bạn có thể trả về các cột mà tên của Lọ có chứa một nền tảng. Ở đây chúng tôi muốn mọi thứ có bộ nền Al Al Al trong đó.

df.loc[:,['al' in i for i in df.columns]]

Chọn các cột dựa trên tên cột của chúng chứa thẻ đại diện chuỗi

Bạn có thể có hàng trăm cột, vì vậy có thể tìm thấy các cột phù hợp với một mẫu. Tìm kiếm các tên cột khớp với ký tự đại diện có thể được thực hiện với chức năng tìm kiếm trên mạng từ gói RE (xem liên kết trong phần tham chiếu để biết thêm chi tiết về việc sử dụng gói biểu thức thông thường).

df.loc[:,[True if re.search('flava+',column) else False for column in df.columns]]

Chọn các cột dựa trên cách tên cột của chúng bắt đầu

Nếu bạn muốn chọn các cột có tên bắt đầu bằng một chuỗi nhất định, bạn có thể sử dụng phương thức StartSwith và chuyển nó ở điểm cột cho vị trí khung dữ liệu.

df.loc[:,df.columns.str.startswith('al')]

Chọn các cột dựa trên cách kết thúc tên cột của họ

Giống như ví dụ cuối cùng, nhưng tìm thấy các cột có tên kết thúc theo một cách nhất định.

df['hue']
0

Chọn cột nếu tất cả các hàng đáp ứng một điều kiện

Bạn có thể chọn các cột nếu các hàng đáp ứng một điều kiện.Ở đây, nếu tất cả các giá trị trong một cột lớn hơn 14, chúng tôi sẽ trả lại cột từ khung dữ liệu.

df['hue']
1

Chọn cột nếu bất kỳ hàng nào của cột đáp ứng điều kiện

Ở đây, nếu bất kỳ giá trị nào trong một cột lớn hơn 14, chúng tôi sẽ trả lại cột từ khung dữ liệu.

df['hue']
2

Chọn cột nếu mức trung bình của các hàng trong một cột đáp ứng một điều kiện

Ở đây, nếu giá trị trung bình của tất cả các giá trị trong một cột đáp ứng một điều kiện, hãy trả lại cột.

df['hue']
3

Cảm ơn đã kiểm tra điều này và cảm thấy thoải mái khi tham khảo nó thường xuyên.

Người giới thiệu