Khung dữ liệu Pandas là cấu trúc dữ liệu 2 chiều, giống như mảng 2 chiều hoặc bảng có hàng và cột
Thí dụ
Tạo một Khung dữ liệu Pandas đơn giản
nhập gấu trúc dưới dạng pd
data = {
"calo". [420, 380, 390],
"thời lượng". [50, 40, 45]
}
#load dữ liệu vào đối tượng DataFrame.
df = pd. Khung dữ liệu[dữ liệu]
in [df]
Kết quả
calories duration 0 420 50 1 380 40 2 390 45Tự mình thử »
Xác định vị trí hàng
Như bạn có thể thấy từ kết quả ở trên, DataFrame giống như một bảng có các hàng và cột
Pandas sử dụng thuộc tính loc
để trả về một hoặc nhiều hàng được chỉ định
Thí dụ
Trả về hàng 0
#tham khảo chỉ mục hàng.
in[df. loc[0]]
Kết quả
calories 420 duration 50 Name: 0, dtype: int64Tự mình thử »
Ghi chú. Ví dụ này trả về Chuỗi Pandas
Thí dụ
Trả về hàng 0 và 1
#use danh sách chỉ mục.
in[df. loc[[0, 1]]]
Kết quả
calories duration 0 420 50 1 380 40Tự mình thử »
Ghi chú. Khi sử dụng []
, kết quả là một Khung dữ liệu Pandas
Chỉ mục được đặt tên
Với đối số index
, bạn có thể đặt tên cho các chỉ mục của riêng mình
Thí dụ
Thêm danh sách tên để đặt tên cho mỗi hàng
nhập gấu trúc dưới dạng pd
data = {
"calo". [420, 380, 390],
"thời lượng". [50, 40, 45]
}
df = pd. DataFrame[data, index = ["day1", "day2", "day3"]]
in [df]
Kết quả
calories duration day1 420 50 day2 380 40 day3 390 45Tự mình thử »
Xác định vị trí các chỉ mục được đặt tên
Sử dụng chỉ mục được đặt tên trong thuộc tính loc
để trả về [các] hàng đã chỉ định
Thí dụ
Trả về "ngày2"
#tham khảo chỉ mục được đặt tên.
in[df. loc["day2"]]
Kết quả
calories 380 duration 40 Name: 0, dtype: int64Tự mình thử »
Tải tệp vào DataFrame
Nếu bộ dữ liệu của bạn được lưu trữ trong một tệp, Pandas có thể tải chúng vào DataFrame
Thí dụ
Tải tệp được phân tách bằng dấu phẩy [tệp CSV] vào DataFrame
nhập gấu trúc dưới dạng pd
df = pd. read_csv['dữ liệu. csv']
in [df]
Tự mình thử »Bạn sẽ tìm hiểu thêm về cách nhập tệp trong các chương tiếp theo
Kiểm tra bản thân với các bài tập
Bài tập
Chèn đúng phương thức Pandas để tạo DataFrame
Cung cấp câu trả lời "
bắt đầu bài tập
Khi in một khung dữ liệu, theo mặc định, chỉ mục sẽ xuất hiện cùng với đầu ra nhưng chỉ mục này có thể bị xóa nếu cần. Để in khung dữ liệu không có tham số chỉ mục indices trong to_string[] phải được đặt thành Sai
cú pháp.
df. to_string[chỉ mục = Sai]
Tiếp cận
- Nhập mô-đun
- Tạo một khung dữ liệu đơn giản
- Đặt chỉ mục thành false trong to_string[]
- Kết quả in
Thực hiện bằng cách sử dụng phương pháp này được đưa ra dưới đây
ví dụ 1.
Python3
import
calories 420 duration 50 Name: 0, dtype: int640
calories 420 duration 50 Name: 0, dtype: int641
calories 420 duration 50 Name: 0, dtype: int642
calories 420 duration 50 Name: 0, dtype: int643_______14
calories 420 duration 50 Name: 0, dtype: int645
calories 420 duration 50 Name: 0, dtype: int646
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int648
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6401
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6403
calories 420 duration 50 Name: 0, dtype: int647
________ 105 ________ 106 ________ 107
calories 420 duration 50 Name: 0, dtype: int6408
calories 420 duration 50 Name: 0, dtype: int6409
calories 420 duration 50 Name: 0, dtype: int645_______111
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6413
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6413
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6417
calories 420 duration 50 Name: 0, dtype: int6418
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6411
calories 420 duration 50 Name: 0, dtype: int6421
calories 420 duration 50 Name: 0, dtype: int6422
calories 420 duration 50 Name: 0, dtype: int6423
calories 420 duration 50 Name: 0, dtype: int642
calories 420 duration 50 Name: 0, dtype: int6425
calories 420 duration 50 Name: 0, dtype: int6426
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6428
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6430
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6432
calories 420 duration 50 Name: 0, dtype: int647
calories 420 duration 50 Name: 0, dtype: int6434
calories 420 duration 50 Name: 0, dtype: int6435
Pandas trong Python có khả năng chuyển đổi Pandas DataFrame thành một bảng trong trang web HTML. gấu trúc. Khung dữ liệu. phương thức to_html[] được sử dụng để hiển thị Khung dữ liệu Pandas
Cú pháp. Khung dữ liệu. to_html[]
Quay lại. Trả về định dạng html của khung dữ liệu.
Hãy hiểu với các ví dụ
Đầu tiên, tạo một Dataframe
Python3
loc
5
import
calories 420 duration 50 Name: 0, dtype: int640
loc
8 loc
9import
[]
1
[]
2
[]
3
loc
50loc
51 loc
52_______553loc
54loc
55____556loc
57loc
56loc
59import
0
import
1import
2____556import
4import
5
import
6
import
7import
8loc
54
calories 420 duration 50 Name: 0, dtype: int6400
loc
56calories 420 duration 50 Name: 0, dtype: int6402
loc
56calories 420 duration 50 Name: 0, dtype: int6404
loc
56calories 420 duration 50 Name: 0, dtype: int6406
calories 420 duration 50 Name: 0, dtype: int6407____556
calories 420 duration 50 Name: 0, dtype: int6400
import
5import
6
import
7loc
83loc
54loc
85loc
56loc
87loc
56loc
89loc
56loc
91loc
56loc
93import
5
import
6
import
7loc
97loc
54loc
99loc
56import
1loc
56import
3loc
56import
5loc
56import
3import
8