Vì nhiều người dùng pandas tiềm năng đã quen thuộc với các chương trình bảng tính như Excel, nên trang này nhằm cung cấp một số ví dụ về cách các hoạt động bảng tính khác nhau sẽ được thực hiện bằng cách sử dụng pandas. Trang này sẽ sử dụng thuật ngữ và liên kết đến tài liệu dành cho Excel, nhưng nhiều phần sẽ giống/tương tự trong Google Trang tính, LibreOffice Calc, Apple Numbers và phần mềm bảng tính tương thích với Excel khác
Nếu bạn chưa quen với gấu trúc, trước tiên bạn có thể muốn đọc qua để làm quen với thư viện
Theo thông lệ, chúng tôi nhập gấu trúc và NumPy như sau
In [1]: import pandas as pd In [2]: import numpy as np
Cấu trúc dữ liệu
Dịch thuật ngữ chung
gấu trúc
Excel
df.sort_values["col1", inplace=True]4
bảng tính
df.sort_values["col1", inplace=True]5
cột
df.sort_values["col1", inplace=True]6
tiêu đề hàng
chèo thuyền
chèo thuyền
df.sort_values["col1", inplace=True]7
ô trống
df.sort_values["col1", inplace=True]
4
Một
df.sort_values["col1", inplace=True]4 trong pandas tương tự như một trang tính Excel. Trong khi sổ làm việc Excel có thể chứa nhiều trang tính, gấu trúc
df.sort_values["col1", inplace=True]4 tồn tại độc lập
df.sort_values["col1", inplace=True]
5
Một
df.sort_values["col1", inplace=True]5 là cấu trúc dữ liệu đại diện cho một cột của một
df.sort_values["col1", inplace=True]4. Làm việc với một
df.sort_values["col1", inplace=True]5 tương tự như việc tham chiếu một cột của bảng tính
df.sort_values["col1", inplace=True]
6
Mỗi
df.sort_values["col1", inplace=True]4 và
df.sort_values["col1", inplace=True]5 có một
df.sort_values["col1", inplace=True]6, là các nhãn trên các hàng dữ liệu. Trong pandas, nếu không có chỉ mục nào được chỉ định, thì a được sử dụng theo mặc định [hàng đầu tiên = 0, hàng thứ hai = 1, v.v.], tương tự như tiêu đề/số hàng trong bảng tính
Trong gấu trúc, các chỉ mục có thể được đặt thành một [hoặc nhiều] giá trị duy nhất, giống như có một cột được sử dụng làm định danh hàng trong trang tính. Không giống như hầu hết các bảng tính, các giá trị
df.sort_values["col1", inplace=True]6 này thực sự có thể được sử dụng để tham chiếu các hàng. [Lưu ý rằng điều này có thể được thực hiện trong Excel với tham chiếu có cấu trúc. ] Ví dụ: trong bảng tính, bạn sẽ tham chiếu hàng đầu tiên là
In [5]: url = [ ...: "//raw.githubusercontent.com/pandas-dev" ...: "/pandas/main/pandas/tests/io/data/csv/tips.csv" ...: ] ...: In [6]: tips = pd.read_csv[url] In [7]: tips Out[7]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 4 . .. .. .. .. .. .. ... 239 29.03 5.92 Male No Sat Dinner 3 240 27.18 2.00 Female Yes Sat Dinner 2 241 22.67 2.00 Male Yes Sat Dinner 2 242 17.82 1.75 Male No Sat Dinner 2 243 18.78 3.00 Female No Thur Dinner 2 [244 rows x 7 columns]1, trong khi ở gấu trúc, bạn có thể sử dụng
In [5]: url = [ ...: "//raw.githubusercontent.com/pandas-dev" ...: "/pandas/main/pandas/tests/io/data/csv/tips.csv" ...: ] ...: In [6]: tips = pd.read_csv[url] In [7]: tips Out[7]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 4 . .. .. .. .. .. .. ... 239 29.03 5.92 Male No Sat Dinner 3 240 27.18 2.00 Female Yes Sat Dinner 2 241 22.67 2.00 Male Yes Sat Dinner 2 242 17.82 1.75 Male No Sat Dinner 2 243 18.78 3.00 Female No Thur Dinner 2 [244 rows x 7 columns]2
Giá trị chỉ mục cũng cố định, vì vậy nếu bạn sắp xếp lại thứ tự các hàng trong
df.sort_values["col1", inplace=True]4, nhãn cho một hàng cụ thể sẽ không thay đổi
Xem thêm để biết thêm về cách sử dụng
df.sort_values["col1", inplace=True]6 hiệu quả
Bản sao so với. hoạt động tại chỗ
Hầu hết các hoạt động của gấu trúc đều trả về các bản sao của
df.sort_values["col1", inplace=True]5/
df.sort_values["col1", inplace=True]4. Để thực hiện các thay đổi "dính", bạn sẽ cần gán cho một biến mới
sorted_df = df.sort_values["col1"]
hoặc ghi đè lên bản gốc
df = df.sort_values["col1"]
Ghi chú
Bạn sẽ thấy đối số từ khóa
In [5]: url = [ ...: "//raw.githubusercontent.com/pandas-dev" ...: "/pandas/main/pandas/tests/io/data/csv/tips.csv" ...: ] ...: In [6]: tips = pd.read_csv[url] In [7]: tips Out[7]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 4 . .. .. .. .. .. .. ... 239 29.03 5.92 Male No Sat Dinner 3 240 27.18 2.00 Female Yes Sat Dinner 2 241 22.67 2.00 Male Yes Sat Dinner 2 242 17.82 1.75 Male No Sat Dinner 2 243 18.78 3.00 Female No Thur Dinner 2 [244 rows x 7 columns]7 có sẵn cho một số phương thức
df.sort_values["col1", inplace=True]
Việc sử dụng nó không được khuyến khích.
Nhập/xuất dữ liệu
Xây dựng DataFrame từ các giá trị
Trong một bảng tính, các giá trị có thể được nhập trực tiếp vào các ô
Một pandas
df.sort_values["col1", inplace=True]4 có thể được xây dựng theo nhiều cách khác nhau, nhưng đối với một số lượng nhỏ giá trị, thường thuận tiện khi chỉ định nó dưới dạng từ điển Python, trong đó các khóa là tên cột và giá trị là dữ liệu
In [3]: df = pd.DataFrame[{"x": [1, 3, 5], "y": [2, 4, 6]}] In [4]: df Out[4]: x y 0 1 2 1 3 4 2 5 6
Đọc dữ liệu bên ngoài
Cả Excel và có thể nhập dữ liệu từ nhiều nguồn ở nhiều định dạng khác nhau
CSV
Hãy tải và hiển thị tập dữ liệu mẹo từ các bài kiểm tra gấu trúc, đây là tệp CSV. Trong Excel, bạn sẽ tải xuống và sau đó mở CSV. Trong gấu trúc, bạn chuyển URL hoặc đường dẫn cục bộ của tệp CSV tới
In [5]: url = [ ...: "//raw.githubusercontent.com/pandas-dev" ...: "/pandas/main/pandas/tests/io/data/csv/tips.csv" ...: ] ...: In [6]: tips = pd.read_csv[url] In [7]: tips Out[7]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 4 . .. .. .. .. .. .. ... 239 29.03 5.92 Male No Sat Dinner 3 240 27.18 2.00 Female Yes Sat Dinner 2 241 22.67 2.00 Male Yes Sat Dinner 2 242 17.82 1.75 Male No Sat Dinner 2 243 18.78 3.00 Female No Thur Dinner 2 [244 rows x 7 columns]
Giống như Trình hướng dẫn nhập văn bản của Excel,
tips = pd.read_csv["tips.csv", sep="\t", header=None] # alternatively, read_table is an alias to read_csv with tab delimiter tips = pd.read_table["tips.csv", header=None]0 có thể nhận một số tham số để chỉ định cách phân tích cú pháp dữ liệu. Ví dụ: nếu dữ liệu thay vào đó được phân cách bằng tab và không có tên cột, thì lệnh pandas sẽ là
tips = pd.read_csv["tips.csv", sep="\t", header=None] # alternatively, read_table is an alias to read_csv with tab delimiter tips = pd.read_table["tips.csv", header=None]
tập tin excel
Excel mở các định dạng tệp Excel khác nhau bằng cách bấm đúp vào chúng hoặc sử dụng menu Mở. Trong gấu trúc, bạn sử dụng
Trước tiên hãy dựa trên khung dữ liệu
tips = pd.read_csv["tips.csv", sep="\t", header=None] # alternatively, read_table is an alias to read_csv with tab delimiter tips = pd.read_table["tips.csv", header=None]1 trong ví dụ trên
tips.to_excel["./tips.xlsx"]
Nếu sau đó bạn muốn truy cập dữ liệu trong tệp
tips = pd.read_csv["tips.csv", sep="\t", header=None] # alternatively, read_table is an alias to read_csv with tab delimiter tips = pd.read_table["tips.csv", header=None]2, bạn có thể đọc nó trong mô-đun của mình bằng cách sử dụng
tips_df = pd.read_excel["./tips.xlsx", index_col=0]
Bạn vừa đọc trong tệp Excel bằng pandas
giới hạn đầu ra
Các chương trình bảng tính sẽ chỉ hiển thị một màn hình dữ liệu tại một thời điểm và sau đó cho phép bạn cuộn, do đó thực sự không cần phải giới hạn đầu ra. Trong pandas, bạn sẽ cần suy nghĩ nhiều hơn một chút về việc kiểm soát cách hiển thị các
df.sort_values["col1", inplace=True]4 của mình
Theo mặc định, gấu trúc sẽ cắt bớt đầu ra của các
df.sort_values["col1", inplace=True]4 lớn để hiển thị hàng đầu tiên và hàng cuối cùng. Điều này có thể được ghi đè bởi, hoặc sử dụng hoặc
In [8]: tips.head[5] Out[8]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 4
xuất dữ liệu
Theo mặc định, phần mềm bảng tính trên máy tính để bàn sẽ lưu ở định dạng tệp tương ứng [
tips = pd.read_csv["tips.csv", sep="\t", header=None] # alternatively, read_table is an alias to read_csv with tab delimiter tips = pd.read_table["tips.csv", header=None]7,
tips = pd.read_csv["tips.csv", sep="\t", header=None] # alternatively, read_table is an alias to read_csv with tab delimiter tips = pd.read_table["tips.csv", header=None]8, v.v.]. Tuy nhiên, bạn có thể lưu vào các định dạng tệp khác
, , hoặc là
hoạt động dữ liệu
Các thao tác trên cột
Trong bảng tính, các công thức thường được tạo trong các ô riêng lẻ và sau đó được kéo vào các ô khác để tính toán chúng cho các cột khác. Trong gấu trúc, bạn có thể trực tiếp thực hiện các thao tác trên toàn bộ cột
gấu trúc cung cấp các hoạt động vector hóa bằng cách chỉ định cá nhân
df.sort_values["col1", inplace=True]5 trong
df.sort_values["col1", inplace=True]4. Các cột mới có thể được chỉ định theo cùng một cách. Phương pháp loại bỏ một cột từ
df.sort_values["col1", inplace=True]4
sorted_df = df.sort_values["col1"]0
Lưu ý rằng chúng ta không cần phải yêu cầu nó thực hiện phép trừ đó theo từng ô - gấu trúc xử lý việc đó cho chúng ta. Thấy
lọc
Trong Excel, việc lọc được thực hiện thông qua menu đồ họa
DataFrames có thể được lọc theo nhiều cách;
sorted_df = df.sort_values["col1"]1
Câu lệnh trên chỉ đơn giản là chuyển một
df.sort_values["col1", inplace=True]5 trong số các đối tượng
tips.to_excel["./tips.xlsx"]4/
tips.to_excel["./tips.xlsx"]5 vào DataFrame, trả về tất cả các hàng có
tips.to_excel["./tips.xlsx"]4
sorted_df = df.sort_values["col1"]2
logic nếu/thì
Giả sử chúng ta muốn tạo một cột
tips.to_excel["./tips.xlsx"]7 với các giá trị của
tips.to_excel["./tips.xlsx"]8 và
tips.to_excel["./tips.xlsx"]9, dựa trên việc liệu ______35_______0 ít hơn hay nhiều hơn $10
Trong bảng tính, so sánh logic có thể được thực hiện với các công thức có điều kiện. Chúng tôi sẽ sử dụng công thức của
tips_df = pd.read_excel["./tips.xlsx", index_col=0]1, được kéo đến tất cả các ô trong cột
tips.to_excel["./tips.xlsx"]7 mới
Hoạt động tương tự ở gấu trúc có thể được thực hiện bằng cách sử dụng phương pháp
tips_df = pd.read_excel["./tips.xlsx", index_col=0]3 từ
tips_df = pd.read_excel["./tips.xlsx", index_col=0]4
sorted_df = df.sort_values["col1"]3
chức năng ngày
Phần này sẽ đề cập đến "ngày", nhưng dấu thời gian được xử lý tương tự
Chúng ta có thể nghĩ về chức năng ngày trong hai phần. phân tích cú pháp và đầu ra. Trong bảng tính, giá trị ngày thường được phân tích cú pháp tự động, mặc dù có hàm DATEVALUE nếu bạn cần. Trong gấu trúc, bạn cần chuyển đổi rõ ràng văn bản thuần túy thành các đối tượng ngày giờ hoặc
Sau khi được phân tích cú pháp, bảng tính hiển thị ngày ở định dạng mặc định, mặc dù định dạng có thể được thay đổi. Trong pandas, bạn thường muốn giữ ngày tháng dưới dạng đối tượng
tips_df = pd.read_excel["./tips.xlsx", index_col=0]5 trong khi thực hiện các phép tính với chúng. Việc xuất các phần của ngày [chẳng hạn như năm] được thực hiện thông qua các hàm ngày trong bảng tính và trong gấu trúc
Đưa ra
tips_df = pd.read_excel["./tips.xlsx", index_col=0]6 và
tips_df = pd.read_excel["./tips.xlsx", index_col=0]7 trong các cột
tips_df = pd.read_excel["./tips.xlsx", index_col=0]8 và
tips_df = pd.read_excel["./tips.xlsx", index_col=0]9 của bảng tính, bạn có thể có các công thức này
cột
công thức
In [8]: tips.head[5] Out[8]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 40
In [8]: tips.head[5] Out[8]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 41
In [8]: tips.head[5] Out[8]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 42
In [8]: tips.head[5] Out[8]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 43
In [8]: tips.head[5] Out[8]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 44
In [8]: tips.head[5] Out[8]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 45
In [8]: tips.head[5] Out[8]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 46
In [8]: tips.head[5] Out[8]: total_bill tip sex smoker day time size 0 16.99 1.01 Female No Sun Dinner 2 1 10.34 1.66 Male No Sun Dinner 3 2 21.01 3.50 Male No Sun Dinner 3 3 23.68 3.31 Male No Sun Dinner 2 4 24.59 3.61 Female No Sun Dinner 47
Các hoạt động gấu trúc tương đương được hiển thị bên dưới
sorted_df = df.sort_values["col1"]4
Xem để biết thêm chi tiết
Lựa chọn các cột
Trong bảng tính, bạn có thể chọn các cột bạn muốn theo
Ẩn cột
Xóa cột
Tham chiếu một phạm vi từ một trang tính sang một trang tính khác
Vì các cột bảng tính thường được đặt tên trong hàng tiêu đề, nên việc đổi tên cột chỉ đơn giản là thay đổi văn bản trong ô đầu tiên đó
Các hoạt động tương tự được thể hiện trong gấu trúc bên dưới
Giữ các cột nhất định
sorted_df = df.sort_values["col1"]5
Thả một cột
sorted_df = df.sort_values["col1"]6
Đổi tên một cột
sorted_df = df.sort_values["col1"]7
Sắp xếp theo giá trị
Sắp xếp trong bảng tính được thực hiện thông qua hộp thoại sắp xếp
pandas có một phương thức lấy danh sách các cột để sắp xếp theo
sorted_df = df.sort_values["col1"]8
xử lý chuỗi
Tìm chiều dài của chuỗi
Trong bảng tính, có thể tìm số ký tự trong văn bản bằng hàm LEN. Điều này có thể được sử dụng với chức năng TRIM để loại bỏ khoảng trắng thừa
sorted_df = df.sort_values["col1"]9
Bạn có thể tìm độ dài của một chuỗi ký tự với. Trong Python 3, tất cả các chuỗi đều là chuỗi Unicode.
sorted_df = df.sort_values["col1"]00 bao gồm các khoảng trống ở cuối. Sử dụng
sorted_df = df.sort_values["col1"]00 và
sorted_df = df.sort_values["col1"]02 để loại trừ các khoảng trống ở cuối
df = df.sort_values["col1"]0
Lưu ý rằng điều này sẽ vẫn bao gồm nhiều khoảng trắng trong chuỗi, vì vậy không tương đương 100%
Tìm vị trí của chuỗi con
Hàm bảng tính TÌM trả về vị trí của một chuỗi con, với ký tự đầu tiên là
sorted_df = df.sort_values["col1"]03
Bạn có thể tìm vị trí của một ký tự trong một cột chuỗi bằng phương thức.
sorted_df = df.sort_values["col1"]05 tìm kiếm vị trí đầu tiên của chuỗi con. Nếu chuỗi con được tìm thấy, phương thức sẽ trả về vị trí của nó. Nếu không tìm thấy, nó trả về
sorted_df = df.sort_values["col1"]06. Hãy nhớ rằng các chỉ mục Python không dựa trên
df = df.sort_values["col1"]1
Trích xuất chuỗi con theo vị trí
Bảng tính có công thức MID để trích xuất một chuỗi con từ một vị trí nhất định. Để có được ký tự đầu tiên
df = df.sort_values["col1"]2
Với gấu trúc, bạn có thể sử dụng ký hiệu
sorted_df = df.sort_values["col1"]07 để trích xuất chuỗi con từ chuỗi theo vị trí vị trí. Hãy nhớ rằng các chỉ mục Python không dựa trên
df = df.sort_values["col1"]3
Trích xuất từ thứ n
Trong Excel, bạn có thể sử dụng Trình hướng dẫn chuyển văn bản thành cột để tách văn bản và truy xuất một cột cụ thể. [Lưu ý rằng bạn cũng có thể làm như vậy thông qua một công thức. ]
Cách đơn giản nhất để trích xuất các từ trong gấu trúc là chia các chuỗi theo khoảng trắng, sau đó tham chiếu từ theo chỉ mục. Lưu ý rằng có nhiều cách tiếp cận mạnh mẽ hơn nếu bạn cần chúng
df = df.sort_values["col1"]4
Trường hợp thay đổi
Bảng tính cung cấp các hàm UPPER, LOWER và PROPER để chuyển đổi văn bản thành chữ hoa, chữ thường và chữ hoa tiêu đề tương ứng
Các phương thức pandas tương đương là , , và
df = df.sort_values["col1"]5
sáp nhập
Các bảng sau đây sẽ được sử dụng trong các ví dụ hợp nhất
df = df.sort_values["col1"]6
Trong Excel, việc hợp nhất các bảng có thể được thực hiện thông qua hàm VLOOKUP
pandas DataFrames có một phương thức cung cấp chức năng tương tự. Dữ liệu không cần phải được sắp xếp trước và các loại liên kết khác nhau được thực hiện thông qua từ khóa
sorted_df = df.sort_values["col1"]12
df = df.sort_values["col1"]7
sorted_df = df.sort_values["col1"]13 có một số lợi thế so với
sorted_df = df.sort_values["col1"]14
Giá trị tra cứu không cần phải là cột đầu tiên của bảng tra cứu
Nếu nhiều hàng được so khớp, sẽ có một hàng cho mỗi hàng khớp, thay vì chỉ hàng đầu tiên
Nó sẽ bao gồm tất cả các cột từ bảng tra cứu, thay vì chỉ một cột được chỉ định
Nó hỗ trợ
Những ý kiến khác
Xử lý điền
Tạo một dãy số theo mẫu đã đặt trong một nhóm ô nhất định. Trong bảng tính, điều này sẽ được thực hiện bằng cách shift+kéo sau khi nhập số đầu tiên hoặc bằng cách nhập hai hoặc ba giá trị đầu tiên rồi kéo
Điều này có thể đạt được bằng cách tạo một chuỗi và gán nó cho các ô mong muốn
df = df.sort_values["col1"]8
Thả bản sao
Excel có chức năng tích hợp để loại bỏ các giá trị trùng lặp. Điều này được hỗ trợ trong gấu trúc thông qua
df = df.sort_values["col1"]9
Bảng tổng hợp
PivotTable từ bảng tính có thể được sao chép trong gấu trúc thông qua. Sử dụng lại tập dữ liệu
tips = pd.read_csv["tips.csv", sep="\t", header=None] # alternatively, read_table is an alias to read_csv with tab delimiter tips = pd.read_table["tips.csv", header=None]1, hãy tìm tiền thưởng trung bình theo quy mô của bữa tiệc và giới tính của người phục vụ
Trong Excel, chúng tôi sử dụng cấu hình sau cho PivotTable
Tương đương ở gấu trúc
df.sort_values["col1", inplace=True]0
Thêm một hàng
Giả sử chúng ta đang sử dụng [được đánh số là
sorted_df = df.sort_values["col1"]18,
sorted_df = df.sort_values["col1"]03, v.v. ], chúng ta có thể sử dụng để thêm một hàng vào cuối của một
df.sort_values["col1", inplace=True]4
df.sort_values["col1", inplace=True]1
Tìm và thay thế
Hộp thoại Tìm của Excel sẽ đưa bạn đến từng ô phù hợp. Trong pandas, thao tác này thường được thực hiện cho toàn bộ cột hoặc
df.sort_values["col1", inplace=True]4 cùng một lúc cho đến hết