Pandas có thể thay thế Excel không

Vì nhiều người dùng pandas tiềm năng đã quen thuộc với các chương trình bảng tính như Excel, nên trang này nhằm cung cấp một số ví dụ về cách các hoạt động bảng tính khác nhau sẽ được thực hiện bằng cách sử dụng pandas. Trang này sẽ sử dụng thuật ngữ và liên kết đến tài liệu dành cho Excel, nhưng nhiều phần sẽ giống/tương tự trong Google Trang tính, LibreOffice Calc, Apple Numbers và phần mềm bảng tính tương thích với Excel khác

Nếu bạn chưa quen với gấu trúc, trước tiên bạn có thể muốn đọc qua để làm quen với thư viện

Theo thông lệ, chúng tôi nhập gấu trúc và NumPy như sau

In [1]: import pandas as pd

In [2]: import numpy as np

Cấu trúc dữ liệu

Dịch thuật ngữ chung

gấu trúc

Excel

df.sort_values["col1", inplace=True]
4

bảng tính

df.sort_values["col1", inplace=True]
5

cột

df.sort_values["col1", inplace=True]
6

tiêu đề hàng

chèo thuyền

chèo thuyền

df.sort_values["col1", inplace=True]
7

ô trống

df.sort_values["col1", inplace=True]
4

Một

df.sort_values["col1", inplace=True]
4 trong pandas tương tự như một trang tính Excel. Trong khi sổ làm việc Excel có thể chứa nhiều trang tính, gấu trúc
df.sort_values["col1", inplace=True]
4 tồn tại độc lập

df.sort_values["col1", inplace=True]
5

Một

df.sort_values["col1", inplace=True]
5 là cấu trúc dữ liệu đại diện cho một cột của một
df.sort_values["col1", inplace=True]
4. Làm việc với một
df.sort_values["col1", inplace=True]
5 tương tự như việc tham chiếu một cột của bảng tính

df.sort_values["col1", inplace=True]
6

Mỗi

df.sort_values["col1", inplace=True]
4 và
df.sort_values["col1", inplace=True]
5 có một
df.sort_values["col1", inplace=True]
6, là các nhãn trên các hàng dữ liệu. Trong pandas, nếu không có chỉ mục nào được chỉ định, thì a được sử dụng theo mặc định [hàng đầu tiên = 0, hàng thứ hai = 1, v.v.], tương tự như tiêu đề/số hàng trong bảng tính

Trong gấu trúc, các chỉ mục có thể được đặt thành một [hoặc nhiều] giá trị duy nhất, giống như có một cột được sử dụng làm định danh hàng trong trang tính. Không giống như hầu hết các bảng tính, các giá trị

df.sort_values["col1", inplace=True]
6 này thực sự có thể được sử dụng để tham chiếu các hàng. [Lưu ý rằng điều này có thể được thực hiện trong Excel với tham chiếu có cấu trúc. ] Ví dụ: trong bảng tính, bạn sẽ tham chiếu hàng đầu tiên là
In [5]: url = [
   ...:     "//raw.githubusercontent.com/pandas-dev"
   ...:     "/pandas/main/pandas/tests/io/data/csv/tips.csv"
   ...: ]
   ...: 

In [6]: tips = pd.read_csv[url]

In [7]: tips
Out[7]: 
     total_bill   tip     sex smoker   day    time  size
0         16.99  1.01  Female     No   Sun  Dinner     2
1         10.34  1.66    Male     No   Sun  Dinner     3
2         21.01  3.50    Male     No   Sun  Dinner     3
3         23.68  3.31    Male     No   Sun  Dinner     2
4         24.59  3.61  Female     No   Sun  Dinner     4
.          ..   ..     ..    ..   ..     ..   ...
239       29.03  5.92    Male     No   Sat  Dinner     3
240       27.18  2.00  Female    Yes   Sat  Dinner     2
241       22.67  2.00    Male    Yes   Sat  Dinner     2
242       17.82  1.75    Male     No   Sat  Dinner     2
243       18.78  3.00  Female     No  Thur  Dinner     2

[244 rows x 7 columns]
1, trong khi ở gấu trúc, bạn có thể sử dụng
In [5]: url = [
   ...:     "//raw.githubusercontent.com/pandas-dev"
   ...:     "/pandas/main/pandas/tests/io/data/csv/tips.csv"
   ...: ]
   ...: 

In [6]: tips = pd.read_csv[url]

In [7]: tips
Out[7]: 
     total_bill   tip     sex smoker   day    time  size
0         16.99  1.01  Female     No   Sun  Dinner     2
1         10.34  1.66    Male     No   Sun  Dinner     3
2         21.01  3.50    Male     No   Sun  Dinner     3
3         23.68  3.31    Male     No   Sun  Dinner     2
4         24.59  3.61  Female     No   Sun  Dinner     4
.          ..   ..     ..    ..   ..     ..   ...
239       29.03  5.92    Male     No   Sat  Dinner     3
240       27.18  2.00  Female    Yes   Sat  Dinner     2
241       22.67  2.00    Male    Yes   Sat  Dinner     2
242       17.82  1.75    Male     No   Sat  Dinner     2
243       18.78  3.00  Female     No  Thur  Dinner     2

[244 rows x 7 columns]
2

Giá trị chỉ mục cũng cố định, vì vậy nếu bạn sắp xếp lại thứ tự các hàng trong

df.sort_values["col1", inplace=True]
4, nhãn cho một hàng cụ thể sẽ không thay đổi

Xem thêm để biết thêm về cách sử dụng

df.sort_values["col1", inplace=True]
6 hiệu quả

Bản sao so với. hoạt động tại chỗ

Hầu hết các hoạt động của gấu trúc đều trả về các bản sao của

df.sort_values["col1", inplace=True]
5/
df.sort_values["col1", inplace=True]
4. Để thực hiện các thay đổi "dính", bạn sẽ cần gán cho một biến mới

sorted_df = df.sort_values["col1"]

hoặc ghi đè lên bản gốc

df = df.sort_values["col1"]

Ghi chú

Bạn sẽ thấy đối số từ khóa

In [5]: url = [
   ...:     "//raw.githubusercontent.com/pandas-dev"
   ...:     "/pandas/main/pandas/tests/io/data/csv/tips.csv"
   ...: ]
   ...: 

In [6]: tips = pd.read_csv[url]

In [7]: tips
Out[7]: 
     total_bill   tip     sex smoker   day    time  size
0         16.99  1.01  Female     No   Sun  Dinner     2
1         10.34  1.66    Male     No   Sun  Dinner     3
2         21.01  3.50    Male     No   Sun  Dinner     3
3         23.68  3.31    Male     No   Sun  Dinner     2
4         24.59  3.61  Female     No   Sun  Dinner     4
.          ..   ..     ..    ..   ..     ..   ...
239       29.03  5.92    Male     No   Sat  Dinner     3
240       27.18  2.00  Female    Yes   Sat  Dinner     2
241       22.67  2.00    Male    Yes   Sat  Dinner     2
242       17.82  1.75    Male     No   Sat  Dinner     2
243       18.78  3.00  Female     No  Thur  Dinner     2

[244 rows x 7 columns]
7 có sẵn cho một số phương thức

df.sort_values["col1", inplace=True]

Việc sử dụng nó không được khuyến khích.

Nhập/xuất dữ liệu

Xây dựng DataFrame từ các giá trị

Trong một bảng tính, các giá trị có thể được nhập trực tiếp vào các ô

Một pandas

df.sort_values["col1", inplace=True]
4 có thể được xây dựng theo nhiều cách khác nhau, nhưng đối với một số lượng nhỏ giá trị, thường thuận tiện khi chỉ định nó dưới dạng từ điển Python, trong đó các khóa là tên cột và giá trị là dữ liệu

In [3]: df = pd.DataFrame[{"x": [1, 3, 5], "y": [2, 4, 6]}]

In [4]: df
Out[4]: 
   x  y
0  1  2
1  3  4
2  5  6

Đọc dữ liệu bên ngoài

Cả Excel và có thể nhập dữ liệu từ nhiều nguồn ở nhiều định dạng khác nhau

CSV

Hãy tải và hiển thị tập dữ liệu mẹo từ các bài kiểm tra gấu trúc, đây là tệp CSV. Trong Excel, bạn sẽ tải xuống và sau đó mở CSV. Trong gấu trúc, bạn chuyển URL hoặc đường dẫn cục bộ của tệp CSV tới

In [5]: url = [
   ...:     "//raw.githubusercontent.com/pandas-dev"
   ...:     "/pandas/main/pandas/tests/io/data/csv/tips.csv"
   ...: ]
   ...: 

In [6]: tips = pd.read_csv[url]

In [7]: tips
Out[7]: 
     total_bill   tip     sex smoker   day    time  size
0         16.99  1.01  Female     No   Sun  Dinner     2
1         10.34  1.66    Male     No   Sun  Dinner     3
2         21.01  3.50    Male     No   Sun  Dinner     3
3         23.68  3.31    Male     No   Sun  Dinner     2
4         24.59  3.61  Female     No   Sun  Dinner     4
.          ..   ..     ..    ..   ..     ..   ...
239       29.03  5.92    Male     No   Sat  Dinner     3
240       27.18  2.00  Female    Yes   Sat  Dinner     2
241       22.67  2.00    Male    Yes   Sat  Dinner     2
242       17.82  1.75    Male     No   Sat  Dinner     2
243       18.78  3.00  Female     No  Thur  Dinner     2

[244 rows x 7 columns]

Giống như Trình hướng dẫn nhập văn bản của Excel,

tips = pd.read_csv["tips.csv", sep="\t", header=None]

# alternatively, read_table is an alias to read_csv with tab delimiter
tips = pd.read_table["tips.csv", header=None]
0 có thể nhận một số tham số để chỉ định cách phân tích cú pháp dữ liệu. Ví dụ: nếu dữ liệu thay vào đó được phân cách bằng tab và không có tên cột, thì lệnh pandas sẽ là

tips = pd.read_csv["tips.csv", sep="\t", header=None]

# alternatively, read_table is an alias to read_csv with tab delimiter
tips = pd.read_table["tips.csv", header=None]

tập tin excel

Excel mở các định dạng tệp Excel khác nhau bằng cách bấm đúp vào chúng hoặc sử dụng menu Mở. Trong gấu trúc, bạn sử dụng

Trước tiên hãy dựa trên khung dữ liệu

tips = pd.read_csv["tips.csv", sep="\t", header=None]

# alternatively, read_table is an alias to read_csv with tab delimiter
tips = pd.read_table["tips.csv", header=None]
1 trong ví dụ trên

tips.to_excel["./tips.xlsx"]

Nếu sau đó bạn muốn truy cập dữ liệu trong tệp

tips = pd.read_csv["tips.csv", sep="\t", header=None]

# alternatively, read_table is an alias to read_csv with tab delimiter
tips = pd.read_table["tips.csv", header=None]
2, bạn có thể đọc nó trong mô-đun của mình bằng cách sử dụng

tips_df = pd.read_excel["./tips.xlsx", index_col=0]

Bạn vừa đọc trong tệp Excel bằng pandas

giới hạn đầu ra

Các chương trình bảng tính sẽ chỉ hiển thị một màn hình dữ liệu tại một thời điểm và sau đó cho phép bạn cuộn, do đó thực sự không cần phải giới hạn đầu ra. Trong pandas, bạn sẽ cần suy nghĩ nhiều hơn một chút về việc kiểm soát cách hiển thị các

df.sort_values["col1", inplace=True]
4 của mình

Theo mặc định, gấu trúc sẽ cắt bớt đầu ra của các

df.sort_values["col1", inplace=True]
4 lớn để hiển thị hàng đầu tiên và hàng cuối cùng. Điều này có thể được ghi đè bởi, hoặc sử dụng hoặc

In [8]: tips.head[5]
Out[8]: 
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4

xuất dữ liệu

Theo mặc định, phần mềm bảng tính trên máy tính để bàn sẽ lưu ở định dạng tệp tương ứng [

tips = pd.read_csv["tips.csv", sep="\t", header=None]

# alternatively, read_table is an alias to read_csv with tab delimiter
tips = pd.read_table["tips.csv", header=None]
7,
tips = pd.read_csv["tips.csv", sep="\t", header=None]

# alternatively, read_table is an alias to read_csv with tab delimiter
tips = pd.read_table["tips.csv", header=None]
8, v.v.]. Tuy nhiên, bạn có thể lưu vào các định dạng tệp khác

, , hoặc là

hoạt động dữ liệu

Các thao tác trên cột

Trong bảng tính, các công thức thường được tạo trong các ô riêng lẻ và sau đó được kéo vào các ô khác để tính toán chúng cho các cột khác. Trong gấu trúc, bạn có thể trực tiếp thực hiện các thao tác trên toàn bộ cột

gấu trúc cung cấp các hoạt động vector hóa bằng cách chỉ định cá nhân

df.sort_values["col1", inplace=True]
5 trong
df.sort_values["col1", inplace=True]
4. Các cột mới có thể được chỉ định theo cùng một cách. Phương pháp loại bỏ một cột từ
df.sort_values["col1", inplace=True]
4

sorted_df = df.sort_values["col1"]
0

Lưu ý rằng chúng ta không cần phải yêu cầu nó thực hiện phép trừ đó theo từng ô - gấu trúc xử lý việc đó cho chúng ta. Thấy

lọc

Trong Excel, việc lọc được thực hiện thông qua menu đồ họa

DataFrames có thể được lọc theo nhiều cách;

sorted_df = df.sort_values["col1"]
1

Câu lệnh trên chỉ đơn giản là chuyển một

df.sort_values["col1", inplace=True]
5 trong số các đối tượng
tips.to_excel["./tips.xlsx"]
4/
tips.to_excel["./tips.xlsx"]
5 vào DataFrame, trả về tất cả các hàng có
tips.to_excel["./tips.xlsx"]
4

sorted_df = df.sort_values["col1"]
2

logic nếu/thì

Giả sử chúng ta muốn tạo một cột

tips.to_excel["./tips.xlsx"]
7 với các giá trị của
tips.to_excel["./tips.xlsx"]
8 và
tips.to_excel["./tips.xlsx"]
9, dựa trên việc liệu ______35_______0 ít hơn hay nhiều hơn $10

Trong bảng tính, so sánh logic có thể được thực hiện với các công thức có điều kiện. Chúng tôi sẽ sử dụng công thức của

tips_df = pd.read_excel["./tips.xlsx", index_col=0]
1, được kéo đến tất cả các ô trong cột
tips.to_excel["./tips.xlsx"]
7 mới

Hoạt động tương tự ở gấu trúc có thể được thực hiện bằng cách sử dụng phương pháp

tips_df = pd.read_excel["./tips.xlsx", index_col=0]
3 từ
tips_df = pd.read_excel["./tips.xlsx", index_col=0]
4

sorted_df = df.sort_values["col1"]
3

chức năng ngày

Phần này sẽ đề cập đến "ngày", nhưng dấu thời gian được xử lý tương tự

Chúng ta có thể nghĩ về chức năng ngày trong hai phần. phân tích cú pháp và đầu ra. Trong bảng tính, giá trị ngày thường được phân tích cú pháp tự động, mặc dù có hàm DATEVALUE nếu bạn cần. Trong gấu trúc, bạn cần chuyển đổi rõ ràng văn bản thuần túy thành các đối tượng ngày giờ hoặc

Sau khi được phân tích cú pháp, bảng tính hiển thị ngày ở định dạng mặc định, mặc dù định dạng có thể được thay đổi. Trong pandas, bạn thường muốn giữ ngày tháng dưới dạng đối tượng

tips_df = pd.read_excel["./tips.xlsx", index_col=0]
5 trong khi thực hiện các phép tính với chúng. Việc xuất các phần của ngày [chẳng hạn như năm] được thực hiện thông qua các hàm ngày trong bảng tính và trong gấu trúc

Đưa ra

tips_df = pd.read_excel["./tips.xlsx", index_col=0]
6 và
tips_df = pd.read_excel["./tips.xlsx", index_col=0]
7 trong các cột
tips_df = pd.read_excel["./tips.xlsx", index_col=0]
8 và
tips_df = pd.read_excel["./tips.xlsx", index_col=0]
9 của bảng tính, bạn có thể có các công thức này

cột

công thức

In [8]: tips.head[5]
Out[8]: 
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
0

In [8]: tips.head[5]
Out[8]: 
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
1

In [8]: tips.head[5]
Out[8]: 
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
2

In [8]: tips.head[5]
Out[8]: 
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
3

In [8]: tips.head[5]
Out[8]: 
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
4

In [8]: tips.head[5]
Out[8]: 
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
5

In [8]: tips.head[5]
Out[8]: 
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
6

In [8]: tips.head[5]
Out[8]: 
   total_bill   tip     sex smoker  day    time  size
0       16.99  1.01  Female     No  Sun  Dinner     2
1       10.34  1.66    Male     No  Sun  Dinner     3
2       21.01  3.50    Male     No  Sun  Dinner     3
3       23.68  3.31    Male     No  Sun  Dinner     2
4       24.59  3.61  Female     No  Sun  Dinner     4
7

Các hoạt động gấu trúc tương đương được hiển thị bên dưới

sorted_df = df.sort_values["col1"]
4

Xem để biết thêm chi tiết

Lựa chọn các cột

Trong bảng tính, bạn có thể chọn các cột bạn muốn theo

  • Ẩn cột

  • Xóa cột

  • Tham chiếu một phạm vi từ một trang tính sang một trang tính khác

Vì các cột bảng tính thường được đặt tên trong hàng tiêu đề, nên việc đổi tên cột chỉ đơn giản là thay đổi văn bản trong ô đầu tiên đó

Các hoạt động tương tự được thể hiện trong gấu trúc bên dưới

Giữ các cột nhất định

sorted_df = df.sort_values["col1"]
5

Thả một cột

sorted_df = df.sort_values["col1"]
6

Đổi tên một cột

sorted_df = df.sort_values["col1"]
7

Sắp xếp theo giá trị

Sắp xếp trong bảng tính được thực hiện thông qua hộp thoại sắp xếp

pandas có một phương thức lấy danh sách các cột để sắp xếp theo

sorted_df = df.sort_values["col1"]
8

xử lý chuỗi

Tìm chiều dài của chuỗi

Trong bảng tính, có thể tìm số ký tự trong văn bản bằng hàm LEN. Điều này có thể được sử dụng với chức năng TRIM để loại bỏ khoảng trắng thừa

sorted_df = df.sort_values["col1"]
9

Bạn có thể tìm độ dài của một chuỗi ký tự với. Trong Python 3, tất cả các chuỗi đều là chuỗi Unicode.

sorted_df = df.sort_values["col1"]
00 bao gồm các khoảng trống ở cuối. Sử dụng
sorted_df = df.sort_values["col1"]
00 và
sorted_df = df.sort_values["col1"]
02 để loại trừ các khoảng trống ở cuối

df = df.sort_values["col1"]
0

Lưu ý rằng điều này sẽ vẫn bao gồm nhiều khoảng trắng trong chuỗi, vì vậy không tương đương 100%

Tìm vị trí của chuỗi con

Hàm bảng tính TÌM trả về vị trí của một chuỗi con, với ký tự đầu tiên là

sorted_df = df.sort_values["col1"]
03

Bạn có thể tìm vị trí của một ký tự trong một cột chuỗi bằng phương thức.

sorted_df = df.sort_values["col1"]
05 tìm kiếm vị trí đầu tiên của chuỗi con. Nếu chuỗi con được tìm thấy, phương thức sẽ trả về vị trí của nó. Nếu không tìm thấy, nó trả về
sorted_df = df.sort_values["col1"]
06. Hãy nhớ rằng các chỉ mục Python không dựa trên

df = df.sort_values["col1"]
1

Trích xuất chuỗi con theo vị trí

Bảng tính có công thức MID để trích xuất một chuỗi con từ một vị trí nhất định. Để có được ký tự đầu tiên

df = df.sort_values["col1"]
2

Với gấu trúc, bạn có thể sử dụng ký hiệu

sorted_df = df.sort_values["col1"]
07 để trích xuất chuỗi con từ chuỗi theo vị trí vị trí. Hãy nhớ rằng các chỉ mục Python không dựa trên

df = df.sort_values["col1"]
3

Trích xuất từ ​​thứ n

Trong Excel, bạn có thể sử dụng Trình hướng dẫn chuyển văn bản thành cột để tách văn bản và truy xuất một cột cụ thể. [Lưu ý rằng bạn cũng có thể làm như vậy thông qua một công thức. ]

Cách đơn giản nhất để trích xuất các từ trong gấu trúc là chia các chuỗi theo khoảng trắng, sau đó tham chiếu từ theo chỉ mục. Lưu ý rằng có nhiều cách tiếp cận mạnh mẽ hơn nếu bạn cần chúng

df = df.sort_values["col1"]
4

Trường hợp thay đổi

Bảng tính cung cấp các hàm UPPER, LOWER và PROPER để chuyển đổi văn bản thành chữ hoa, chữ thường và chữ hoa tiêu đề tương ứng

Các phương thức pandas tương đương là , , và

df = df.sort_values["col1"]
5

sáp nhập

Các bảng sau đây sẽ được sử dụng trong các ví dụ hợp nhất

df = df.sort_values["col1"]
6

Trong Excel, việc hợp nhất các bảng có thể được thực hiện thông qua hàm VLOOKUP

pandas DataFrames có một phương thức cung cấp chức năng tương tự. Dữ liệu không cần phải được sắp xếp trước và các loại liên kết khác nhau được thực hiện thông qua từ khóa

sorted_df = df.sort_values["col1"]
12

df = df.sort_values["col1"]
7

sorted_df = df.sort_values["col1"]
13 có một số lợi thế so với
sorted_df = df.sort_values["col1"]
14

  • Giá trị tra cứu không cần phải là cột đầu tiên của bảng tra cứu

  • Nếu nhiều hàng được so khớp, sẽ có một hàng cho mỗi hàng khớp, thay vì chỉ hàng đầu tiên

  • Nó sẽ bao gồm tất cả các cột từ bảng tra cứu, thay vì chỉ một cột được chỉ định

  • Nó hỗ trợ

Những ý kiến ​​khác

Xử lý điền

Tạo một dãy số theo mẫu đã đặt trong một nhóm ô nhất định. Trong bảng tính, điều này sẽ được thực hiện bằng cách shift+kéo sau khi nhập số đầu tiên hoặc bằng cách nhập hai hoặc ba giá trị đầu tiên rồi kéo

Điều này có thể đạt được bằng cách tạo một chuỗi và gán nó cho các ô mong muốn

df = df.sort_values["col1"]
8

Thả bản sao

Excel có chức năng tích hợp để loại bỏ các giá trị trùng lặp. Điều này được hỗ trợ trong gấu trúc thông qua

df = df.sort_values["col1"]
9

Bảng tổng hợp

PivotTable từ bảng tính có thể được sao chép trong gấu trúc thông qua. Sử dụng lại tập dữ liệu

tips = pd.read_csv["tips.csv", sep="\t", header=None]

# alternatively, read_table is an alias to read_csv with tab delimiter
tips = pd.read_table["tips.csv", header=None]
1, hãy tìm tiền thưởng trung bình theo quy mô của bữa tiệc và giới tính của người phục vụ

Trong Excel, chúng tôi sử dụng cấu hình sau cho PivotTable

Tương đương ở gấu trúc

df.sort_values["col1", inplace=True]
0

Thêm một hàng

Giả sử chúng ta đang sử dụng [được đánh số là

sorted_df = df.sort_values["col1"]
18,
sorted_df = df.sort_values["col1"]
03, v.v. ], chúng ta có thể sử dụng để thêm một hàng vào cuối của một
df.sort_values["col1", inplace=True]
4

df.sort_values["col1", inplace=True]
1

Tìm và thay thế

Hộp thoại Tìm của Excel sẽ đưa bạn đến từng ô phù hợp. Trong pandas, thao tác này thường được thực hiện cho toàn bộ cột hoặc

df.sort_values["col1", inplace=True]
4 cùng một lúc cho đến hết

Tôi có thể sử dụng gấu trúc thay vì Excel không?

Bởi vì nó được xây dựng trên NumPy [Numerical Python], Pandas tự hào có một số lợi thế so với Excel . Khả năng mở rộng - Pandas chỉ bị giới hạn bởi phần cứng và có thể thao tác với lượng dữ liệu lớn hơn. Tốc độ - Pandas nhanh hơn nhiều so với Excel, điều này đặc biệt đáng chú ý khi làm việc với lượng dữ liệu lớn hơn.

Bạn có thể thay thế Excel bằng Python không?

Đơn giản vì tính linh hoạt tuyệt vời của Python cho phép nó tái tạo khá nhanh các tính năng chính của Excel. lưu trữ các giá trị trên một hàng, trên một cột, trên một bảng và thực hiện các phép tính trên cùng các giá trị đó. Bạn thậm chí có thể sử dụng các thư viện để trực quan hóa dữ liệu, vẽ biểu đồ… Python không có giới hạn về phân tích dữ liệu

Python có tốt hơn Excel để phân tích dữ liệu không?

Python được coi là công cụ phân tích dữ liệu hiệu quả hơn cho các tính toán phức tạp và khối lượng dữ liệu lớn . Tuy nhiên, nhìn chung Excel vẫn phổ biến hơn Python và được nhiều người sử dụng trong phân tích tài chính.

Điều gì có thể thay thế Excel?

10 lựa chọn thay thế hàng đầu cho Microsoft Excel .
số táo
Trang tính Zoho
Bảng tính WPS
LibreOffice Calc
Google Workspace
Bảng PDF
LibreOffice

Chủ Đề