4 cách để thêm một cột trong Pandas
- Thêm cột vào cuối bảng
- Thêm cột tại một chỉ mục cụ thể
- Thêm cột bằng phương thức loc
- Thêm cột với hàm gán
Từ góc độ dữ liệu, các hàng biểu thị các quan sát hoặc điểm dữ liệu. Các cột biểu thị các tính năng hoặc thuộc tính về các quan sát. Xem xét một Khung dữ liệu về giá nhà. Mỗi hàng là một ngôi nhà và mỗi cột là một đặc điểm về ngôi nhà như tuổi, số phòng, giá cả, v.v.
Thêm bớt cột là thao tác phổ biến trong phân tích dữ liệu. Chúng tôi sẽ xem xét bốn cách khác nhau để thêm một cột mới vào DataFrame
Trước tiên, hãy tạo một DataFrame đơn giản để sử dụng trong các ví dụ
import numpy as np
import pandas as pd
df = pd.DataFrame[{"A": [1, 2, 3, 4],
"B": [5, 6, 7, 8]}]
df
4 phương pháp thêm cột Pandas
Dưới đây là bốn phương pháp để thêm cột vào DataFrame của gấu trúc
Trở thành chuyên gia về gấu trúc Hướng dẫn dành cho người mới bắt đầu sử dụng gấu trúc để sắp xếp dữ liệu văn bản với Python
Phương pháp 1. Thêm cột vào cuối
Đây có thể là phương pháp được sử dụng phổ biến nhất để tạo một cột mới
df["C"] = [10, 20, 30, 40]
df
Chúng tôi chỉ định tên cột giống như chúng tôi đang chọn một cột trong DataFrame. Sau đó, các giá trị được gán cho cột này. Một cột mới được thêm vào làm cột cuối cùng, tôi. e. cột có chỉ số cao nhất
Chúng tôi cũng có thể thêm nhiều cột cùng một lúc. Tên cột được chuyển vào danh sách và các giá trị cần phải tương thích hai chiều với số lượng hàng và cột. Chẳng hạn, đoạn mã sau thêm ba cột chứa các số nguyên ngẫu nhiên trong khoảng từ 0 đến 10
df[["1of3", "2of3", "3of3"]] = np.random.randint[10, size=[4,3]]
df
Hãy bỏ ba cột này trước khi chuyển sang phương pháp tiếp theo
df.drop[["1of3", "2of3", "3of3"], axis=1, inplace=True]
Phương pháp 2. Thêm cột tại một chỉ mục cụ thể
Trong phương pháp đầu tiên, cột mới được thêm vào cuối. Pandas cũng cho phép thêm các cột mới tại một chỉ mục cụ thể. Chức năng chèn có thể được sử dụng để tùy chỉnh vị trí của cột mới. Hãy thêm một cột bên cạnh cột A
df.insert[1, "D", 5]
df
Hàm chèn nhận 3 tham số là chỉ số, tên cột và giá trị. Các chỉ số cột bắt đầu từ 0, vì vậy chúng tôi đặt tham số chỉ mục là một để thêm cột mới bên cạnh cột A. Chúng ta có thể chuyển một giá trị không đổi để điền vào tất cả các hàng
Hướng dẫn cách thêm cột mới vào gấu trúc. . Băng hình. Dữ liệu độc lập
Phương pháp 3. Thêm cột với Lộc
Phương thức loc cho phép bạn chọn các hàng và cột bằng nhãn của chúng. Cũng có thể tạo một cột mới bằng phương thức này
df.loc[:, "E"] = list["abcd"]
df
Để chọn hàng và cột, chúng tôi chuyển các nhãn mong muốn. Dấu hai chấm chỉ ra rằng chúng tôi muốn chọn tất cả các hàng. Trong phần cột, chúng tôi chỉ định nhãn của các cột sẽ được chọn. Vì DataFrame không có cột E nên gấu trúc tạo một cột mới
Thông tin thêm về Pandas Cách tăng tốc mã Pandas của bạn lên gấp 10 lần
Phương pháp 4. Thêm cột với chức năng gán
Phương pháp cuối cùng là chức năng gán
df = df.assign[F = df.C * 10]
df
Chúng tôi chỉ định cả tên cột và giá trị bên trong hàm gán. Bạn có thể nhận thấy rằng chúng tôi lấy các giá trị bằng cách sử dụng một cột khác trong DataFrame. Các phương pháp trước đây cũng cho phép dẫn xuất tương tự
Có một sự khác biệt quan trọng giữa chức năng chèn và gán. Chức năng chèn hoạt động tại chỗ, có nghĩa là thêm một cột mới được lưu trong DataFrame
Tình hình hơi khác một chút với chức năng gán. Nó trả về DataFrame đã sửa đổi nhưng không thay đổi khung gốc. Để sử dụng phiên bản đã sửa đổi với cột mới, chúng ta cần gán nó một cách rõ ràng
Chúng tôi hiện đã đề cập đến bốn phương pháp khác nhau để thêm các cột mới vào DataFrame của gấu trúc, một thao tác phổ biến trong phân tích và thao tác dữ liệu. Một trong những điều tôi thích ở pandas là nó thường cung cấp nhiều cách để thực hiện một tác vụ nhất định, khiến nó trở thành một công cụ linh hoạt và đa năng để phân tích và thao tác dữ liệu.
Làm cách nào để chèn cột vào gấu trúc DataFrame?
Làm thế nào để thêm một cột trong Excel?