Cách chèn cột trong excel bằng gấu trúc Python

Pandas là một thư viện thao tác và phân tích dữ liệu cho Python. Nó cung cấp nhiều chức năng và phương pháp để quản lý dữ liệu dạng bảng. Cấu trúc dữ liệu cốt lõi của gấu trúc là DataFrame, lưu trữ dữ liệu ở dạng bảng với các hàng và cột được gắn nhãn

4 cách để thêm một cột trong Pandas

  1. Thêm cột vào cuối bảng
  2. Thêm cột tại một chỉ mục cụ thể
  3. Thêm cột bằng phương thức loc
  4. Thêm cột với hàm gán

Từ góc độ dữ liệu, các hàng biểu thị các quan sát hoặc điểm dữ liệu. Các cột biểu thị các tính năng hoặc thuộc tính về các quan sát. Xem xét một Khung dữ liệu về giá nhà. Mỗi hàng là một ngôi nhà và mỗi cột là một đặc điểm về ngôi nhà như tuổi, số phòng, giá cả, v.v.

Thêm bớt cột là thao tác phổ biến trong phân tích dữ liệu. Chúng tôi sẽ xem xét bốn cách khác nhau để thêm một cột mới vào DataFrame

Trước tiên, hãy tạo một DataFrame đơn giản để sử dụng trong các ví dụ

import numpy as np
import pandas as pd

df = pd.DataFrame[{"A": [1, 2, 3, 4],
                   "B": [5, 6, 7, 8]}]

df
Một bộ dữ liệu hai cột được trình bày trong pandas DataFrame. . Hình ảnh. Soner Yildirim

 

4 phương pháp thêm cột Pandas

Dưới đây là bốn phương pháp để thêm cột vào DataFrame của gấu trúc

Trở thành chuyên gia về gấu trúc Hướng dẫn dành cho người mới bắt đầu sử dụng gấu trúc để sắp xếp dữ liệu văn bản với Python

 

Phương pháp 1. Thêm cột vào cuối

Đây có thể là phương pháp được sử dụng phổ biến nhất để tạo một cột mới

df["C"] = [10, 20, 30, 40]

df
Thêm một cột vào cuối DataFrame trong gấu trúc. . Hình ảnh. Soner Yildirim

Chúng tôi chỉ định tên cột giống như chúng tôi đang chọn một cột trong DataFrame. Sau đó, các giá trị được gán cho cột này. Một cột mới được thêm vào làm cột cuối cùng, tôi. e. cột có chỉ số cao nhất

Chúng tôi cũng có thể thêm nhiều cột cùng một lúc. Tên cột được chuyển vào danh sách và các giá trị cần phải tương thích hai chiều với số lượng hàng và cột. Chẳng hạn, đoạn mã sau thêm ba cột chứa các số nguyên ngẫu nhiên trong khoảng từ 0 đến 10

df[["1of3", "2of3", "3of3"]] = np.random.randint[10, size=[4,3]]

df
Thêm ba cột chứa đầy số nguyên vào cuối Khung dữ liệu gấu trúc. . Hình ảnh. Soner Yildirim

Hãy bỏ ba cột này trước khi chuyển sang phương pháp tiếp theo

df.drop[["1of3", "2of3", "3of3"], axis=1, inplace=True]

 

Phương pháp 2. Thêm cột tại một chỉ mục cụ thể

Trong phương pháp đầu tiên, cột mới được thêm vào cuối. Pandas cũng cho phép thêm các cột mới tại một chỉ mục cụ thể. Chức năng chèn có thể được sử dụng để tùy chỉnh vị trí của cột mới. Hãy thêm một cột bên cạnh cột A

df.insert[1, "D", 5]

df
Chèn cột D vào giữa cột A và B trong DataFrame của gấu trúc. . Hình ảnh. Soner Yildirim

Hàm chèn nhận 3 tham số là chỉ số, tên cột và giá trị. Các chỉ số cột bắt đầu từ 0, vì vậy chúng tôi đặt tham số chỉ mục là một để thêm cột mới bên cạnh cột A. Chúng ta có thể chuyển một giá trị không đổi để điền vào tất cả các hàng

Hướng dẫn cách thêm cột mới vào gấu trúc. . Băng hình. Dữ liệu độc lập

 

Phương pháp 3. Thêm cột với Lộc

Phương thức loc cho phép bạn chọn các hàng và cột bằng nhãn của chúng. Cũng có thể tạo một cột mới bằng phương thức này

df.loc[:, "E"] = list["abcd"]

df
Sử dụng phương thức loc để chọn nhãn hàng và cột để thêm cột mới. . Hình ảnh. Soner Yildirim

Để chọn hàng và cột, chúng tôi chuyển các nhãn mong muốn. Dấu hai chấm chỉ ra rằng chúng tôi muốn chọn tất cả các hàng. Trong phần cột, chúng tôi chỉ định nhãn của các cột sẽ được chọn. Vì DataFrame không có cột E nên gấu trúc tạo một cột mới

Thông tin thêm về Pandas Cách tăng tốc mã Pandas của bạn lên gấp 10 lần

 

Phương pháp 4. Thêm cột với chức năng gán

Phương pháp cuối cùng là chức năng gán

df = df.assign[F = df.C * 10]

df
Sử dụng hàm gán để tạo cột F. . Hình ảnh. Sonder Yildirim

Chúng tôi chỉ định cả tên cột và giá trị bên trong hàm gán. Bạn có thể nhận thấy rằng chúng tôi lấy các giá trị bằng cách sử dụng một cột khác trong DataFrame. Các phương pháp trước đây cũng cho phép dẫn xuất tương tự

Có một sự khác biệt quan trọng giữa chức năng chèn và gán. Chức năng chèn hoạt động tại chỗ, có nghĩa là thêm một cột mới được lưu trong DataFrame

Tình hình hơi khác một chút với chức năng gán. Nó trả về DataFrame đã sửa đổi nhưng không thay đổi khung gốc. Để sử dụng phiên bản đã sửa đổi với cột mới, chúng ta cần gán nó một cách rõ ràng

Chúng tôi hiện đã đề cập đến bốn phương pháp khác nhau để thêm các cột mới vào DataFrame của gấu trúc, một thao tác phổ biến trong phân tích và thao tác dữ liệu. Một trong những điều tôi thích ở pandas là nó thường cung cấp nhiều cách để thực hiện một tác vụ nhất định, khiến nó trở thành một công cụ linh hoạt và đa năng để phân tích và thao tác dữ liệu.

Làm cách nào để chèn cột vào gấu trúc DataFrame?

5 cách để thêm một cột mới vào DataFrame của bạn trong Pandas. .
Bằng cách khai báo một tên cột mới với vô hướng hoặc danh sách các giá trị
Bằng cách sử dụng df. chèn[]
sử dụng df. giao phó[]
Sử dụng từ điển
sử dụng. lộc[]

Làm thế nào để thêm một cột trong Excel?

Để chèn một cột. Nhấp chuột phải vào toàn bộ cột ở bên phải nơi bạn muốn thêm cột mới rồi chọn Chèn cột . Để chèn nhiều cột. Chọn cùng một số cột ở bên phải nơi bạn muốn thêm cột mới. Bấm chuột phải vào lựa chọn, rồi chọn Chèn cột.

Chủ Đề