Hướng dẫn dùng pandas drop python

Trụ sở chính:

Nội dung chính

  • Cú pháp thả gấu trúc
  • Cột thả gấu trúc
  • Gấu trúc thả cột theo chỉ mục
  • Gấu trúc thả cột với điều kiện
  • Cột thả gấu trúc nếu tồn tại
  • Cột thả gấu trúc bằng nan
  • Gấu trúc thả các cột với tất cả các số 0
  • Cột thả gấu trúc khi đọc CSV
  • Cột thả gấu trúc không có tên
  • Gấu trúc thả cột ngoại trừ
  • Gấu trúc thả các cột không phải số
  • Gấu trúc thả hàng
  • Gấu trúc thả hàng với điều kiện
  • Gấu trúc thả hàng bằng nan trong cột
  • Gấu trúc thả hàng bằng nan
  • Gấu trúc thả các hàng có nan trong cột cụ thể
  • Gấu trúc thả hàng với chuỗi điều kiện
  • Gấu trúc thả các hàng có giá trị trong bất kỳ cột nào
  • Gấu trúc thả dải hàng
  • Gấu trúc thả các hàng có số 0 trong cột
  • Hàng tiêu đề thả gấu trúc
  • Gấu trúc thả các hàng không phải số nguyên
  • Gấu trúc thả các hàng không phải số
  • Gấu trúc thả các hàng trống
  • Gấu trúc thả các hàng bị thiếu
  • Thả Cột có giá trị NaN trong Pandas DataFrame
  • Thả Cột có Giá trị NaN trong Pandas DataFrame Replace
  • Thả cột có giá trị NaN trong Pandas DataFrame Nhận lần cuối không

Văn phòng: Số 27-3RD, Sunrise D, The Manor Central Park, đường Nguyễn Xiển, phường Đại Kim, quận Hoàng Mai, TP. Hà Nội.

Liên hệ truyền thông: 0929.536.185

Email: [email protected]

Chịu trách nhiệm nội dung: Ông Trần Anh Tú

TEK4.VN giữ bản quyền nội dung trên website này. Cấm sao chép dưới mọi hình thức nếu không có sự chấp thuận bằng văn bản.

Hướng dẫn Python này giải thích, Cách sử dụng hàm Pandas drop () trong Python, các ví dụ khác nhau về hàm thả gấu trúc trong Python.

Đây Hướng dẫn Python là tất cả về hàm Python Pandas drop () . Chúng ta sẽ xem cách sử dụng hàm Pandas drop () trong Python. Ngoài ra, chúng tôi sẽ đề cập đến các chủ đề sau:

Trong hướng dẫn này, chúng ta sẽ tìm hiểu về cách sử dụng thả gấu trúc . Drop là một chức năng chính được sử dụng trong khoa học dữ liệu & amp; Học máy để làm sạch tập dữ liệu. Ngoài ra, chúng tôi sẽ đề cập đến các chủ đề này

  • cú pháp thả pandas
  • pandas drop column
    • pandas drop column by index
    • pandas drop column with condition
    • pandas thả cột nếu tồn tại
    • gấu trúc thả cột bằng nan
    • gấu trúc thả cột với tất cả các số không
    • gấu trúc thả cột khi đọc CSV
    • gấu trúc thả cột không có tên
    • gấu trúc thả cột ngoại trừ

    • gấu trúc thả cột không phải số

>

  • gấu trúc giảm hàng
    • gấu trúc giảm hàng với điều kiện
    • gấu trúc giảm hàng bằng nan trong cột
    • gấu trúc giảm hàng bằng nan

      +

      gấu trúc thả hàng có nan trong cột cụ thể

    • gấu trúc giảm hàng với chuỗi điều kiện
    • gấu trúc giảm hàng có giá trị trong cột bất kỳ
    • phạm vi thả gấu trúc trong số các hàng
    • gấu trúc thả các hàng có số 0 trong cột
    • gấu trúc thả hàng tiêu đề
    • gấu trúc thả các hàng không phải số nguyên
    • gấu trúc thả các hàng không phải số hàng
    • gấu trúc thả các hàng trống
    • gấu trúc thả các hàng còn thiếu
  • Thả cột có giá trị NaN trong Pandas DataFrame
  • Thả cột có giá trị NaN trong Pandas DataFrame Replace
  • Thả cột có giá trị NaN trong Pandas DataFrame Lấy lần cuối không

Hàm Pandas drop () trong Python được sử dụng để loại bỏ các nhãn được chỉ định khỏi các hàng và cột. Drop là một chức năng chính được sử dụng trong khoa học dữ liệu & amp; Máy học để làm sạch tập dữ liệu.

Hàm Pandas Drop () xóa các nhãn được chỉ định khỏi các hàng hoặc cột. Khi sử dụng nhiều chỉ mục, bạn có thể xóa nhãn ở các cấp khác nhau bằng cách chỉ định cấp.

Bạn mới sử dụng Python Pandas? Xem bài viết về Gấu trúc bằng Python .

Cú pháp thả gấu trúc

Dưới đây là cú pháp hàm Pandas drop () .

  DataFrame.drop (
    label = Không có,
    trục = 0,
    index = Không có,
    cột = Không có,
    cấp = Không có,
    inplace = Sai,
    error = 'tăng'
)  

OptionsExplanationlabels Nhãn đơn hoặc nhãn giống như danh sách
Chỉ mục hoặc Cột để thả. Lệnh thả sẽ xóa trục đã cung cấp, trục có thể là 0 hoặc 1.
axis = 0 đề cập đến các hàng hoặc chỉ mục (dọc)
axis = 1 đề cập đến các cột (ngang)
theo mặc định, axis = 0
nhãn chỉ mục hoặc giống như danh sách.
chỉ mục là hàng (dọc) & amp; tương đương với axis = 0columns Nhãn đơn hoặc giống như danh sách.
các cột là đường ngang trong chế độ xem dạng bảng & amp; được biểu thị bằng axis = 1.levelint hoặc tên cấp, tùy chọn
Đối với MultiIndex, cấp mà từ đó các nhãn sẽ bị xóa. inplaceaccept bool (True or False), mặc định là False
Inplace thực hiện các thay đổi sau đó & amp ; ở đó. không cần chỉ định một biến. trước hết lỗi có thể được ‘ bỏ qua ‘ hoặc ‘ nâng lên ‘. mặc định là ‘nâng lên’
nếu lỗi chặn bị bỏ qua và chỉ các nhãn hiện có mới bị loại bỏ
nếu được nâng lên thì nó sẽ hiển thị thông báo lỗi & amp; sẽ không cho phép làm rơi dữ liệu.

Hãy xem, Groupby bằng Python Pandas .

Cột thả gấu trúc

Hãy để chúng tôi xem cách sử dụng cột thả Gấu trúc .

Gấu trúc thả cột theo chỉ mục

  • Chỉ mục đề cập đến các hàng hoặc axis = 0 . Để giảm từng cột theo chỉ mục, chúng ta cần chuyển giá trị của chỉ mục.
  • Trong mọi tập dữ liệu, cột đầu tiên ở bên trái có số sê-ri, số bộ phận hoặc số nào đó duy nhất. Các hàng trên cột đó được gọi là chỉ mục.
  • Người dùng có thể tạo chỉ mục của riêng họ cũng như sử dụng chỉ mục từ khóa theo sau là danh sách các nhãn

Bạn cũng có thể thích, Bảng chữ cái bằng Python Pandas .

Gấu trúc thả cột với điều kiện

Trong phần này, chúng ta sẽ tìm hiểu cách giảm cột với điều kiện ở gấu trúc .

Cột thả gấu trúc nếu tồn tại

Trong phần này, chúng ta sẽ tìm hiểu cách giảm cột nếu tồn tại .

Đọc Cách chuyển đổi float thành số nguyên trong Pandas

Cột thả gấu trúc bằng nan

  • Trong phần này, chúng ta sẽ học cách thả cột bằng nan . Ở đây nan có nghĩa là thiếu các giá trị. Để loại bỏ các giá trị bị thiếu, chúng tôi sẽ sử dụng hàm dropna () . Hàm này được tạo ra với mục đích xóa hoặc xóa các giá trị bị thiếu.
  • Trong ví dụ dưới đây, bạn sẽ nhận thấy rằng các cột có giá trị bị thiếu sẽ bị xóa. Cột BMI bị thiếu giá trị nên sẽ bị loại bỏ.

Ngoài ra, bạn có thể muốn đọc Thiếu dữ liệu về gấu trúc bằng Python .

Gấu trúc thả các cột với tất cả các số 0

Trong phần này, chúng ta sẽ tìm hiểu cách xóa các cột có tất cả các số không trong gấu trúc Python bằng cách sử dụng hàm drop ().

Cột thả gấu trúc khi đọc CSV

  • Trong phần này, chúng ta sẽ tìm hiểu cách bỏ (các) cột trong khi đọc tệp CSV. Để làm như vậy, chúng tôi chuyển lệnh drop bằng lệnh read_csv.
  • Trong cách triển khai bên dưới, bạn có thể nhận thấy rằng chúng tôi đã xóa ‘ bmi ‘ & amp; các cột ‘nét ‘ trong khi đọc tệp CSV.

Đọc, Hướng dẫn CSV về Python .

Cột thả gấu trúc không có tên

Cột

  • không có tên được tạo tự động khi tệp được xuất và xuất hiện với tên Không tên: 0
  • để tránh việc tạo trong tổng số không tên hoặc Không tên: 0 cột được đặt index = False
  • df.to_csv ( 'export_file.csv', index = False ')
  • Nhưng trong trường hợp tệp đã không có tên hoặc Chưa có tên: 0 < / strong> và bạn muốn xóa chúng thì hãy làm theo cách triển khai bên dưới.

Gấu trúc thả cột ngoại trừ

  • Trong phần này, chúng ta sẽ tìm hiểu cách thêm ngoại lệ trong khi giảm cột.
  • df.columns.difference () được sử dụng để thực hiện ngoại lệ
  • tất cả các cột được chuyển trong chênh lệch () sẽ không bị bỏ qua

Hãy xem, Cách đọc khung video bằng Python .

Gấu trúc thả các cột không phải số

Trong phần này, chúng ta sẽ học cách bỏ các cột không phải số

Gấu trúc thả hàng

Trong phần này, chúng ta sẽ tìm hiểu cách thả hàng ở gấu trúc

Gấu trúc thả hàng với điều kiện

Trong phần này, chúng ta sẽ tìm hiểu cách giảm hàng với điều kiện.

Ngoài ra, bạn có thể thích, Chuỗi Python Chức năng .

Gấu trúc thả hàng bằng nan trong cột

  • Trong phần này, chúng ta sẽ tìm hiểu cách xóa hàng có nan hoặc giá trị bị thiếu.
  • Trong khi làm sạch tập dữ liệu đôi khi chúng tôi gặp phải tình huống trong đó quá nhiều giá trị bị thiếu được hiển thị. Trong trường hợp đó, Data Engineer có thể đưa ra quyết định loại bỏ các giá trị bị thiếu.
  • Hàm dropna () được sử dụng để loại bỏ tất cả các giá trị bị thiếu.

Đọc Xóa cột của gấu trúc

Gấu trúc thả hàng bằng nan

  • Trong phần này, chúng ta sẽ tìm hiểu cách loại bỏ hàng có nan hoặc thiếu giá trị.
  • Trong khi làm sạch tập dữ liệu, đôi khi chúng ta gặp phải tình huống trong đó có quá nhiều giá trị bị thiếu được hiển thị. Trong trường hợp đó, Kỹ sư dữ liệu có thể đưa ra quyết định loại bỏ các giá trị bị thiếu.
  • Hàm dropna () được sử dụng để loại bỏ tất cả các giá trị bị thiếu.

Hãy xem, Cách tạo danh sách bằng Python .

Gấu trúc thả các hàng có nan trong cột cụ thể

  • Trong phần này, chúng ta sẽ tìm hiểu cách bỏ các hàng có nan hoặc thiếu giá trị trong cột được chỉ định.
  • Trong tập dữ liệu, cột “bmi” của chúng tôi có các giá trị bị thiếu nên chúng tôi sẽ thực hiện

Gấu trúc thả hàng với chuỗi điều kiện

Trong phần này, chúng ta sẽ tìm hiểu cách giảm hàng với chuỗi điều kiện

Đọc Sự kiện Python Tkinter

Gấu trúc thả các hàng có giá trị trong bất kỳ cột nào

Trong phần này, chúng ta sẽ tìm hiểu cách giảm các hàng có giá trị trong bất kỳ cột nào

Ngoài ra, bạn có thể muốn đọc Làm cách nào để chuyển đổi một số nguyên thành chuỗi trong python ?

Gấu trúc thả dải hàng

  • Trong phần này, chúng ta sẽ tìm hiểu cách giảm phạm vi hàng trong gấu trúc python.
  • Sử dụng thao tác cắt lát trong python, chúng ta có thể giảm các hàng trong một phạm vi

Gấu trúc thả các hàng có số 0 trong cột

  • Trong phần này, chúng ta sẽ tìm hiểu cách giảm các hàng bằng 0 trong một cột bằng cách sử dụng pandas drop
  • Theo tập dữ liệu của chúng tôi, chúng tôi sẽ xóa tất cả các hàng có giá trị 0 trong tăng áp cột.

Hàng tiêu đề thả gấu trúc

Trong phần này, chúng ta sẽ tìm hiểu cách bỏ các hàng tiêu đề . Trong phần trình diễn của chúng tôi, chúng tôi sẽ tạo hàng tiêu đề sau đó chúng tôi sẽ thả nó xuống.

Hãy xem, Quy ước đặt tên trong Python .

Gấu trúc thả các hàng không phải số nguyên

Trong phần này, chúng ta sẽ tìm hiểu cách giảm các hàng không phải số nguyên .

Gấu trúc thả các hàng không phải số

Trong phần này, chúng ta sẽ tìm hiểu cách bỏ các hàng không phải số.

Gấu trúc thả các hàng trống

Trong phần này, chúng ta sẽ tìm hiểu cách xóa các hàng trống ở gấu trúc. Các hàng trống được biểu thị bằng nan ở gấu trúc. Vì vậy, cuối cùng chúng tôi sẽ loại bỏ các giá trị nan hoặc thiếu.

Đọc, Làm cách nào để tách một chuỗi bằng regex trong python ?

Gấu trúc thả các hàng bị thiếu

  • Trong phần này, chúng ta sẽ tìm hiểu cách xóa hàng có nan hoặc giá trị bị thiếu.
  • Trong khi làm sạch tập dữ liệu đôi khi chúng tôi gặp phải tình huống trong đó quá nhiều giá trị bị thiếu được hiển thị. Trong trường hợp đó, Data Engineer có thể đưa ra quyết định loại bỏ các giá trị bị thiếu.
  • Hàm dropna () được sử dụng để loại bỏ tất cả các giá trị bị thiếu.

Thả Cột có giá trị NaN trong Pandas DataFrame

Trong phần này, chúng ta sẽ tìm hiểu về các cột có giá trị nan trong khung dữ liệu gấu trúc bằng Python. NaN thiếu dữ liệu.

  • Dữ liệu bị thiếu là phổ biến trong bất kỳ tập dữ liệu thô nào. Dữ liệu bị thiếu này sẽ bị xóa hoặc được lấp đầy bằng một số dữ liệu như trung bình, trung bình, v.v. Tất cả phụ thuộc vào tình hình và yêu cầu.
  • Nhưng trước khi có thể xử lý dữ liệu bị thiếu (nan), chúng tôi phải xác định chúng.
  • isna () và isnull () là hai phương thức sử dụng để chúng tôi có thể xác định các giá trị bị thiếu trong tập dữ liệu.
  • Sau khi được xác định, bằng cách sử dụng phương thức Python Pandas drop (), chúng tôi có thể xóa các giá trị này cột.

Thả Cột có Giá trị NaN trong Pandas DataFrame Replace

Trong phần này, chúng ta sẽ tìm hiểu về cách xóa NAN bằng cách sử dụng thay thế trong Python Pandas.

  • Sử dụng phương thức Replace (), chúng tôi có thể thay đổi tất cả các giá trị bị thiếu (nan) thành bất kỳ giá trị nào.
  • Đảm bảo rằng bạn đã cài đặt numpy trong hệ thống của mình nếu không chỉ cần nhập
    pip install numpy
  • nhập numpy dưới dạng np
  • Cú pháp thay thế: df.replace (nan, 0, inplace = True)
  • Trong ví dụ của chúng tôi, chúng tôi đã chuyển đổi tất cả các giá trị nan thành 0 (0).

Thả cột có giá trị NaN trong Pandas DataFrame Nhận lần cuối không

Trong phần này, chúng ta sẽ tìm hiểu về cột Drop với các giá trị nan trong khung dữ liệu Pandas get last non.

  • Sử dụng iloc, chúng ta có thể chuyển đến cột Non cuối cùng
  • Trong ví dụ của chúng tôi, chúng tôi đã tạo một cột mới với tên mới có thông tin về Non cuối cùng

Xem các hướng dẫn Python bên dưới:

Trong hướng dẫn này, chúng tôi đã tìm hiểu cách thả dữ liệu trong gấu trúc trăn cũng như chúng tôi đã đề cập đến các chủ đề này.

  • cú pháp thả pandas
  • pandas drop column
    • pandas drop column by index
    • pandas drop column with condition
    • gấu trúc thả cột nếu tồn tại
    • gấu trúc thả cột bằng nan
    • gấu trúc thả cột với tất cả các số không
    • gấu trúc thả cột khi đọc CSV
    • gấu trúc thả cột không có tên
    • gấu trúc giảm cột ngoại trừ
    • gấu trúc thả cột không phải số
  • gấu trúc thả gấu trúc hàng thả hàng có điều kiện
    • gấu trúc giảm hàng có nan trong cột
    • gấu trúc giảm hàng có nan + gấu trúc thả hàng có nan trong cột cụ thể
    • gấu trúc giảm hàng có điều kiện chuỗi
    • gấu trúc thả các hàng có giá trị trong bất kỳ cột nào
    • gấu trúc giảm phạm vi hàng
    • gấu trúc giảm các hàng có số 0 trong cột
    • gấu trúc thả hàng tiêu đề
    • gấu trúc thả các hàng không phải số nguyên
    • gấu trúc giảm các hàng không phải số
    • gấu trúc thả các hàng trống
    • gấu trúc thả các hàng bị thiếu < / li>
  • Cột có giá trị NaN trong Pandas DataFrame Thay thế
  • Cột có giá trị NaN trong Pandas DataFrame
  • Cột có giá trị NaN trong Pandas DataFrame Nhận lần cuối không