Làm thế nào để bạn bỏ qua một cột trong excel trong python?

Trong bài viết này, chúng tôi sẽ thảo luận về cách bỏ qua các hàng từ trên cùng, dưới cùng hoặc tại các chỉ số cụ thể trong khi đọc tệp csv và tải nội dung vào Khung dữ liệu

Thư viện của gấu trúc Python cung cấp chức năng đọc tệp csv và tải dữ liệu trực tiếp vào khung dữ liệu cũng như bỏ qua các dòng được chỉ định từ tệp csv i. e

pandas.read_csv(filepath_or_buffer, skiprows=N, ....)

Có thể chấp nhận số lượng lớn đối số. Nhưng ở đây chúng ta sẽ chỉ thảo luận về một vài lập luận quan trọng mà thôi. e.
Đối số.
  • filepath_or_buffer. đường dẫn của tệp csv hoặc đối tượng của nó
  • mũi dùi. Số dòng cần bỏ qua khi đọc csv
    • Nếu đó là một int thì bỏ qua các dòng đó từ trên xuống
    • Nếu đó là danh sách int thì bỏ qua các dòng ở các vị trí chỉ mục đó
    • Nếu đó là một chức năng có thể gọi được thì hãy chuyển từng chỉ mục cho chức năng này để kiểm tra xem dòng có bị bỏ qua hay không

Nó sẽ đọc tệp csv đã cho bằng cách bỏ qua các dòng đã chỉ định và tải các dòng còn lại vào một khung dữ liệu

Để sử dụng mô-đun gấu trúc nhập này như thế này,

import pandas as pd

Hãy hiểu bằng các ví dụ,

quảng cáo

Giả sử chúng tôi có một người dùng tệp CSV đơn giản. csv và nội dung của nó là,

>>cat users.txt
Name,Age,City
jack,34,Sydeny
Riti,31,Delhi
Aadi,16,New York
Suse,32,Lucknow
Mark,33,Las vegas
Suri,35,Patna


Hãy tải tệp csv này vào một khung dữ liệu bằng cách sử dụng read_csv() và bỏ qua các hàng theo nhiều cách khác nhau

Bỏ qua N hàng từ trên cùng trong khi đọc tệp csv sang Dataframe

Trong khi gọi gấu trúc. read_csv() nếu chúng ta chuyển đối số bỏ qua với giá trị int, thì nó sẽ bỏ qua các hàng đó từ đầu trong khi đọc tệp csv và khởi tạo khung dữ liệu.
Ví dụ: nếu chúng tôi muốn bỏ qua 2 dòng từ trên xuống khi đọc người dùng. csv và khởi tạo một khung dữ liệu tôi. e.

# Skip 2 rows from top in csv and initialize a dataframe
usersDf = pd.read_csv('users.csv', skiprows=2)

print('Contents of the Dataframe created by skipping top 2 lines from csv file ')
print(usersDf)

Đầu ra.
Contents of the Dataframe created by skipping top 2 lines from csv file 
   Riti  31      Delhi
0  Aadi  16   New York
1  Suse  32    Lucknow
2  Mark  33  Las vegas
3  Suri  35      Patna

Nó bỏ qua 2 dòng trên cùng từ csv và sử dụng dòng thứ 3 (tại chỉ mục 2) làm hàng tiêu đề và tải các hàng còn lại từ csv làm hàng dữ liệu trong .

Bây giờ nếu chúng ta chỉ muốn bỏ qua một số hàng cụ thể trong khi đọc csv thì sao?

Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp csv vào Dataframe

Trong khi gọi gấu trúc. read_csv() nếu chúng ta chuyển đối số bỏ qua dưới dạng danh sách các số nguyên, thì nó sẽ bỏ qua các hàng từ csv tại các chỉ mục được chỉ định trong danh sách. Ví dụ: nếu chúng tôi muốn bỏ qua các dòng ở chỉ mục 0, 2 và 5 trong khi đọc người dùng. csv và khởi tạo một khung dữ liệu tôi. e

# Skip  rows at specific index
usersDf = pd.read_csv('users.csv', skiprows=[0,2,5])

print('Contents of the Dataframe created by skipping specifying lines from csv file ')
print(usersDf)

Đầu ra.
______6
Nó bỏ qua các dòng ở vị trí chỉ mục 0, 2 & 5 từ csv và tải các hàng còn lại từ csv vào khung dữ liệu.

Bỏ qua N hàng từ đầu trừ tiêu đề trong khi đọc tệp csv vào Dataframe

Như chúng ta đã thấy trong ví dụ đầu tiên, khi đọc người dùng. csv khi bỏ qua 3 dòng từ trên xuống sẽ tạo dòng thứ 3 làm hàng tiêu đề. Nhưng đó không phải là hàng chứa tên cột.
Vì vậy, nếu tệp csv của chúng ta có hàng tiêu đề và chúng ta muốn bỏ qua 2 hàng dữ liệu đầu tiên thì chúng ta cần chuyển một danh sách tới các dòng bỏ qua i. e.

# Skip 2 rows from top except header
usersDf = pd.read_csv('users.csv', skiprows=[i for i in range(1,3)])

print('Contents of the Dataframe created by skipping 2 rows after header row from csv file ')
print(usersDf)

Đầu ra.
______8
Nó sẽ đọc tệp csv vào khung dữ liệu bằng cách bỏ qua 2 dòng sau hàng tiêu đề trong tệp csv.

Bỏ qua các hàng dựa trên điều kiện trong khi đọc tệp csv sang Dataframe

Chúng ta cũng có thể truyền hàm có thể gọi được hoặc hàm lambda để quyết định bỏ qua hàng nào. Khi chuyển chức năng có thể gọi làm đối số trong bỏ qua trong khi gọi gấu trúc. read_csv(), nó sẽ gọi hàm trước khi đọc từng hàng để kiểm tra xem có nên bỏ qua các hàng này hay không. Nó sẽ chuyển vị trí chỉ mục của mỗi hàng trong hàm này.
Hãy bỏ qua các hàng trong tệp csv có vị trí chỉ mục là bội số của 3 i. e. bỏ qua mọi dòng thứ 3 trong khi đọc tệp csv và tải khung dữ liệu ra khỏi tệp,

def logic(index):
    if index % 3 == 0:
       return True
    return False


# Skip rows from based on condition like skip every 3rd line
usersDf = pd.read_csv('users.csv', skiprows= lambda x: logic(x) )

print('Contents of the Dataframe created by skipping every 3rd row from csv file ')
print(usersDf)

Đầu ra.
______10

Bỏ qua N hàng từ dưới cùng/chân trang trong khi đọc tệp csv sang Dataframe

Để bỏ qua N số hàng từ dưới lên trong khi đọc tệp csv sang khung dữ liệu, vui lòng chuyển đối số skipfooter & engine trong  pandas. read_csv() tôi. e

import pandas as pd
1
Đầu ra.
______12
Theo mặc định, read_csv() sử dụng công cụ C để phân tích cú pháp nhưng nó không cung cấp chức năng nhảy từ dưới lên. Nếu muốn sử dụng chức năng này, chúng ta phải chuyển đối số engine cùng với skipfooter nếu không chúng ta sẽ nhận được cảnh báo như sau,
import pandas as pd
3
Ví dụ đầy đủ như sau,< .
import pandas as pd
4
Output:
____15
 

Hướng dẫn về Pandas -Tìm hiểu Phân tích dữ liệu với Python

 
  • Hướng dẫn Pandas Phần #1 - Giới thiệu về Phân tích dữ liệu với Python
  • Hướng dẫn Pandas Phần #2 - Khái niệm cơ bản về Pandas Series
  • Hướng dẫn Pandas Phần #3 - Nhận & Đặt giá trị chuỗi
  • Pandas Tutorial Part #4 - Thuộc tính & phương thức của Pandas Series
  • Hướng dẫn về Pandas Phần #5 - Thêm hoặc xóa các thành phần của Pandas Series
  • Hướng dẫn về Pandas Phần #6 - Giới thiệu về DataFrame
  • Hướng dẫn về Pandas Phần #7 - DataFrame. loc[] - Chọn Hàng/Cột theo Lập chỉ mục
  • Hướng dẫn về Pandas Phần #8 - DataFrame. iloc[] - Chọn Hàng/Cột theo Tên nhãn
  • Hướng dẫn về gấu trúc Phần #9 - Lọc các hàng trong khung dữ liệu
  • Hướng dẫn Pandas Phần #10 - Thêm/Xóa Hàng & Cột DataFrame
  • Hướng dẫn về Pandas Phần #11 - Các thuộc tính & phương thức DataFrame
  • Hướng dẫn Pandas Phần #12 - Xử lý dữ liệu bị thiếu hoặc giá trị NaN
  • Hướng dẫn về Pandas Phần #13 - Lặp lại các Hàng & Cột của DataFrame
  • Hướng dẫn Pandas Phần #14 - Sắp xếp DataFrame theo Hàng hoặc Cột
  • Hướng dẫn về gấu trúc Phần #15 - Hợp nhất hoặc ghép các khung dữ liệu
  • Hướng dẫn về Pandas Phần #16 - DataFrame GroupBy được giải thích bằng các ví dụ
 

Bạn đang muốn tạo dựng sự nghiệp trong Khoa học dữ liệu với Python?

Khoa học dữ liệu là tương lai và tương lai là ở đây ngay bây giờ. Các nhà khoa học dữ liệu hiện là những chuyên gia được tìm kiếm nhiều nhất hiện nay. Để trở thành một Nhà khoa học dữ liệu giỏi hoặc để chuyển đổi nghề nghiệp trong Khoa học dữ liệu, người ta phải sở hữu bộ kỹ năng phù hợp. Chúng tôi đã tuyển chọn danh sách Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python. Các khóa học này sẽ dạy cho bạn các công cụ lập trình cho Khoa học dữ liệu như Pandas, NumPy, Matplotlib, Seaborn và cách sử dụng các thư viện này để triển khai các mô hình Máy học

Kiểm tra Đánh giá chi tiết về Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python

Hãy nhớ rằng, Khoa học dữ liệu đòi hỏi rất nhiều kiên nhẫn, bền bỉ và thực hành. Vì vậy, hãy bắt đầu học ngay hôm nay