Làm thế nào để bạn bỏ qua một cột trong excel trong python?
Trong bài viết này, chúng tôi sẽ thảo luận về cách bỏ qua các hàng từ trên cùng, dưới cùng hoặc tại các chỉ số cụ thể trong khi đọc tệp csv và tải nội dung vào Khung dữ liệu Show
Thư viện của gấu trúc Python cung cấp chức năng đọc tệp csv và tải dữ liệu trực tiếp vào khung dữ liệu cũng như bỏ qua các dòng được chỉ định từ tệp csv i. e pandas.read_csv(filepath_or_buffer, skiprows=N, ....) Có thể chấp nhận số lượng lớn đối số. Nhưng ở đây chúng ta sẽ chỉ thảo luận về một vài lập luận quan trọng mà thôi. e. Đối số.
Nó sẽ đọc tệp csv đã cho bằng cách bỏ qua các dòng đã chỉ định và tải các dòng còn lại vào một khung dữ liệu Để sử dụng mô-đun gấu trúc nhập này như thế này, import pandas as pd Hãy hiểu bằng các ví dụ, quảng cáo Giả sử chúng tôi có một người dùng tệp CSV đơn giản. csv và nội dung của nó là, >>cat users.txt Name,Age,City jack,34,Sydeny Riti,31,Delhi Aadi,16,New York Suse,32,Lucknow Mark,33,Las vegas Suri,35,Patna Hãy tải tệp csv này vào một khung dữ liệu bằng cách sử dụng read_csv() và bỏ qua các hàng theo nhiều cách khác nhau Bỏ qua N hàng từ trên cùng trong khi đọc tệp csv sang DataframeTrong khi gọi gấu trúc. read_csv() nếu chúng ta chuyển đối số bỏ qua với giá trị int, thì nó sẽ bỏ qua các hàng đó từ đầu trong khi đọc tệp csv và khởi tạo khung dữ liệu. # Skip 2 rows from top in csv and initialize a dataframe usersDf = pd.read_csv('users.csv', skiprows=2) print('Contents of the Dataframe created by skipping top 2 lines from csv file ') print(usersDf) Đầu ra. Contents of the Dataframe created by skipping top 2 lines from csv file Riti 31 Delhi 0 Aadi 16 New York 1 Suse 32 Lucknow 2 Mark 33 Las vegas 3 Suri 35 Patna Nó bỏ qua 2 dòng trên cùng từ csv và sử dụng dòng thứ 3 (tại chỉ mục 2) làm hàng tiêu đề và tải các hàng còn lại từ csv làm hàng dữ liệu trong . Bây giờ nếu chúng ta chỉ muốn bỏ qua một số hàng cụ thể trong khi đọc csv thì sao? Bỏ qua các hàng tại các vị trí chỉ mục cụ thể trong khi đọc tệp csv vào DataframeTrong khi gọi gấu trúc. read_csv() nếu chúng ta chuyển đối số bỏ qua dưới dạng danh sách các số nguyên, thì nó sẽ bỏ qua các hàng từ csv tại các chỉ mục được chỉ định trong danh sách. Ví dụ: nếu chúng tôi muốn bỏ qua các dòng ở chỉ mục 0, 2 và 5 trong khi đọc người dùng. csv và khởi tạo một khung dữ liệu tôi. e # Skip rows at specific index usersDf = pd.read_csv('users.csv', skiprows=[0,2,5]) print('Contents of the Dataframe created by skipping specifying lines from csv file ') print(usersDf) Đầu ra. ______6 Nó bỏ qua các dòng ở vị trí chỉ mục 0, 2 & 5 từ csv và tải các hàng còn lại từ csv vào khung dữ liệu. Bỏ qua N hàng từ đầu trừ tiêu đề trong khi đọc tệp csv vào DataframeNhư chúng ta đã thấy trong ví dụ đầu tiên, khi đọc người dùng. csv khi bỏ qua 3 dòng từ trên xuống sẽ tạo dòng thứ 3 làm hàng tiêu đề. Nhưng đó không phải là hàng chứa tên cột. # Skip 2 rows from top except header usersDf = pd.read_csv('users.csv', skiprows=[i for i in range(1,3)]) print('Contents of the Dataframe created by skipping 2 rows after header row from csv file ') print(usersDf) Đầu ra. ______8 Nó sẽ đọc tệp csv vào khung dữ liệu bằng cách bỏ qua 2 dòng sau hàng tiêu đề trong tệp csv. Bỏ qua các hàng dựa trên điều kiện trong khi đọc tệp csv sang DataframeChúng ta cũng có thể truyền hàm có thể gọi được hoặc hàm lambda để quyết định bỏ qua hàng nào. Khi chuyển chức năng có thể gọi làm đối số trong bỏ qua trong khi gọi gấu trúc. read_csv(), nó sẽ gọi hàm trước khi đọc từng hàng để kiểm tra xem có nên bỏ qua các hàng này hay không. Nó sẽ chuyển vị trí chỉ mục của mỗi hàng trong hàm này. def logic(index): if index % 3 == 0: return True return False # Skip rows from based on condition like skip every 3rd line usersDf = pd.read_csv('users.csv', skiprows= lambda x: logic(x) ) print('Contents of the Dataframe created by skipping every 3rd row from csv file ') print(usersDf) Đầu ra. ______10 Bỏ qua N hàng từ dưới cùng/chân trang trong khi đọc tệp csv sang DataframeĐể bỏ qua N số hàng từ dưới lên trong khi đọc tệp csv sang khung dữ liệu, vui lòng chuyển đối số skipfooter & engine trong pandas. read_csv() tôi. e import pandas as pd1 Đầu ra. ______12 Theo mặc định, read_csv() sử dụng công cụ C để phân tích cú pháp nhưng nó không cung cấp chức năng nhảy từ dưới lên. Nếu muốn sử dụng chức năng này, chúng ta phải chuyển đối số engine cùng với skipfooter nếu không chúng ta sẽ nhận được cảnh báo như sau, import pandas as pd3 Ví dụ đầy đủ như sau,< . import pandas as pd4 Output: ____15 Hướng dẫn về Pandas -Tìm hiểu Phân tích dữ liệu với Python
Bạn đang muốn tạo dựng sự nghiệp trong Khoa học dữ liệu với Python?Khoa học dữ liệu là tương lai và tương lai là ở đây ngay bây giờ. Các nhà khoa học dữ liệu hiện là những chuyên gia được tìm kiếm nhiều nhất hiện nay. Để trở thành một Nhà khoa học dữ liệu giỏi hoặc để chuyển đổi nghề nghiệp trong Khoa học dữ liệu, người ta phải sở hữu bộ kỹ năng phù hợp. Chúng tôi đã tuyển chọn danh sách Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với Python. Các khóa học này sẽ dạy cho bạn các công cụ lập trình cho Khoa học dữ liệu như Pandas, NumPy, Matplotlib, Seaborn và cách sử dụng các thư viện này để triển khai các mô hình Máy học Kiểm tra Đánh giá chi tiết về Chứng chỉ chuyên nghiệp tốt nhất về Khoa học dữ liệu với PythonHãy nhớ rằng, Khoa học dữ liệu đòi hỏi rất nhiều kiên nhẫn, bền bỉ và thực hành. Vì vậy, hãy bắt đầu học ngay hôm nay |