Hướng dẫn how do i read multiple csv files from a directory in python? - làm cách nào để đọc nhiều tệp csv từ một thư mục trong python?

Cải thiện bài viết

Lưu bài viết

  • Đọc
  • Bàn luận
  • Cải thiện bài viết

    Lưu bài viết

    Đọc

    Approach:

    1. Bàn luận
    2. Trong bài viết này, chúng ta sẽ thấy cách đọc tất cả các tệp CSV trong một thư mục thành DataFrame của Pandas. Nhiệm vụ có thể được thực hiện bằng cách tìm thấy tất cả các tệp CSV đầu tiên trong một thư mục cụ thể & nbsp; sử dụng phương thức glob [] và sau đó đọc tệp bằng cách sử dụng phương thức pandas.read_csv [] và sau đó hiển thị nội dung.
    3. Nhập các gói python cần thiết như gấu trúc, địa cầu và hệ điều hành.
    4. Sử dụng Gói Glob Python để truy xuất các tệp/tên đường dẫn khớp với một mẫu được chỉ định, tức là ‘.csv
    5. Vòng lặp qua danh sách các tệp CSV, đọc tệp đó bằng pandas.read_csv [].

    Chuyển đổi từng tệp CSV thành DataFrame.

    Python3

    Hiển thị vị trí, tên và nội dung của nó.

    Dưới đây là việc thực hiện.

    import pandas as pd

    import os

    import glob

    reader = csv.reader[files]
    
    0____11
    reader = csv.reader[files]
    
    2

    reader = csv.reader[files]
    
    3
    reader = csv.reader[files]
    
    1
    reader = csv.reader[files]
    
    5
    reader = csv.reader[files]
    
    6
    reader = csv.reader[files]
    
    7

    
    
    
    
    
    
    
    2
    
    
    
    
    
    
    
    7
    
    
    
    
    
    
    
    8
    
    
    
    
    
    
    
    9
    ['1']
    ['2']
    ['3']
    ['4']
    ['5']
    ['6']
    
    0

    
    
    
    
    
    
    
    2
    
    
    
    
    
    
    
    7
    
    
    
    
    
    
    
    8
    ['1']
    ['2']
    ['3']
    ['4']
    ['5']
    ['6']
    
    4
    ['1']
    ['2']
    ['3']
    ['4']
    ['5']
    ['6']
    
    5
    ['1']
    ['2']
    ['3']
    ['4']
    ['5']
    ['6']
    
    6
    ['1']
    ['2']
    ['3']
    ['4']
    ['5']
    ['6']
    
    7
    ['1']
    ['2']
    ['3']
    ['4']
    ['5']
    ['6']
    
    8
    ['1']
    ['2']
    ['3']
    ['4']
    ['5']
    ['6']
    
    9import0

    
    
    
    
    
    
    
    2
    
    
    
    
    
    
    
    7
    
    
    
    
    
    
    
    8import4import5

    
    
    
    
    
    
    
    2import7

    
    
    
    
    
    
    
    2
    
    
    
    
    
    
    
    7pandas as pd0

    Output:

    reader = csv.reader[files]
    
    8
    reader = csv.reader[files]
    
    9
    
    
    
    
    
    
    
    0
    
    
    
    
    
    
    
    1
    The program reads all CSV files in the folder in which the program itself is present.

    Trong một trong các thư mục của tôi, tôi có nhiều tệp CSV. Tôi muốn đọc nội dung của tất cả các tệp CSV thông qua mã Python và in dữ liệu nhưng cho đến bây giờ tôi không thể làm như vậy.

    Tất cả các tệp CSV cũng có cùng một số cột và cùng tên cột.

    Tôi biết một cách để liệt kê tất cả các tệp CSV trong thư mục và lặp lại chúng thông qua vòng lặp "HĐH" và "cho".

    for files in os.listdir["C:\\Users\\AmiteshSahay\\Desktop\\test_csv"]:
    

    Bây giờ sử dụng mô -đun "CSV" để đọc tên tệp

    reader = csv.reader[files]
    

    Cho đến đây, tôi hy vọng đầu ra sẽ là tên của các tệp CSV. mà xảy ra để được sắp xếp. Ví dụ: tên là 1.csv, 2.csv, vì vậy. Nhưng đầu ra như dưới đây

    
    
    
    
    
    
    

    Nếu tôi thêm hàm tiếp theo [] sau csv.Reader [], tôi sẽ nhận được dưới đầu ra

    ['1']
    ['2']
    ['3']
    ['4']
    ['5']
    ['6']
    

    Đây là chữ cái đầu của tên tệp CSV của tôi. Đó là một phần chính xác nhưng không đầy đủ.

    Ngoài điều này một khi tôi có các tệp được lặp lại, làm thế nào để xem nội dung của các tệp CSV trên màn hình? Hôm nay tôi có 6 tập tin. Sau này, tôi có thể có 100 tập tin. Vì vậy, không thể sử dụng phương thức xử lý tệp trong kịch bản của tôi.

    Bất kỳ đề xuất?

    Akash Bajwa

    Tổng quan

    Để đọc một tệp dữ liệu pandas as pd1 duy nhất, chúng ta chỉ có thể sử dụng pandas as pd2. Nó lấy tên tệp bao gồm tiện ích mở rộng hoặc thư mục làm đối số. Nhưng các vấn đề đến khi chúng tôi muốn đọc nhiều tệp dữ liệu hoặc xử lý chúng dưới dạng một khung dữ liệu duy nhất. Để làm điều đó, chúng ta có thể sử dụng mã bên dưới.

    Mã ví dụ về việc đọc nhiều tệp CSV

    pandas as pd3: Một mô -đun Python được sử dụng để có được tất cả các đường dẫn tệp phù hợp với một mẫu thư mục cụ thể.

    Giải thích mã

    pandas as pd4

    • Dòng 4 Vang5: Chúng tôi nhập globpandas as pd6.
    • Dòng 7 trận8: Chúng tôi xác định một đường dẫn gốc và tạo một thể hiện glob với một mẫu tệp được chỉ định pandas as pd1.Ở đây, mô -đun glob giúp trích xuất thư mục tệp [tên tệp + tên tệp với phần mở rộng],
    • Dòng 10 Từ13: Chúng tôi tạo một đối tượng loại danh sách import0 để giữ mọi import1 dưới dạng DataFrame ở mỗi chỉ mục của danh sách đó.
    • Dòng 15: Chúng tôi gọi phương thức import2 để hợp nhất từng dataFrame trong danh sách theo các cột, nghĩa là import3.
    • Dòng 17: Cuối cùng chúng tôi in các khung dữ liệu được hợp nhất vào bảng điều khiển.: We finally print merged DataFrames to the console.

    import4

    • Tệp này chứa tên của các công ty khác nhau.

    import5

    • Tệp được phân tách bằng dấu phẩy này chứa thông tin nhân viên bao gồm import6 và import7 của họ.

    import8

    • Tệp này chứa thông tin tiền lương của nhân viên bao gồm import6, os0, os1, os2 và os3.

    Người đóng góp

    Akash Bajwa

    Bài Viết Liên Quan

    Chủ Đề