Làm cách nào để chuyển đổi xlsx sang CSV bằng Python bằng gấu trúc?

Vài ngày trước, tôi muốn phân tích một số dữ liệu có thể tải xuống từ một trang web để làm một số bài tập với Tableau. Điều đáng tiếc là khi cố tải xuống dữ liệu ở định dạng excel — một trong những định dạng mà Tableau có thể chấp nhận — tôi nhận được thông báo lỗi. Vì vậy, tôi đã cố tải xuống dữ liệu đó ở định dạng CSV và tôi không gặp sự cố nào

Thực tế là Tableau chấp nhận cả tệp CSV, nhưng chúng tôi phải thực hiện một số điều chỉnh và tôi thích sử dụng tệp XLSX hơn. Vì vậy, câu hỏi là. làm cách nào để chuyển đổi tệp CSV sang XLSX? . Vì vậy, trong bài viết này, chúng ta sẽ xem cách thực hiện

Nguồn dữ liệu

Tôi muốn phân tích sản xuất ngũ cốc ở Châu Âu và tôi thấy rằng trang web của FAO cung cấp cho chúng tôi một số dữ liệu [liên kết ] để tải xuống và sử dụng. Nhưng khi tôi cố tải xuống dữ liệu trong XLXS thì đây là lỗi

chúng tôi in của chúng tôi. csv dưới dạng DataFrame như có thể thấy ở đầu ra. Tập lệnh trước đó chuyển đổi tệp XLSX của chúng tôi thành CSV và tạo “mức lương. csv” trong thư mục hiện tại

ví dụ 2. Chuyển đổi tệp XLSX [có nhiều trang tính] sang CSV

Trong ví dụ sau, trước tiên chúng ta đọc tên trang tính của tệp Excel. Sau đó, tên của các trang tính riêng lẻ được lặp lại và lưu dưới dạng tệp CSV riêng biệt. Tập lệnh lưu CSV ở cùng một vị trí

Chúng tôi sử dụng tệp XLSX mẫu có hai trang tính hoặc bảng tính trở lên

Có thể thấy, file XLSX của chúng ta bao gồm 2 sheet [sheet1 và sheet2]. Bây giờ, chúng tôi viết mã để chuyển đổi tệp XLSX này thành CSV

đầu ra

Tập lệnh đã chuyển đổi thành công tệp XLSX có hai trang tính thành một tệp CSV duy nhất có một trang tính

ví dụ 3. Chuyển đổi nhiều tệp XLSX thành các tệp CSV riêng biệt

Xem xét một tình huống trong đó bạn yêu cầu chuyển đổi một số tệp Excel trong thư mục làm việc của mình thành CSV. Bạn có thể sử dụng phương pháp này. Chúng tôi bắt đầu bằng cách giả sử rằng mỗi tệp chỉ chứa một trang tính. Sau đó, chúng tôi mở rộng phương pháp của mình để xử lý nhiều tệp và một số trang tính. Mã Python sau sử dụng mô-đun tiêu chuẩn toàn cầu. Chúng tôi khớp các đường dẫn tệp bằng cách sử dụng các mẫu với Glob. Nó phù hợp với tất cả các tập tin với. phần mở rộng xlsx trong thư mục làm việc. Sau đó, chúng tôi phát triển chức năng đọc các tệp Excel và lưu chúng dưới dạng tệp CSV. Chúng tôi gọi chức năng này trên mỗi đường dẫn tệp được tìm thấy

Tập lệnh trước này chuyển đổi tất cả các tệp xlsx trong thư mục hiện tại thành tệp CSV

Bây giờ, chúng tôi chuyển đổi các tệp XLSX có nhiều bảng tính thành CSV. Đây rất có thể là phần khó khăn. Ba tệp Excel nằm trong thư mục làm việc của chúng tôi. Ngoài ra, một số trong số chúng bao gồm nhiều hơn một tờ. Chúng tôi nhắm tới

  1. Tạo một thư mục cho mỗi tệp bảng tính,
  2. Chuyển đổi các trang tính của tệp excel thành CSV và chúng sẽ được giữ trong thư mục mới được tạo

Tập lệnh chuyển đổi XLSX với một và nhiều trang tính thành các tệp CSV riêng biệt và lưu trữ chúng trong các thư mục mới có cùng tên

Để truy xuất mọi tệp Excel nằm trong thư mục hiện tại, hàm toàn cầu được sử dụng. Sau đó, các thư mục được tạo cho từng tệp XLSX bằng cách sử dụng hệ điều hành. chức năng mkdir. Sau đó, một tệp CSV được tạo cho mỗi trang tính bên trong thư mục mới bằng cách lặp qua tên trang tính

Phương pháp 2. Chuyển đổi XLSX sang CSV bằng Mô-đun Openpyxl và CSV

Trong phương pháp này, chúng tôi sẽ sử dụng mô-đun openpyxl và CSV để chuyển đổi tệp XLSX thành CSV. Để đọc và ghi các tệp xlsx, xlsm, xltx và xltm 2010, có thể sử dụng mô-đun Python openpyxl. Mô-đun CSV bao gồm các lớp cho phép đọc và ghi dữ liệu dạng bảng có định dạng CSV

Để đọc hoặc tải tệp xlsx của chúng tôi, chúng tôi sử dụng hàm load_workbook[] của mô-đun openpyxl. Bạn có thể sử dụng chức năng này nếu bạn cần viết hoặc đọc tệp XLSX/Excel hiện có bằng Python. Sau khi kích hoạt excel, chúng tôi sử dụng csv. writer[] để tạo tệp CSV của chúng tôi. Sau đó, vòng lặp for được sử dụng để lưu trữ dữ liệu trong các ô dữ liệu của tệp CSV. Chúng tôi chuyển đổi ví dụ của chúng tôi. xlsx vào myfile. csv như trong hình sau

Phần kết luận

Trong hướng dẫn này, chúng tôi đã giới thiệu ngắn gọn cho bạn về tệp XLSX và tệp CSV. Chúng tôi đã giải thích sự khác biệt chính giữa cả hai định dạng tệp. Chúng tôi đã thảo luận về hai phương pháp với nhiều ví dụ để hướng dẫn cách chuyển đổi tệp XLSX với một hoặc nhiều trang tính thành tệp CSV. Chúng tôi đã triển khai một ví dụ để chuyển đổi đồng thời nhiều tệp XLSX thành tệp CSV. Việc chuyển đổi dữ liệu từ Excel sang CSV có thể đơn giản hoặc khó khăn. Nếu bạn chỉ có một tệp với số lượng trang tính nhỏ, thật đơn giản. Nhưng nếu không thì khó

Chủ Đề