Các hàm read_* được sử dụng để đọc dữ liệu cho gấu trúc, các phương thức to_* được sử dụng để lưu trữ dữ liệu. Phương thức to_excel[] lưu trữ dữ liệu dưới dạng tệp excel. Trong ví dụ ở đây, sheet_name được đặt tên là hành khách thay vì Sheet1 mặc định. Bằng cách đặt chỉ mục=Sai, nhãn chỉ mục hàng không được lưu trong bảng tính
Vài ngày trước, tôi muốn phân tích một số dữ liệu có thể tải xuống từ một trang web để làm một số bài tập với Tableau. Điều đáng tiếc là khi cố tải xuống dữ liệu ở định dạng excel — một trong những định dạng mà Tableau có thể chấp nhận — tôi nhận được thông báo lỗi. Vì vậy, tôi đã cố tải xuống dữ liệu đó ở định dạng CSV và tôi không gặp sự cố nào
Thực tế là Tableau chấp nhận cả tệp CSV, nhưng chúng tôi phải thực hiện một số điều chỉnh và tôi thích sử dụng tệp XLSX hơn. Vì vậy, câu hỏi là. làm cách nào để chuyển đổi tệp CSV sang XLSX? . Vì vậy, trong bài viết này, chúng ta sẽ xem cách thực hiện
Nguồn dữ liệuTôi muốn phân tích sản xuất ngũ cốc ở châu Âu và tôi thấy rằng trang web của FAO cung cấp cho chúng tôi một số dữ liệu [liên kết tại đây] để tải xuống và sử dụng. Nhưng khi tôi cố tải xuống dữ liệu trong XLXS thì đây là lỗi
Lỗi từ trang web của FAO. Hình ảnh của tác giả
Tất nhiên, tôi đã cố gắng bất cứ điều gì tôi có thể. Tôi đã thử tải lại dữ liệu nhiều lần, thay đổi lựa chọn, thay đổi máy tính, v.v… nhưng vẫn bị lỗi như vậy. Vì vậy, tôi đã cố tải chúng xuống dưới định dạng CSV và…bam. Đã tải xuống dữ liệu lần đầu tiên
Vì vậy, bây giờ, tôi gặp sự cố khi chuyển đổi CSV thành tệp XLSX để tải nó trong Tableau. Hãy xem tôi đã làm như thế nào
Chuyển đổi CSV sang XLSX bằng PandasVì chúng ta đang xử lý CSV nên chúng ta có thể mở nó như bình thường với Pandas
import pandas as pd#opening data
grain = pd.read_csv['grain.csv']#showing head
grain.head[]
Nếu chúng ta tìm hiểu dữ liệu một chút, chúng ta có thể thấy rằng có một số quốc gia có giá trị sản xuất bằng 0 tấn. Vì vậy, trước khi lưu dữ liệu cho Tableau, vì chúng tôi đang sử dụng Python, nên xóa các hàng này. Chúng ta có thể làm điều đó với đoạn mã sau
#selecting rows with 'Value'!=0
grain = grain.loc[grain['Value']!=0]
Bây giờ, cuối cùng chúng tôi đã sẵn sàng chuyển đổi CVS thành XLSX;
#saving to xlsx
grain.to_excel['grain_excel.xlsx']
Bằng cách này, chúng tôi chỉ cần lưu tệp trong XLSX, đặt tên là “grain_excel. xlsx”
Tổng quát hóa mãGiả sử chúng ta chỉ muốn chuyển đổi tệp mà không làm sạch dữ liệu;
import pandas as pd#opening data
open_data = pd.read_csv['input_file.csv']#saving to xlsx
open_data.to_excel['output_file.xlsx']
Đoạn mã trên chỉ mở một tệp CSV mà bạn cần đặt tên là “input_file. csv” và trả về một tệp Excel, có tên là “output_file. xlsx”. Bạn có thể lưu mã này dưới dạng “. py” và chạy nó bất cứ khi nào bạn cần. Đơn giản vậy thôi
kết luậnChúng tôi đã thấy việc chuyển đổi CSV thành tệp XLSX dễ dàng như thế nào, nếu chúng tôi có nhu cầu này. Pandas là một thư viện rất mạnh và có thể giúp chúng ta hoàn thành nhiệm vụ đơn giản này
Sau đó, nếu chúng tôi cần nhiều lần để thực hiện chuyển đổi như vậy, chúng tôi có thể tạo một “. py” để chúng tôi có thể chạy nó bất cứ lúc nào chúng tôi cần và nó thực hiện công việc rất nhanh chóng và dễ dàng
Hãy kết nối với nhau
TRUNG BÌNH
LINKEDIN [gửi cho tôi yêu cầu kết nối]
Nếu bạn muốn, bạn có thể đăng ký vào danh sách gửi thư của tôi để bạn có thể luôn cập nhật
Cân nhắc trở thành thành viên. bạn có thể hỗ trợ tôi và các nhà văn khác như tôi mà không phải trả thêm phí. Nhấn vào đây để trở thành một thành viên
Trong bài viết này, chúng tôi sẽ chỉ cho bạn cách chuyển đổi Tệp CSV [Giá trị được phân tách bằng dấu phẩy] thành tệp excel bằng mô-đun pandas trong python
Giả sử chúng tôi đã lấy một tệp excel có tên ExampleCsvFile. csv chứa một số văn bản ngẫu nhiên. Chúng tôi sẽ trả lại Tệp CSV sau khi chuyển đổi tệp excel đã cho thành tệp CSV
Ví dụCsvFile. csv
Player NameAgeTypeCountryTeamRunsWicketsVirat Kohli33BatsmanIndiaRoyal Challengers Bangalore630020Bhuvneshwar Kumar34BatsmanIndiaSun Risers Hyderabad333140Mahendra Singh Dhoni39BatsmanIndiaChennai Super Kings45000Rashid Khan28BowlerAfghanistanGujarat Titans500130Hardik Pandya29All rounderIndiaGujarat Titans240085David Warner34BatsmanAustraliaDelhi Capitals550012Kieron Pollard35All rounderWest IndiesMumbai Indians300067Rohit Sharma33BatsmanIndiaMumbai Indians545620Kane Williamson33BatsmanNew ZealandSun Risers Hyderabad32225Kagiso Rabada29BowlerSouth AfricaLucknow Capitals335111Phương pháp 1. Chuyển đổi CSV sang Excel mà không hiển thị giá trị Chỉ mục
Thuật toán [Các bước]
Sau đây là Thuật toán/các bước cần tuân thủ để thực hiện tác vụ mong muốn -
Nhập mô-đun pandas [Pandas là gói thao tác và phân tích dữ liệu mã nguồn mở Python. Mô-đun này có thể đọc, lọc và sắp xếp lại các tập dữ liệu lớn và nhỏ ở định dạng Excel, JSON và CSV. ]
Tạo một biến để lưu trữ đường dẫn của tệp CSV sau khi đọc tệp bằng hàm pandas read_csv[] [tải tệp CSV dưới dạng khung dữ liệu gấu trúc]
Tạo tệp excel đầu ra với lớp ExcelWriter[] của pandas [Để lưu DataFrame vào trang tính Excel, hãy sử dụng lớp ExcelWriter[] của pandas. Lớp này thường được sử dụng để lưu nhiều trang tính và nối thêm dữ liệu vào trang tính Excel hiện có
Điểm nổi bật của Pandas ExcelWriter Nếu xlsxwriter được cài đặt, nó sẽ được sử dụng theo mặc định;
Chuyển đổi tệp CSV thành tệp excel bằng hàm to_excel[] [Để xuất DataFrame thành tệp excel, hãy sử dụng hàm to_excel[]. Tên tệp đích phải được chỉ định khi ghi một đối tượng vào tệp excel] mà không hiển thị giá trị chỉ mục bằng cách chuyển chỉ mục thành Sai làm đối số. Ở đây index=False cho biết không có giá trị chỉ mục nào được hiển thị
Sử dụng hàm save[] [lưu file] để lưu kết quả/ xuất ra file excel
Thí dụ
Chương trình sau đây chuyển đổi tệp CSV thành tệp excel mà không hiển thị giá trị chỉ mục -
đầu ra
Khi thực hiện, chương trình trên tạo ra một tệp Excel mới [resultExcelFile. csv] sẽ được tạo bằng dữ liệu từ tệp CSV
Trong chương trình này, chúng tôi đọc tệp CSV chứa một số dữ liệu giả ngẫu nhiên dưới dạng khung dữ liệu bằng cách sử dụng hàm pandas read_csv[], sau đó chúng tôi tạo một tệp excel mới và chuyển đổi khung dữ liệu CSV ở trên thành excel bằng cách sử dụng hàm to excel[]. Nếu chúng ta chuyển chỉ mục dưới dạng đối số sai, tệp excel đầu ra sẽ xóa hàng chỉ mục khi bắt đầu. Nếu không có tham số chỉ mục nào được cung cấp, nó sẽ thêm một hàng chỉ mục vào đầu trang tính excel và sau đó chúng tôi lưu tệp excel kết quả bằng cách sử dụng hàm save[] để áp dụng các thay đổi
Phương pháp 2. Chuyển đổi CSV sang Excel Với Hiển thị giá trị Chỉ mục
Thuật toán [Các bước]
Sau đây là Thuật toán/các bước cần tuân thủ để thực hiện tác vụ mong muốn -
tải CSV dưới dạng khung dữ liệu gấu trúc
Chuyển đổi tệp CSV thành tệp excel bằng cách chuyển chỉ mục thành True làm đối số cho hàm excel[] và hiển thị giá trị chỉ mục. index=True có nghĩa là các giá trị chỉ mục được hiển thị ở đây
Sử dụng hàm save[] [lưu file] để lưu kết quả/ xuất ra file excel
Đọc tệp Excel đầu ra bằng hàm read_excel[] [tải tệp Excel dưới dạng khung dữ liệu pandas] và chuyển đổi nó thành đối tượng khung dữ liệu bằng hàm DataFrame[] của mô-đun pandas
Hiển thị/hiển thị đối tượng khung dữ liệu
Thí dụ
Chương trình sau đây chuyển đổi tệp CSV thành tệp excel với các giá trị chỉ mục hiển thị -
đầu ra
Unnamed: 0 Player Name Age Type Country \ 0 0 Virat Kohli 33 Batsman India 1 1 Bhuvneshwar Kumar 34 Batsman India 2 2 Mahendra Singh Dhoni 39 Batsman India 3 3 Rashid Khan 28 Bowler Afghanistan 4 4 Hardik Pandya 29 All rounder India 5 5 David Warner 34 Batsman Australia 6 6 Kieron Pollard 35 All rounder West Indies 7 7 Rohit Sharma 33 Batsman India 8 8 Kane Williamson 33 Batsman New Zealand 9 9 Kagiso Rabada 29 Bowler South Africa Team Runs Wickets 0 Royal Challengers Bengaluru 6300 20 1 Sun Risers Hyderabad 333 140 2 Chennai Super Kings 4500 0 3 Gujarat Titans 500 130 4 Gujarat Titans 2400 85 5 Delhi Capitals 5500 12 6 Mumbai Indians 3000 67 7 Mumbai Indians 5456 20 8 Sun Risers Hyderabad 3222 5 9 Lucknow Capitals 335 111
Ở đây, chúng tôi đã chuyển chỉ mục dưới dạng true làm đối số, tệp excel kết quả sẽ thêm hàng chỉ mục ở đầu và sau đó chúng tôi lưu tệp excel kết quả bằng cách sử dụng hàm save[] để áp dụng các thay đổi. Sau đó, chúng tôi đã chuyển đổi tệp excel thành khung dữ liệu để xem liệu các giá trị từ tệp CSV có được sao chép vào tệp Excel không
Phần kết luận
Trong hướng dẫn này, chúng ta đã học cách đọc tệp CSV, sau đó cách chuyển đổi nó thành tệp Excel và xóa chỉ mục hoặc thêm chỉ mục ở đầu tệp excel và cuối cùng là cách chuyển đổi tệp Excel thành khung dữ liệu gấu trúc