Hầu hết mọi người đều quen thuộc với phần mềm bảng tính. Đó là công cụ tiêu chuẩn thực tế cho nhiều ngành công nghiệp và là công cụ đầu tiên xuất hiện trong đầu khi ai đó nghĩ về nhập dữ liệu
Hầu hết các lập trình viên khi muốn sử dụng dữ liệu từ bảng tính, chẳng hạn như Excel, họ sẽ tự động nghĩ đến CSV [tệp giá trị được phân tách bằng dấu phẩy]. Các tệp này khá đơn giản và đúng như tên gọi của chúng, chúng được phân tách từng cột bằng dấu phân cách bằng dấu phẩy và đó là lý do tại sao chúng được ưu tiên. Không phải tất cả các tệp Excel đều có thể được chuyển đổi sang CSV thông qua. Một bảng tính Excel có nhiều trang tính sẽ phải được chuyển đổi thành nhiều tệp CSV, mỗi tệp cho một trang tính. Điều này làm cho nó cực kỳ kém tiện lợi hơn so với việc có một tệp Excel có nhiều trang tính
Điều ít được biết đến là ít nhất trong Python, có những công cụ khá mạnh cho phép bạn làm việc với các tệp Excel, cho cả đọc và viết. Hãy nhanh chóng xem cách thực hiện điều đó trong Python
Thiết lập
Đầu tiên, bạn cần cài đặt Pandas, thư viện phân tích dữ liệu nổi tiếng, cùng với openpyxl, thư viện này thực sự đảm nhận công việc nặng nhọc là đọc/ghi các tệp Excel, vào môi trường ảo của bạn [hoặc trên toàn cầu, tùy thuộc vào thiết lập của bạn]
Viết Excel với Python Pandas. Bạn có thể ghi bất kỳ dữ liệu nào [danh sách, chuỗi, số, v.v.] vào Excel, trước tiên bằng cách chuyển đổi dữ liệu đó thành Khung dữ liệu Pandas và sau đó ghi Khung dữ liệu vào Excel
Để xuất Khung dữ liệu Pandas dưới dạng tệp Excel [phần mở rộng. . xlsx,. xls], sử dụng phương pháp
$ pip install xlwt4
$ pip install openpyxl
khóa học liên quan. Phân tích dữ liệu với Python Pandas
cài đặtxlwt, openpyxl
$ pip install xlwt4 sử dụng thư viện có tên là xlwt và openpyxl trong nội bộ
$ pip install openpyxl
- xlwt được sử dụng để viết. xls [định dạng lên đến Excel2003]
- openpyxl được sử dụng để viết. xlsx [định dạng Excel2007 trở lên]
Cả hai có thể được cài đặt với pip. [pip3 tùy thuộc vào môi trường]
1
2
$ pip install xlwt
$ pip install openpyxl
Viết Excel
Ghi DataFrame vào tệp Excel
Bắt buộc phải nhập openpyxl nếu bạn muốn nối nó vào tệp Excel hiện có được mô tả ở cuối.
Một khung dữ liệu được xác định bên dưới.
1
2
3
4
5
6
7
8
9
10
11
import pandas as pd
import openpyxl
df = pd.DataFrame[[[11, 21, 31], [12, 22, 32], [31, 32, 33]],
index=['one', 'two', 'three'], columns=['a', 'b', 'c']]
print[df]
# a b c
# one 11 21 31
# two 12 22 32
# three 31 32 33
Bạn có thể chỉ định một đường dẫn làm đối số đầu tiên của
$ pip install xlwt6
$ pip install openpyxl
Ghi chú. rằng dữ liệu trong tệp gốc sẽ bị xóa khi ghi đè lên
Đối số
$ pip install xlwt7 là tên của sheet. Nếu bỏ qua sẽ có tên là
$ pip install openpyxl
$ pip install xlwt8
$ pip install openpyxl
1
$ pip install xlwt0
$ pip install openpyxl
khóa học liên quan. Phân tích dữ liệu với Python Pandas
Nếu không cần ghi chỉ số [tên hàng], cột [tên cột] thì đối số chỉ số, cột là Sai
1
$ pip install xlwt2
$ pip install openpyxl
Viết nhiều DataFrames vào tệp Excel
Đối tượng ExcelWriter cho phép bạn sử dụng nhiều gấu trúc. Các đối tượng DataFrame có thể được xuất sang các trang riêng biệt
Như một ví dụ, gấu trúc. Chuẩn bị một đối tượng DataFrame khác
$ pip install xlwt3____14
$ pip install openpyxl
Sau đó sử dụng hàm ExcelWriter[] như thế này
$ pip install xlwt0
$ pip install openpyxl
$ pip install xlwt1
$ pip install openpyxl
Bạn không cần phải gọi cho nhà văn. lưu [], nhà văn. close[] trong các khối
Nối vào một tệp Excel hiện có
Bạn có thể nối thêm DataFrame vào tệp Excel hiện có. Đoạn mã dưới đây mở một tệp hiện có, sau đó thêm hai trang tính với dữ liệu của các khung dữ liệu