Đưa ra một bảng HTML [mã] trong một tệp hoặc tại một URL nhất định. Đầu tiên, tải tất cả các bảng HTML vào tập lệnh Python bằng cách gọi Pandas' pd.read_html[]
chuyển URL của tài liệu HTML. Kết quả là một danh sách các Khung dữ liệu, mỗi khung một bảng HTML trong tài liệu. Thứ hai, chuyển đổi bất kỳ DataFrame cụ thể nào thành CSV bằng cách gọi hàm df.to_csv[]
Đây là ví dụ chung, thay thế URL cụ thể của bạn và xuất tệp CSV
import pandas as pd html = '//en.wikipedia.org/wiki/Python_[programming_language]' csv = 'my_file.csv' # 1. Read all HTML tables from a given URL tables = pd.read_html[html] # 2. Write first table, for example, to the CSV file tables[0].to_csv[csv]
Ví dụ – Xuất bảng trang Wiki của Python sang CSV
Đưa ra bảng mô tả đầu tiên của trang wiki Python
Bạn chuyển đổi nó thành CSV bằng cách sử dụng phương pháp sau được nêu ở trên
import pandas as pd # 1. Read all HTML tables from a given URL tables = pd.read_html['//en.wikipedia.org/wiki/Python_[programming_language]'] # 2. Write first table, for example, to the CSV file tables[0].to_csv['my_file.csv']
Vì vậy, về cơ bản, chúng tôi chuyển đổi bảng đầu vào sau [HTML]
đến đầu ra sau
Cách chuyển đổi bảng HTML trong tệp thành tệp CSV bằng Python
💬 Thử thách. Đưa ra một bảng HTML duy nhất được lưu trữ trong một tệp 'my_file.html'
. Làm cách nào để chuyển đổi tệp bảng đó thành tệp CSV bằng Python?
Hàm pandas.read_html[]
hoạt động nếu bạn sử dụng đường dẫn tệp hoặc URL làm đối số. Để chuyển đổi tệp bảng HTML 'my_file.html'
thành tệp CSV
import pandas as pd # 1. Read all HTML tables from a given URL tables = pd.read_html['//en.wikipedia.org/wiki/Python_[programming_language]'] # 2. Write first table, for example, to the CSV file tables[0].to_csv['my_file.csv']0 bằng Python, hãy làm theo ba bước sau
- Nhập thư viện gấu trúc
- Đọc bảng HTML dưới dạng DataFrame
import pandas as pd # 1. Read all HTML tables from a given URL tables = pd.read_html['//en.wikipedia.org/wiki/Python_[programming_language]'] # 2. Write first table, for example, to the CSV file tables[0].to_csv['my_file.csv']
1 bằng cách gọiimport pandas as pd # 1. Read all HTML tables from a given URL tables = pd.read_html['//en.wikipedia.org/wiki/Python_[programming_language]'] # 2. Write first table, for example, to the CSV file tables[0].to_csv['my_file.csv']
0 - Ghi DataFrame vào CSV bằng cách gọi
import pandas as pd # 1. Read all HTML tables from a given URL tables = pd.read_html['//en.wikipedia.org/wiki/Python_[programming_language]'] # 2. Write first table, for example, to the CSV file tables[0].to_csv['my_file.csv']
1 nếu bạn không cần chỉ mục số hàng
Đây là mã cụ thể hoạt động
import pandas as pd # Select the only [first] table using indexing [0] df = pd.read_html['my_file.html'][0] # Write DataFrame to CSV - no index required df.to_csv['my_file.csv', index=False]
Đây là tệp bảng HTML gốc 'my_file.html'
Đây là tệp CSV đã chuyển đổi
import pandas as pd # 1. Read all HTML tables from a given URL tables = pd.read_html['//en.wikipedia.org/wiki/Python_[programming_language]'] # 2. Write first table, for example, to the CSV file tables[0].to_csv['my_file.csv']0
Đọc thêm
Bạn có thể tìm hiểu thêm về cách đọc bảng HTML vào Khung dữ liệu Pandas trong bài viết sau
🌍 Tài nguyên được đề xuất. Cách đọc bảng HTML với Pandas
Chris
Trong khi làm việc với tư cách là một nhà nghiên cứu trong các hệ thống phân tán, Dr. Christian Mayer tìm thấy tình yêu của mình với việc dạy sinh viên khoa học máy tính
Để giúp sinh viên đạt được mức độ thành công Python cao hơn, anh ấy đã thành lập trang web giáo dục lập trình Finxter. com. Ông là tác giả của cuốn sách lập trình nổi tiếng Python One-Liners [NoStarch 2020], đồng tác giả của loạt sách tự xuất bản Coffee Break Python, người đam mê khoa học máy tính, cộng tác viên tự do và chủ sở hữu của một trong 10 blog Python lớn nhất thế giới
Niềm đam mê của anh ấy là viết, đọc và mã hóa. Nhưng niềm đam mê lớn nhất của anh ấy là phục vụ các lập trình viên đầy tham vọng thông qua Finxter và giúp họ nâng cao kỹ năng của mình. Bạn có thể tham gia học viện email miễn phí của anh ấy tại đây
Trong bài viết này, chúng tôi sẽ trình bày cách chuyển đổi tệp CSV sang Excel XLSX trong Power Automate Flow [Microsoft Flow] bằng cách sử dụng tác vụ Csv sang Excel từ trình kết nối Tài liệu Plumsail
Giả sử chúng tôi có một thư mục chứa các tệp CSV và muốn chuyển đổi các tệp CSV mới được thêm vào XLSX và lưu trữ chúng trong một thư mục khác
Các tệp CSV nguồn của chúng tôi phải được lưu trữ ở đâu đó. Power Automate [Microsoft Flow] có rất nhiều trình kết nối cho các hệ thống khác nhau
Đây chỉ là một vài trong số họ
Điểm chia sẻ
Lực lượng bán hàng
Hộp
Một ổ đĩa
Google Drive
Dropbox
SFTP
Hệ thống tập tin
Bạn có thể lưu trữ các tệp của mình ở bất cứ đâu. Trong ví dụ này, chúng tôi sẽ lưu trữ tệp CSV nguồn và tệp Excel kết quả trong thư mục SharePoint nhưng bạn có thể lấy dữ liệu từ bất kỳ nguồn nào khác
Bạn có thể tải xuống tệp demo CSV
Đây là cách dòng chảy của chúng tôi trông
Dưới đây là mô tả từng bước về quy trình
Quy trình bắt đầu khi tệp CSV mới được tải lên thư mục CSV trên trang SharePoint
Chuyển đổi CSV sang Excel XLSX là một hành động từ trình kết nối Tài liệu Plumsail
Nếu đây là lần đầu tiên bạn sử dụng trình kết nối Tài liệu Plumsail, thì Power Automate sẽ yêu cầu Tên kết nối và Khóa API
Bạn có thể nhập bất kỳ tên nào cho kết nối, ví dụ Plumsail Documents
Sau khi điền xong tên kết nối, hãy tạo khóa API trong Tài khoản Plumsail của bạn, sao chép và dán khóa đó vào trường Khóa truy cập, sau đó nhấp vào Tạo
Hành động ‘CSV to Excel’ có một trường bắt buộc - nội dung của tệp CSV bạn muốn chuyển đổi sang Excel. Chúng tôi đã chèn đầu ra trình kích hoạt vào trường này. Ngoài ra, bạn có thể thay đổi các tùy chọn nâng cao Delimiter và Use first line as headers nếu cần
Cuối cùng, tôi lưu bảng tính Excel kết quả vào một thư mục SharePoint khác
Đó là tất cả, quy trình được cấu hình. Bây giờ, bạn đã biết cách chuyển đổi tệp CSV sang Excel XLSX trong Power Automate Flow