Tôi có thể xuất tệp html sang excel không?

Thư viện Syncfusion Excel [XlsIO] là một. NET Excel cho phép người dùng xuất dữ liệu từ nhiều nguồn dữ liệu khác nhau sang trang tính Excel trong C# và VB. MẠNG LƯỚI. Thư viện này cho phép bạn xuất cả bảng HTML sang trang tính Excel. Tính năng này sẽ hữu ích khi có nhu cầu trích xuất dữ liệu từ tài liệu HTML và quản lý nó

Nếu bạn đang tìm kiếm các bước dễ dàng để làm điều này, thì bạn đang ở đúng nơi

Hãy xem xét một tình huống mà bạn có các trang web có bảng HTML. Để truy xuất dữ liệu từ mỗi trang web, bạn có thể cần sao chép các bảng trong trang theo cách thủ công. Để tự động hóa quy trình này, XlsIO cung cấp hỗ trợ để xuất bất kỳ số lượng bảng HTML nào trong trang web sang trang tính Excel. Điều này làm cho công việc đơn giản và tiết kiệm thời gian, quá. Quá trình xuất bao gồm cả định dạng bảng

Hãy xem cách xuất bảng HTML từ trang web sang trang tính Excel trong C# bằng XlsIO

Xuất bảng HTML

Phương thức ImportHtmlTable tải tệp HTML và nhập tất cả các bảng trong tệp vào trang tính. Thao tác nhập này bao gồm định dạng bảng được xác định trong tệp HTML

Để trình diễn, tôi sẽ tạo một ASP. NET Core để xuất bảng HTML sang trang tính Excel bằng thư viện Syncfusion XlsIO

Bước 1. Tạo một ASP. dự án NET Core

Bước 2. Thêm một cái nhìn; . cshtml. Thêm mã mẫu sau. Mã này chứa một bảng HTML trong HTML DIV, một trường ẩn và một nút Xuất. Nút này đã được chỉ định một trình xử lý sự kiện nhấp chuột jQuery để sao chép nội dung của HTML DIV sang trường ẩn, để chuỗi HTML có thể được gửi đến máy chủ

@{Html.BeginForm["ImportHtmlTable", "ImportHtmlTable", FormMethod.Post];
    {
        

Essential XlsIO supports exporting HTML tables into Excel worksheets. The ImportHtmlTable method loads an HTML file and exports all the tables in the file to the worksheet.

Features:
  • Imports HTML table
  • Imports with table formatting

th { color:rgb[0,0,0]; font-family:Tahoma, sans-serif; font-size:10pt; white-space:nowrap; background-color:rgb[255,174,33]; border-top:solid; border-top-width: thin; border-bottom:solid; border-bottom-width:thin; border-left:solid; border-left-width:thin; border-right:solid; border-right-width:thin; border-top-color:rgb[0,0,0]; border-bottom-color:rgb[0,0,0]; border-left-color:rgb[0,0,0]; border-right-color:rgb[0,0,0]; font-weight:bold; vertical-align:bottom; } td { color:rgb[0,0,0]; font-family:Tahoma, sans-serif; font-size:10pt; white-space:nowrap; background-color:rgb[239,243,247]; border-left:solid; border-left-width:thin; border-right:solid; border-right-width:thin; border-top-color:rgb[0,0,0]; border-bottom-color:rgb[0,0,0]; border-bottom:solid; border-bottom-width:thin; border-left-color:rgb[0,0,0]; border-right-color:rgb[0,0,0]; vertical-align:bottom; }
CustomerIDCompanyNameContactNamePhone
ALFKI Alfreds Futterkiste Maria Anders 030-0074321
ANATR Ana Trujillo Emparedados Ana Trujillo [5] 555-4729
ANTON Antonio Moreno Taquería Antonio Moreno [5] 555-3932
AROUT Around the Horn Thomas Hardy [171] 555-7788
BERGS Berglunds snabbköp Christina Berglund 0921-12 34 65
BLAUS Blauer See Delikatessen Hanna Moos 0621-08460

Html.EndForm[]; } } function exportHTML[] { let value = "" + document.getElementById["cssStyle"].innerHTML + "" + document.getElementById["Grid"].innerHTML + ""; value = value.replace["", ""]; value = value.replace["", ""]; document.getElementById["tbl"].setAttribute["value", value]; }

Mã này sẽ tạo trang web được hiển thị trong ảnh chụp màn hình sau

Nhập trang web với bảng HTML

Bước 3. Tạo một tài liệu Excel trong lớp trình điều khiển ExportHtmlTableController. cs

Bước 4. Chuỗi HTML được phân tích cú pháp vào trường ẩn hiện được chuyển đến sự kiện nhấp chuột. Sau đó, chuyển đổi chuỗi HTML thành một luồng và tải nó bằng phương thức ImportHtmlTable, sau đó xuất nó sang trang tính Excel. Hàng và cột bắt đầu phải được chỉ định trong khi xuất chúng. Sau khi xuất sang trang tính, tự động điều chỉnh các hàng và cột và lưu tệp Excel đầu ra

Ví dụ mã sau đây cho biết cách xuất trang web có bảng HTML sang trang tính Excel trong C# bằng XlsIO

        public ActionResult ImportHtmlTable[string button, string tableHTML]
        {
            if [button == null]
                return View[];

            MemoryStream ms = new MemoryStream[];

            // The instantiation process consists of two steps.
            // Step 1: Instantiate the spreadsheet creation engine.
            using [ExcelEngine excelEngine = new ExcelEngine[]]
            {

                // Step 2 : Instantiate the Excel application object.
                IApplication application = excelEngine.Excel;
                application.DefaultVersion = ExcelVersion.Excel2016;

                // A workbook is created.
                IWorkbook workbook = application.Workbooks.Create[1];

                // The first worksheet object in the worksheets collection is accessed.
                IWorksheet worksheet = workbook.Worksheets[0];

                byte[] byteArray = Encoding.UTF8.GetBytes[tableHTML];

                MemoryStream file = new MemoryStream[byteArray];

                // Imports HTML table into the worksheet from first row and first column.
                worksheet.ImportHtmlTable[file, 1, 1];

                worksheet.UsedRange.AutofitColumns[];
                worksheet.UsedRange.AutofitRows[];

                workbook.SaveAs[ms];
                ms.Position = 0;
            }

            return File[ms, "Application/vnd.openxmlformats-officedocument.spreadsheetml.sheet", "Export-HTML-Table.xlsx"];
        }

Ghi chú. Bạn cũng có thể sử dụng phương pháp ImportHtmlTable này để tải tệp HTML từ đĩa để xuất bảng HTML sang trang tính Excel. Để làm được điều đó, bạn cần chỉ định giá trị hàng và cột bắt đầu trong khi nhập tệp HTML. Tham khảo ví dụ mã sau

    //Exports HTML tables to the worksheet from first row and first column.
    worksheet.ImportHtmlTable["Import-HTML-Table.html", 1, 1];

Ảnh chụp màn hình sau đây là đầu ra của tệp Excel được xuất từ ​​​​trang web với bảng HTML

Tài liệu Excel với bảng HTML

mẫu GitHub

Bạn có thể tải xuống ví dụ về xuất bảng HTML sang trang tính Excel trong C# trên trang GitHub này

kết thúc

Như bạn có thể thấy, Thư viện Syncfusion Excel [XlsIO] cung cấp hỗ trợ để dễ dàng xuất các bảng HTML sang Excel trong C#. Hãy dành một chút thời gian để đọc tài liệu, nơi bạn sẽ tìm thấy các tính năng và tùy chọn nhập khác như bảng dữ liệu, đối tượng bộ sưu tập, chế độ xem lưới, cột dữ liệu và CSV, tất cả đều có mẫu mã đi kèm

Khi sử dụng thư viện XlsIO, bạn cũng có thể xuất dữ liệu Excel sang PDF, hình ảnh, bảng dữ liệu, CSV, TSV, HTML, bộ sưu tập đối tượng, ODS , JSON và nhiều định dạng tệp khác

Nếu bạn chưa quen với Thư viện Excel của chúng tôi, bạn nên làm theo hướng dẫn Bắt đầu của chúng tôi

Bạn đã là người dùng Syncfusion chưa? . Nếu chưa phải là người dùng Syncfusion, bạn có thể tải xuống bản dùng thử 30 ngày miễn phí tại đây

Nếu bạn có bất kỳ câu hỏi nào về các tính năng này, vui lòng cho chúng tôi biết trong phần bình luận bên dưới. Bạn cũng có thể liên hệ với chúng tôi qua diễn đàn hỗ trợ, Direct-Trac hoặc cổng thông tin phản hồi. Chúng tôi luôn sẵn lòng hỗ trợ bạn

Blog liên quan

  1. 6 cách dễ dàng để xuất dữ liệu sang Excel trong C#
  2. Cách xuất dữ liệu từ SQL Server sang bảng Excel trong C#
  3. Xuất dữ liệu từ Bộ sưu tập sang Excel và Nhóm nó trong C#
  4. Xuất dữ liệu sang Mẫu Excel được xác định trước trong C#

Thẻ

  • C#, Essential XlsIO, Excel, Xuất dữ liệu sang Excel trong C#, Định dạng tệp, HTML, vb. mạng lưới

Chia sẻ bài đăng này

Chia sẽ trên Twitter

Chia sẻ trên facebook

Chia sẻ trên Linkedin

Johnson Manohar

Johnson Manohar là Giám đốc sản phẩm cho XlsIO trong Phần mềm Syncfusion. Anh đam mê quản lý và cung cấp các sản phẩm chất lượng. Anh ấy là một nhà soạn nhạc và đã phát hành nhiều tựa album khác nhau

Bài viết khác

Nhận xét [9]

maharjan gagan

Tháng Mười Một 23, 2020 tại 8. 29 giờ sáng

chúng tôi nhập tệp ở đâu ???

Johnson Manohar

Tháng Mười Hai 2, 2020 tại 12. 39 giờ sáng

Chào gagan,

Truy vấn của bạn không rõ ràng. Bạn đang hỏi cách nhập tệp HTML vào bảng tính Excel? . Chỉ có thể nhập các bảng trong tệp HTML vào trang tính Excel

Nếu bạn có thể giải thích rõ ràng thắc mắc của mình, chúng tôi có thể hỗ trợ bạn

Trân trọng,
Johnson

kanti

Tháng Mười Hai 29, 2020 tại 3. 23 giờ sáng

xin chào, tôi muốn xuất một số cột đã chọn từ bảng…

MOHAN

Tháng Một 6, 2021 tại 5. 35 giờ sáng

Chào Kranti,

Không có tùy chọn để xuất các cột cụ thể từ bảng HTML sang Excel. Nhưng bạn có thể đạt được yêu cầu của mình bằng cách xóa các cột không mong muốn sau khi xuất sang bảng tính Excel

Bạn có thể tham khảo các liên kết sau để xóa các cột khỏi trang tính Excel bằng XlsIO

1. https. //www. đồng bộ hóa. com/kb/1918/xóa-excel-hàng-và-cột-trong-c-vb-net

2. https. //www. đồng bộ hóa. com/kb/1918/xóa-excel-hàng-và-cột-trong-c-vb-net

Trân trọng,
Mohan.

Avinash

17 Tháng Tư, 2021 tại 8. 33 giờ sáng

Chào Kranti,

Có một lựa chọn khác ở đó. bạn có thể trực tiếp sử dụng các phương thức hành động MVC và trực tiếp lấy dữ liệu từ cơ sở dữ liệu. bạn có thể thêm hoặc xóa các cột không mong muốn. sau đó xuất sang. xlsx

sử dụng phương thức hành động FileStreamResult trong MVC

Cách tốt nhất bạn có thể lưu trữ dữ liệu trong phiên. sau đó khi nhấp vào nút tải xuống excel. Lúc đó bạn có thể khôi phục dữ liệu từ đối tượng phiên và xuất nó sang excel

Trân trọng,
Avinash

sharma khắc nghiệt

29 Tháng Tư, 2022 tại 10. 06 giờ sáng

Xin chào Johnson và Avinash,

Tôi đang cố gắng xuất bảng trong html sang excel nhưng khi tôi tạo, tôi nhận được bảng excel trống. không thể chuyển đổi bảng html sang excel.
Tôi đang sử dụng asp. net mvc
Mã C# tôi đang sử dụng giống như trên.
Tôi đã sử dụng gói nuget để cài đặt dll.
Tôi đã đăng ký khóa cấp phép.
Tôi chưa sử dụng studio định dạng tệp cần thiết. do đó đã không sử dụng các phím mở khóa.
Tôi đã kết nối với giáo ben để tiếp cận bạn nhanh hơn.
Mong bạn trả lời nhanh chóng.

MOHAN CHANDRAN

Tháng Bảy 18, 2022 tại 7. 25 giờ sáng

Chào Harsh,

Chúng tôi đã khắc phục sự cố tương tự trong bản phát hành Tập 2 năm 2022 v20. 2. 0. 36. Chúng tôi khuyên bạn nên cập nhật lên phiên bản mới nhất và kiểm tra xem sự cố đã được khắc phục chưa. Vui lòng cập nhật cho chúng tôi nếu bạn vẫn gặp phải bất kỳ sự cố nào

Trân trọng,
Mohan.

Sunil

27 tháng 11, 2021 tại 8. 13 giờ chiều

Xin chào,

Bạn đã sử dụng các lớp kiểu như thế này –

Chủ Đề