Hướng dẫn pdf to html php - PDF và htmlphp
Giới thiệuBạn có 1 file tài liệu PDF. Bạn muốn hiển thị nội dung của nó lên website của mình dưới dạng text/html giống như một số trang tài liệu như tailieu.vn đang làm. Việc website của bạn hiển thị nội dung của file PDF dưới dạng text thì sẽ có nhiều lợi ích về SEO. Show Nó làm cho nội dung bài viết của bạn ngoài việc sử dụng 6 hoặc 7 để chèn file PDF thì còn có text nữa, làm tăng chất lượng cho bài viết của bạn. Tính năng này phù hợp với những website về tài liệu, sách.Hôm nay mình xin giới thiệu đến các bạn cách để convert file PDF sang HTML bằng PHP. Đó là sử dụng package 8. Nó hoạt động dựa trên thư viện Poppler. (Poppler là một thư viện rendering PDF dựa trên base là thư viện xpdf-3.0.). Mình sẽ cài đặt và sử dụng nó trên Laravel 5.5.Laravel 5.5.Cài đặtCài đặt PopplerTrước hết, các bạn phải cài đặt thư viện Poppler (bắt buộc phải cài để convert PDF to HTML). Debian/Ubuntu
Mac OS X
WindowsCác bạn download và cài đặt theo hướng dẫn sau: http://blog.alivate.com.au/poppler-windows/ Thư viện PDF to HTML nằm ở đâu?Sau khi cài đặt 9, bạn vào thư mục 0 (mình sử dụng Ubuntu) sẽ thấy nó có rất nhiều tính năng, ví dụ như: 1, 2, 3, 4,... Bạn có thể kiểm tra thư viện PDF to HTML nó nằm ở đâu bằng command như dưới đây:
pdftohtml: /usr/bin/pdftohtml
pdfinfo: /usr/bin/pdfinfo
/usr/local/bin/pdfinfo
Windows
Thư viện PDF to HTML nằm ở đâu?Sau khi cài đặt 9, bạn vào thư mục 0 (mình sử dụng Ubuntu) sẽ thấy nó có rất nhiều tính năng, ví dụ như: 1, 2, 3, 4,...
Bạn có thể kiểm tra thư viện PDF to HTML nó nằm ở đâu bằng command như dưới đây:
pdftohtml: /usr/bin/pdftohtmlpdfinfo: /usr/bin/pdfinfo /usr/local/bin/pdfinfo
Cài đặt package
Trong project của bạn, chạy command:
0
1
9. Mình sẽ convert file này sang HTML:
3Ngoài các config trên, bạn có thể tham khảo full list setting của nó như sau:Kết quả Lấy thông tin file pdf:
4
5 2 Lấy nội dung của tất cả các trang:Nó sinh ra đoạn code html kèm css luôn. Các bạn có thấy nó giống y hệt với file pdf ban đầu không? Rất đẹp nữa phải không nào? |