Hướng dẫn dùng pdf python python
Show Sep 21 2022 Trên thực tế, File PDF là một trong những phương tiện truyền thông kỹ thuật số quan trọng nhất và được sử dụng rộng rãi. PDF là viết tắt của Portable Document Format… Trong bài viết này, hãy cùng UniTrain thực hiện 2 chức năng tách PDF và thêm hình nền mờ vào trang PDF bằng cách sử dụng Python đơn giản! 1. Tách tệp PDFOutput sẽ là ba tệp PDF mới với split 1 (page 0,1), split 2(page 2,3), split 3(page 4-end). Không có chức năng hoặc lớp mới nào được sử dụng trong chương trình python trên. Sử dụng logic đơn giản và lặp đi lặp lại để tạo ra các phân tách pdf theo phân chia danh sách được thông qua. 2. Thêm hình nền mờ vào trang PDFDưới đây là trang đầu tiên của file pdf gốc (trái) và mờ (phải) trông như thế nào:
wmFileObj = open(wmFile, ‘rb’) pdfReader = PyPDF2.PdfFileReader(wmFileObj) pageObj.mergePage(pdfReader.getPage(0)) wmFileObj.close() return pageObj
UniTrain lược dịch Xem thêm Cách khai báo và sử dụng một biến trong PYTHON Cách tạo tệp Zip bằng Python Giới thiệu về ngôn ngữ lập trình Python Related Post
Công việc của mình thường xuyên phải gộp nhiều trang PDF nhỏ thành 1 file PDF, bình thường thì việc gộp file PDF này có thể được thực hiện bằng một số công cụ online như smallpdf, hoặc 1 số phần mềm xử lý pdf của Adobe. Tuy nhiên, mình không muốn file pdf của mình bị upload lên các dịch vụ online, mà cài cả 1 phần mềm Adobe cần phải trả phí vào chỉ để gộp PDF thì mình cũng không muốn, vậy nên trong bài này mình sẽ chia sẻ với các bạn cách chúng ta có thể tự tạo ra một công cụ dòng lệnh (CLI – tool) để có thể gộp nhiều trang PDF thành 1 tài liệu PDF bằng Python. Các hướng dẫn trong bài này mình thực hiện trên hệ điều hành MacOS, với hệ điều hành Windows, hoặc các hệ điều hành khác, thì cũng tương tự.
Cài đặt thư viện xử lý PDF trong PythonCó rất nhiều thư viện để xử lý PDF trong Python, trong bài này, mình dùng PyPDF2, để cài đặt, chúng ta sử dụng dòng lệnh sau trong ứng dụng Terminal của MacOS:
Sau khi cài đặt thành công thì chúng ta có thể chuyển qua bước tiếp theo Sử dụng Python để gộp các files PDFChúng ta có thể lưu đoạn code sau đây trong một file Python, mình lưu ở file join.py tại đường dẫn
Các bạn có thể lưu code ở một đường dẫn khác tuỳ ý các bạn. Đoạn code như sau:
Cách sử dụng code Python để gộp file PDFCách sử dụng công cụ này như sau, trong cửa sổ Terminal, bạn có thể gõ theo cú pháp sau đây
Trong cú pháp trên, sau “-o” bạn để tên của file đã được gộp, sau “-i” bạn để danh sách các file con sẽ gộp. Vì nếu viết hết đường dẫn tới các files cần gộp sẽ rất dài, vậy nên khi sử dụng, mình thường chuyển thư mục hiện tại tới thư mục chứa các file pdf cần gộp, sau đó có thể tham chiếu tới các file bởi tên file mà không cần đường dẫn đầy đủ. Như vậy, trong bài viết này, chúng ta đã có thể tạo ra được một công cụ đơn giản phục vụ cho công việc gộp file PDF thành 1 file. Chúc các bạn ứng dụng tốt vào công việc. Các bạn có thể học thêm nhiều kỹ thuật sử dụng Python để tương tác với Excel, tạo ra nhiều công cụ điều khiển Excel, tương tác với các phần mềm trên Web trong khoá học Lập trình tương tác python Excel – chìa khoá tối ưu công việc của Thanh. Tác giả: dtnguyen (Nguyễn Đức Thanh)@ Học Excel Online | DTNguyen.business |