Chuyển đổi tài liệu RTF sang HTML. Nó có hai công cụ hoạt động hơi khác một chút, vì vậy bạn có thể thử cả hai trên dữ liệu RTF của mình
Cài đặt
Theo mặc định, điều kiện tiên quyết duy nhất là cài đặt Python. Sau đó cài đặt mô-đun này
npm install unrtf
Thí dụ
var unrtf = require['unrtf']; unrtf[ '{\\rtf1\\ansi\\ansicpg1252\\cocoartf1265\\cocoasubrtf210\n{\\fonttbl\\f0\\fswiss\\fcharset0 Helvetica;}\n{\\colortbl;\\red255\\green255\\blue255;}\n\\paperw11900\\paperh16840\\margl1440\\margr1440\\vieww10800\\viewh8400\\viewkind0\n\\pard\\tx566\\tx1133\\tx1700\\tx2267\\tx2834\\tx3401\\tx3968\\tx4535\\tx5102\\tx5669\\tx6236\\tx6803\\pardirnatural\n\n\\f0\\fs24 \\cf0 Hello, World!\\\n\\\nThis is RTF. :-]}', function[error, result] { console.log[result.html]; } ];
API
unrtf[doc, [tùy chọn], gọi lại]
tài liệu
Loại. chuỗi [bắt buộc]
Tài liệu RTF đầu vào mà bạn muốn chuyển đổi
tùy chọn
Loại. đối tượng [tùy chọn]
Ba tùy chọn được hỗ trợ
- công cụ, hãy chọn công cụ chuyển đổi RTF, "pyth" [mặc định] hoặc "unrtf"
- không sạch, nếu được đặt thành true, nó sẽ không cố gắng xóa mã HTML kết quả, chỉ áp dụng cho công cụ
unrtf
[mặc định là sai] - thời gian chờ, đặt thời gian chờ gọi lệnh
unrtf
tính bằng mili giây [mặc định là 2000]
gọi lại
Loại. chức năng [bắt buộc]
Được gọi với kết quả hoặc lỗi, nếu có
động cơ
Bạn có thể chọn giữa hai động cơ
- "pyth" [mặc định], tùy thuộc vào Python được cài đặt trên hệ thống của bạn
- "unrtf", phụ thuộc vào tiện ích dòng lệnh
Nếu bạn muốn sử dụng công cụ unrtf, trước tiên bạn cần cài đặt tiện ích
- Mac.
brew install unrtf
- Ubuntu. ________số 8_______
- các cửa sổ. tìm bộ cài Windows tại đây
Bạn có thể đặt công cụ mặc định
var unrtf = require['unrtf']; unrtf.defaultEngine = 'unrtf';
Giấy phép
Mã cho nút-unrtf được cấp phép theo giấy phép MIT. Xem tệp license.txt
để biết thêm thông tin
Xin chào,
Tôi đang chuyển đổi một ứng dụng sang Python/PyQt, một trong những nhiệm vụ là
lấy dữ liệu từ cơ sở dữ liệu và hiển thị nó, không thành vấn đề,
vấn đề là một trong các trường dưới dạng văn bản ở định dạng văn bản có định dạng,
và nó cần được hiển thị mà không có đánh dấu RTF, tất nhiên
Có cách nào để chuyển đổi RTF sang HTML không?
Cảm ơn bạn trước
-------------- phần tiếp theo --------------
Tệp đính kèm HTML đã bị xóa
URL
Pyth cũng có thể tạo các tệp RTF, đọc và viết XHTML, tạo tài liệu từ đánh dấu Python a la Nevow's stan và có hỗ trợ thử nghiệm hạn chế cho đầu ra latex và pdf. Hỗ trợ RTF của nó khá mạnh mẽ -- chúng tôi sử dụng nó trong sản xuất để đọc các tệp RTF được tạo bởi các phiên bản khác nhau của Word, OpenOffice, Mac TextEdit, EIOffice và các phiên bản khác
Một thư viện python3 để trích xuất nội dung HTML
& plain text
được đóng gói từ các phần tử RTF
của. tập tin msg
Giải đóng gói cho phép nội dung HTML và văn bản thuần túy được đóng gói trước đó được trích xuất và hiển thị dưới dạng HTML và văn bản thuần túy thay vì nội dung RTF được đóng gói. Sau khi đóng gói lại, HTML và văn bản thuần túy chỉ khác tối thiểu so với nội dung HTML hoặc văn bản thuần túy gốc
- Đóng gói HTML từ HTML đóng gói RTF
- Bỏ đóng gói văn bản thuần từ văn bản đóng gói RTF
- Thư viện này bỏ trích dẫn hoàn toàn văn bản mà nó đóng gói lại vì nó không biết văn bản nào được trích dẫn trong quá trình chuyển đổi RTF và văn bản nào được trích dẫn trong html/văn bản gốc. Vì vậy, chẳng hạn, văn bản Trích dẫn-Có thể in đã thoát sẽ được trả về không thoát
- Thư viện này hiện không thể kết hợp các tệp đính kèm từ một. Đối tượng MSG Message với HTML không được đóng gói. Điều này chủ yếu là do tôi không thể có được một tập hợp tốt các ví dụ về HTML được đóng gói có các đối tượng đính kèm cần được tích hợp trở lại vào phần thân của HTML
- Trích xuất văn bản thuần túy từ HTML được đóng gói RTF. Nếu bạn muốn điều này, thì bạn sẽ phải phân tích cú pháp HTML bằng thư viện khác
Để cài đặt từ gói pip
pip3 install RTFDE
Đóng gói HTML hoặc TEXT
from RTFDE.deencapsulate import DeEncapsulator with open['rtf_file', 'r'] as fp: raw_rtf = fp.read[] rtf_obj = DeEncapsulator[raw_rtf] rtf_obj.deencapsulate[] if rtf_obj.content_type == 'html': print[rtf_obj.html] else: print[rtf_obj.text]
Vui lòng kiểm tra hướng dẫn đóng góp
Vui lòng xem tệp giấy phép để biết thông tin giấy phép trên RTFDE. Nếu bạn có thêm câu hỏi liên quan đến cấp phép VUI LÒNG tạo một vấn đề về nó trên github