Python chuyển đổi RTF sang HTML

Chuyển đổi tài liệu RTF sang HTML. Nó có hai công cụ hoạt động hơi khác một chút, vì vậy bạn có thể thử cả hai trên dữ liệu RTF của mình

Cài đặt

Theo mặc định, điều kiện tiên quyết duy nhất là cài đặt Python. Sau đó cài đặt mô-đun này

npm install unrtf

Thí dụ

var unrtf = require['unrtf'];

unrtf[
  '{\\rtf1\\ansi\\ansicpg1252\\cocoartf1265\\cocoasubrtf210\n{\\fonttbl\\f0\\fswiss\\fcharset0 Helvetica;}\n{\\colortbl;\\red255\\green255\\blue255;}\n\\paperw11900\\paperh16840\\margl1440\\margr1440\\vieww10800\\viewh8400\\viewkind0\n\\pard\\tx566\\tx1133\\tx1700\\tx2267\\tx2834\\tx3401\\tx3968\\tx4535\\tx5102\\tx5669\\tx6236\\tx6803\\pardirnatural\n\n\\f0\\fs24 \\cf0 Hello, World!\\\n\\\nThis is RTF. :-]}',
  function[error, result] {
    console.log[result.html];
  }
];

API

unrtf[doc, [tùy chọn], gọi lại]

tài liệu

Loại. chuỗi [bắt buộc]

Tài liệu RTF đầu vào mà bạn muốn chuyển đổi

tùy chọn

Loại. đối tượng [tùy chọn]

Ba tùy chọn được hỗ trợ

  1. công cụ, hãy chọn công cụ chuyển đổi RTF, "pyth" [mặc định] hoặc "unrtf"
  2. không sạch, nếu được đặt thành true, nó sẽ không cố gắng xóa mã HTML kết quả, chỉ áp dụng cho công cụ unrtf [mặc định là sai]
  3. thời gian chờ, đặt thời gian chờ gọi lệnh unrtf tính bằng mili giây [mặc định là 2000]

gọi lại

Loại. chức năng [bắt buộc]

Được gọi với kết quả hoặc lỗi, nếu có

động cơ

Bạn có thể chọn giữa hai động cơ

  1. "pyth" [mặc định], tùy thuộc vào Python được cài đặt trên hệ thống của bạn
  2. "unrtf", phụ thuộc vào tiện ích dòng lệnh

Nếu bạn muốn sử dụng công cụ unrtf, trước tiên bạn cần cài đặt tiện ích

  • Mac. brew install unrtf
  • Ubuntu. ________số 8_______
  • các cửa sổ. tìm bộ cài Windows tại đây

Bạn có thể đặt công cụ mặc định

var unrtf = require['unrtf'];

unrtf.defaultEngine = 'unrtf';

Giấy phép

Mã cho nút-unrtf được cấp phép theo giấy phép MIT. Xem tệp license.txt để biết thêm thông tin

Xin chào,

Tôi đang chuyển đổi một ứng dụng sang Python/PyQt, một trong những nhiệm vụ là
lấy dữ liệu từ cơ sở dữ liệu và hiển thị nó, không thành vấn đề,
vấn đề là một trong các trường dưới dạng văn bản ở định dạng văn bản có định dạng,
và nó cần được hiển thị mà không có đánh dấu RTF, tất nhiên
Có cách nào để chuyển đổi RTF sang HTML không?

Cảm ơn bạn trước
-------------- phần tiếp theo --------------
Tệp đính kèm HTML đã bị xóa
URL

Pyth cũng có thể tạo các tệp RTF, đọc và viết XHTML, tạo tài liệu từ đánh dấu Python a la Nevow's stan và có hỗ trợ thử nghiệm hạn chế cho đầu ra latex và pdf. Hỗ trợ RTF của nó khá mạnh mẽ -- chúng tôi sử dụng nó trong sản xuất để đọc các tệp RTF được tạo bởi các phiên bản khác nhau của Word, OpenOffice, Mac TextEdit, EIOffice và các phiên bản khác

Một thư viện python3 để trích xuất nội dung HTML & plain text được đóng gói từ các phần tử RTF của. tập tin msg

Giải đóng gói cho phép nội dung HTML và văn bản thuần túy được đóng gói trước đó được trích xuất và hiển thị dưới dạng HTML và văn bản thuần túy thay vì nội dung RTF được đóng gói. Sau khi đóng gói lại, HTML và văn bản thuần túy chỉ khác tối thiểu so với nội dung HTML hoặc văn bản thuần túy gốc

  • Đóng gói HTML từ HTML đóng gói RTF
  • Bỏ đóng gói văn bản thuần từ văn bản đóng gói RTF
  • Thư viện này bỏ trích dẫn hoàn toàn văn bản mà nó đóng gói lại vì nó không biết văn bản nào được trích dẫn trong quá trình chuyển đổi RTF và văn bản nào được trích dẫn trong html/văn bản gốc. Vì vậy, chẳng hạn, văn bản Trích dẫn-Có thể in đã thoát sẽ được trả về không thoát
  • Thư viện này hiện không thể kết hợp các tệp đính kèm từ một. Đối tượng MSG Message với HTML không được đóng gói. Điều này chủ yếu là do tôi không thể có được một tập hợp tốt các ví dụ về HTML được đóng gói có các đối tượng đính kèm cần được tích hợp trở lại vào phần thân của HTML
  • Trích xuất văn bản thuần túy từ HTML được đóng gói RTF. Nếu bạn muốn điều này, thì bạn sẽ phải phân tích cú pháp HTML bằng thư viện khác

Để cài đặt từ gói pip

pip3 install RTFDE

Đóng gói HTML hoặc TEXT

from RTFDE.deencapsulate import DeEncapsulator

with open['rtf_file', 'r'] as fp:
    raw_rtf  = fp.read[]
    rtf_obj = DeEncapsulator[raw_rtf]
    rtf_obj.deencapsulate[]
    if rtf_obj.content_type == 'html':
        print[rtf_obj.html]
    else:
        print[rtf_obj.text]

Vui lòng kiểm tra hướng dẫn đóng góp

Vui lòng xem tệp giấy phép để biết thông tin giấy phép trên RTFDE. Nếu bạn có thêm câu hỏi liên quan đến cấp phép VUI LÒNG tạo một vấn đề về nó trên github

Làm cách nào để chuyển đổi RTF sang CSV bằng Python?

Các bước chuyển đổi tệp văn bản sang CSV bằng Python .
Bước 1. Cài đặt gói Pandas. Nếu bạn chưa làm như vậy, hãy cài đặt gói Pandas. .
Bước 2. Chụp đường dẫn nơi tệp văn bản của bạn được lưu trữ. .
Bước 3. Chỉ định đường dẫn nơi tệp CSV mới sẽ được lưu. .
Bước 4. Chuyển đổi tệp văn bản thành CSV bằng Python

Bạn có thể chuyển đổi RTF sang TXT không?

1. Chuyển đổi tệp RTF thành tệp văn bản bằng trình xử lý văn bản . Để thực hiện việc này, trước tiên hãy mở tệp trong một chương trình như Microsoft Word hoặc OpenOffice Writer. Chọn lệnh “Lưu dưới dạng” trong menu Tệp, chọn định dạng TXT trong menu thả xuống và nhấp vào “Lưu. ”

Làm cách nào để chuyển đổi tệp RTF sang HTML trong C#?

Thêm tham chiếu thư viện [nhập thư viện] vào dự án C# của bạn. Mở tệp RTF nguồn trong C#. Gọi phương thức 'Save[]', chuyển tên tệp đầu ra có phần mở rộng HTML. Nhận kết quả chuyển đổi RTF dưới dạng HTML

Bạn có thể chuyển đổi RTF sang CSV không?

Bạn có thể chuyển đổi tài liệu RTF của mình từ mọi nền tảng [Windows, Linux, macOS] . Không cần đăng ký. Chỉ cần kéo và thả tệp RTF của bạn vào biểu mẫu tải lên, chọn định dạng đầu ra mong muốn và nhấp vào nút chuyển đổi. Sau khi chuyển đổi hoàn tất, bạn có thể tải xuống tệp CSV của mình.

Chủ Đề