Làm cách nào để đọc dữ liệu từ PPT trong python?

Cách sử dụng điển hình sẽ là tạo bản trình bày PowerPoint tùy chỉnh từ nội dung cơ sở dữ liệu, có thể tải xuống bằng cách nhấp vào liên kết trong ứng dụng web. Một số nhà phát triển đã sử dụng nó để tự động sản xuất các báo cáo trạng thái kỹ thuật sẵn sàng trình bày dựa trên thông tin có trong hệ thống quản lý công việc của họ. Nó cũng có thể được sử dụng để thực hiện cập nhật hàng loạt cho thư viện bản trình bày hoặc đơn giản là để tự động hóa việc sản xuất một hoặc hai trang trình bày sẽ rất tẻ nhạt nếu thực hiện ngay bằng tay

Lịch sử phát hành

0. 6. 21 [2021-09-20]

  • Khắc phục sự cố #741 _DirPkgReader phải triển khai. __chứa đựng__[]

0. 6. 20 [2021-09-14]

  • Khắc phục sự cố #206 chứa các tham chiếu mục tiêu NULL trong các mối quan hệ

  • Khắc phục #223 tên tệp hình ảnh thoát xuất hiện dưới dạng chữ trong XML

  • Khắc phục tùy chọn #517 để hiển thị các loại/giá trị biểu đồ theo thứ tự ngược lại

  • Tái cấu trúc chính mã tải gói cũ

0. 6. 19 [2021-05-17]

  • Thêm hình dạng. add_ole_object[], cho phép nhúng tùy ý tệp Excel hoặc tệp nhị phân khác dưới dạng hình dạng trên trang trình bày. Đối tượng OLE được biểu diễn dưới dạng một biểu tượng

0. 6. 18 [2019-05-02]

  • getters thuộc tính văn bản mã hóa ngắt dòng dưới dạng tab dọc [VT, 'v', ASCII 11/x0B]. Điều này phù hợp với hành vi sao chép/dán của PowerPoint và cho phép phân biệt các dấu ngắt giống như [dấu xuống dòng mềm] với ranh giới đoạn văn. Trước đây, ngắt dòng được mã hóa thành một dòng mới ['n'] và không thể phân biệt được với ranh giới đoạn văn

    thuộc tính văn bản bao gồm Hình dạng. văn bản, _Ô. văn bản, Khung văn bản. văn bản, _Đoạn văn. văn bản và _Run. chữ

  • trình thiết lập thuộc tính văn bản chấp nhận ký tự tab dọc và đặt phần tử ngắt dòng ở vị trí đó. Tất cả các ký tự điều khiển khác ngoài tab ngang ['t'] và dòng mới ['n'] trong phạm vi x00-x1F đều được chấp nhận và thoát bằng văn bản thuần như “_x001B” cho ESC [ASCII 27]

    Trước đây, một ký tự điều khiển không phải là tab hoặc dòng mới trong một chuỗi được chỉ định sẽ kích hoạt một ngoại lệ liên quan đến ký tự XML không hợp lệ

0. 6. 17 [2018-12-16]

  • Thêm SlideLayout. remove[] - Xóa bố cục slide không sử dụng

  • Thêm SlideLayout. used_by_slides - Nhận các trang chiếu dựa trên bố cục trang chiếu này

  • Thêm SlideLayout. index[] - Nhận chỉ mục của bố cục trang chiếu trong bản gốc

  • Thêm SlideLayout. get_by_name[] - Nhận bố cục slide theo tên str của nó

0. 6. 16 [2018-11-09]

  • Tính năng #395 Nhãn dữ liệu. hiển thị_* thuộc tính, e. g. . show_percentage

  • Tính năng #453 Chấp nhận dữ liệu biểu đồ Không có nhãn

0. 6. 15 [24-09-2018]

  • Sửa lỗi #436 ValueAxis. _cross_xAx không thành công trên c. ngàyTrục

0. 6. 14 [2018-09-24]

  • Thêm _Ô. hợp nhất[]

  • Thêm _Ô. tách ra[]

  • Thêm _Ô. __eq__[]

  • Thêm _Ô. is_merge_origin

  • Thêm _Ô. is_spanned

  • Thêm _Ô. span_height

  • Thêm _Ô. span_width

  • Thêm _Ô. trình lấy văn bản

  • Thêm bảng. iter_cells[]

  • Di chuyển pptx. hình dạng. mô-đun bảng sang pptx. bàn

  • Thêm tài liệu người dùng 'Làm việc với bảng'

0. 6. 13 [2018-09-10]

  • Thêm biểu đồ. nét chữ

  • Sửa lỗi #293 Không thể ẩn tiêu đề của Biểu đồ chuỗi đơn

  • Sửa hình dạng. giá trị chiều rộng không phải là loại Emu

  • Sửa chữa thêm một. defRPr với c. phong phú [sửa một số lỗi kế thừa phông chữ]

0. 6. 12 [2018-08-11]

  • Thêm ảnh. auto_shape_type

  • Xóa Python 2. 6 thử nghiệm từ bản dựng

  • Cập nhật các phụ thuộc để tránh phiên bản Gối dễ bị tấn công

  • Sửa #260, #301, #382, #401

  • Thêm _Đoạn văn. add_line_break[]

  • Thêm trình kết nối. đường kẻ

0. 6. 11 [25-07-2018]

  • Thêm màu tô chuyển sắc

  • Thêm tùy chọn “thêm turbo” thử nghiệm để tạo các trang trình bày có số lượng hình dạng lớn

0. 6. 10 [2018-06-11]

  • Thêm hình dạng. thuộc tính bóng để tự động định hình, trình kết nối, hình ảnh và hình dạng nhóm, trả về một đối tượng ShadowFormat

  • Thêm đối tượng ShadowFormat với chức năng đọc/ghi [boolean]. thừa kế tài sản

  • Fix #328 thêm hỗ trợ cho hơn 26 chuỗi trong biểu đồ

0. 6. 9 [2018-05-08]

  • Thêm ảnh. crop_x setters, cho phép đặt các giá trị cắt xén ảnh, ngoài việc thẩm vấn

  • Thêm trang trình bày. nền và SlideMaster. nền, cho phép đặt màu nền cho một trang chiếu riêng lẻ hoặc cho tất cả các trang chiếu dựa trên trang chiếu cái

  • Thêm tham số hình dạng tùy chọn vào Hình dạng. add_group_shape, cho phép hình thành nhóm từ một số hình dạng hiện có

  • Cải thiện hiệu quả của Shapes. _next_shape_id để cải thiện hiệu suất trên các trang trình bày có số lượng hình dạng cao

0. 6. 8 [2018-04-18]

  • Thêm GroupShape, cung cấp các thuộc tính cụ thể cho một nhóm hình dạng, bao gồm cả thuộc tính hình dạng của nó

  • Thêm GroupShapes, cung cấp quyền truy cập vào các hình dạng có trong một hình dạng nhóm

  • Thêm SlideShapes. add_group_shape[], cho phép thêm một nhóm hình vào slide

  • Thêm GroupShapes. add_group_shape[], cho phép thêm một hình dạng nhóm vào một hình dạng nhóm, cho phép các nhóm đa cấp, đệ quy

  • Thêm hỗ trợ để thêm hành vi nhảy đến trang chiếu được đặt tên để định hình và chạy siêu kết nối

0. 6. 7 [30-10-2017]

  • Thêm SlideShapes. build_freeform[], cho phép chỉ định và thêm các hình dạng tự do [chẳng hạn như bản đồ] vào trang chiếu

  • Thêm hỗ trợ cho các kiểu tô theo khuôn mẫu

  • Thêm định dạng dòng. dash_style để cho phép thẩm vấn và thiết lập các kiểu đường đứt nét

0. 6. 6 [2017-06-17]

  • Thêm SlideShapes. add_movie[], cho phép thêm phương tiện video vào trang chiếu

  • fix #190 Điều chỉnh các tên bộ phận không phù hợp có phân đoạn chỉ mục '00'

  • sửa lỗi #273 Chứa tên bộ phận không phù hợp không có phân đoạn chỉ mục

  • sửa lỗi #277 ASCII/Unicode trên tên danh mục đa cấp không phải ASCII

  • sửa chữa #279 Hình dạng cơ sở. cảnh báo id xuất hiện trên quyền truy cập trình giữ chỗ

0. 6. 5 [21-03-2017]

  • #267 đền bù cho hành vi PowerPoint không phù hợp trên c. phần tử lớp phủ

  • đền bù cho hành vi PowerPoint không phù hợp [theo thông số kỹ thuật] liên quan đến c. dLbl/c. tx dẫn đến lỗi "không thể lưu" khi nhãn dữ liệu rõ ràng được thêm vào bong bóng trên biểu đồ bong bóng

0. 6. 4 [2017-03-17]

  • thêm biểu đồ. đối tượng chart_title và ChartTitle

  • #263 Sử dụng loại Số để kiểm tra danh mục số

0. 6. 3 [28-02-2017]

  • thêm DataLabel. nét chữ

  • thêm Trục. axis_title

0. 6. 2 [2017-01-03]

  • thêm hỗ trợ cho NotesSlide [ghi chú slide, hay còn gọi là. trang ghi chú]

  • thêm hỗ trợ cho thứ tự chuỗi tùy ý trong XML

  • thêm cốt truyện. danh mục cung cấp quyền truy cập vào danh mục phân cấp trong biểu đồ hiện có

  • thêm hỗ trợ cho trục ngày trên biểu đồ danh mục, bao gồm viết phần tử dateAx cho trục danh mục khi danh mục ChartData là ngày hoặc giờ

SỰ KHÔNG TƯƠNG THÍCH LẠI

Một số thay đổi đã được thực hiện đối với XML soạn sẵn được sử dụng để tạo biểu đồ mới. Điều này được thực hiện để tuân thủ chặt chẽ hơn các cài đặt mà PowerPoint sử dụng khi tạo biểu đồ bằng giao diện người dùng. Điều này có thể dẫn đến một số thay đổi về giao diện trong biểu đồ sau khi nâng cấp. Đặc biệt

  • Đồ thị. has_legend hiện mặc định là True cho biểu đồ Đường

  • Kịch bản. biến_by_categories hiện được mặc định là Sai đối với biểu đồ Đường

0. 6. 1 [2016-10-09]

0. 6. 0 [2016-08-18]

  • thêm các loại biểu đồ XY

  • thêm các loại biểu đồ bong bóng

  • thêm các loại biểu đồ Radar

  • thêm các loại biểu đồ khu vực

  • thêm các loại biểu đồ Donut

  • thêm sê-ri. điểm và Điểm

  • thêm điểm. data_label

  • thêm DataLabel. text_frame

  • thêm DataLabel. Chức vụ

  • thêm Trục. major_gridlines

  • thêm ChartFormat với. điền và. đường kẻ

  • thêm Trục. định dạng [điền và định dạng dòng]

  • thêm ValueAxis. chéo và. chéo_at

  • thêm điểm. định dạng [điền và định dạng dòng]

  • thêm Trang trình bày. slide_id

  • thêm Trang trình bày. get[] [theo id trang trình bày]

  • thêm phông chữ. language_id

  • hỗ trợ các điểm dữ liệu trống [Không] trong các biểu đồ đã tạo

  • thêm sê-ri. đánh dấu

  • thêm điểm. đánh dấu

  • thêm điểm đánh dấu. định dạng,. phong cách và. kích thước

0. 5. 8 [27-11-2015]

  • thêm hình dạng. click_action [siêu liên kết trên hình dạng]

  • sửa chữa. #128 Biểu đồ tên mèo và tên ser không thoát

  • sửa chữa. #153 hình dạng. tiêu đề tăng trên không có hình dạng tiêu đề

  • sửa chữa. #170 xóa tìm kiếm [0] khỏi Hình ảnh. from_file[]

0. 5. 7 [2015-01-17]

  • thêm PicturePlaceholder với. phương thức insert_picture[]

  • thêm TablePlaceholder với. phương thức insert_table[]

  • thêm ChartPlaceholder với. phương thức insert_chart[]

  • Thêm ảnh. thuộc tính image, trả về đối tượng Image

  • Thêm ảnh. crop_left,. crop_top,. crop_right và. crop_bottom

  • thêm hình dạng. placeholder_format và đối tượng PlaceholderFormat

SỰ KHÔNG TƯƠNG THÍCH LẠI

Hình dạng. shape_type hiện là MSO_SHAPE_TYPE vô điều kiện. PLACEHOLDER cho tất cả các hình dạng giữ chỗ. Trước đây, một số hình dạng trình giữ chỗ đã báo cáo MSO_SHAPE_TYPE. AUTO_SHAPE, MSO_SHAPE_TYPE. BIỂU ĐỒ, MSO_SHAPE_TYPE. HÌNH ẢNH hoặc MSO_SHAPE_TYPE. BẢNG cho thuộc tính đó

0. 5. 6 [2014-12-06]

  • sửa lỗi #138 - UnicodeDecodeError trong thiết lập. py trên Windows 7 Python 3. 4

0. 5. 5 [2014-11-17]

  • tính năng #51 - thêm hỗ trợ Python 3

0. 5. 4 [2014-11-15]

  • tính năng #43 - kích thước gốc của hình ảnh trong hình dạng. add_picture[] hiện được tính toán dựa trên thuộc tính DPI trong tệp hình ảnh, nếu có, mặc định là 72 dpi

  • tính năng #113 - Thêm đoạn văn. dấu cách_trước, Đoạn văn. dấu cách_sau và Đoạn văn. line_spacing

0. 5. 3 [2014-11-09]

  • thêm tính năng thử nghiệm TextFrame. fit_text[]

0. 5. 2 [26-10-2014]

  • fix #127 - Shape. text_frame không thành công về hình dạng không có txBody

0. 5. 1 [22-09-2014]

  • tính năng #120 - thêm Hình dạng. Vòng xoay

  • tính năng #97 - thêm Phông chữ. gạch dưới

  • vấn đề #117 - thêm hỗ trợ hình ảnh BMP

  • vấn đề #95 - thêm BaseShape. người đặt tên

  • vấn đề #107 - tất cả. thuộc tính văn bản sẽ trả về unicode, không phải str

  • tính năng #106 - thêm. chuyển văn bản thành Hình dạng, Khung văn bản và Đoạn văn

  • Đổi tên hình dạng. khung văn bản thành Shape. text_frame. Hình dạng. thuộc tính khung văn bản [theo tên đó] không được dùng nữa

0. 5. 0 [2014-09-13]

  • Thêm hỗ trợ để tạo và thao tác biểu đồ thanh, cột, đường và hình tròn

  • Tái cấu trúc chính của lớp XML [oxml]

  • Truy cập hình dạng đối tượng đồ họa được hợp lý hóa Lưu ý các điểm không tương thích ngược bên dưới

SỰ KHÔNG TƯƠNG THÍCH LẠI

Một bảng không còn được coi là một hình dạng. Thay vào đó, nó là một đối tượng đồ họa chứa trong một hình dạng Khung đồ họa, cũng như các đối tượng Biểu đồ và SmartArt

Thí dụ

table = shapes.add_table[...]

# becomes

graphic_frame = shapes.add_table[...]
table = graphic_frame.table

# or

table = shapes.add_table[...].table

Là hình dạng bao quanh, id, tên, loại hình dạng, vị trí và kích thước là các thuộc tính của đối tượng GraphicFrame bao quanh

Nội dung của một hình dạng GraphicFrame có thể được xác định bằng cách sử dụng ba thuộc tính có sẵn trên một hình dạng. has_table, has_chart và has_smart_art. Đối tượng đồ họa kèm theo được lấy bằng thuộc tính GraphicFrame. bảng và Khung đồ họa. đồ thị. SmartArt chưa được hỗ trợ. Truy cập một trong những thuộc tính này trên một GraphicFrame không chứa đối tượng tương ứng sẽ tạo ra một ngoại lệ

0. 4. 2 [2014-04-29]

  • sửa chữa. vấn đề #88 – phát sinh đối với tệp hình ảnh được hỗ trợ có phần mở rộng chữ hoa

  • sửa chữa. vấn đề #89 – phát sinh trên add_slide[] trong đó các id hiện có không liền kề

0. 4. 1 [29-04-2014]

  • Đổi tên bản trình bày. slidemasters để trình bày. slide_masters. Bài thuyết trình. thuộc tính slidemasters không được dùng nữa

  • Đổi tên bản trình bày. slidelayouts để trình bày. slide_layouts. Bài thuyết trình. thuộc tính slidelayouts không được dùng nữa

  • Đổi tên SlideMaster. bố cục trang chiếu vào Slide Master. slide_layouts. SlideMaster. thuộc tính slidelayouts không được dùng nữa

  • Đổi tên SlideLayout. trang chiếu cái sang Bố cục trang chiếu. slide_master. SlideLayout. thuộc tính slidemaster không được dùng nữa

  • Đổi tên trang trình bày. bố cục trang trình bày thành Trang trình bày. slide_layout. Cầu trượt. thuộc tính slidelayout không được dùng nữa

  • Thêm SlideMaster. hình dạng để truy cập hình dạng trên trang chiếu cái

  • Thêm SlideMaster. trình giữ chỗ để truy cập các hình dạng trình giữ chỗ trên trang chiếu cái

  • Thêm lớp _MasterPlaceholder

  • Thêm lớp _LayoutPlaceholder với vị trí và kích thước có thể kế thừa từ trình giữ chỗ chính

  • Thêm lớp _SlidePlaceholder với vị trí và kích thước kế thừa từ trình giữ chỗ bố cục

  • Thêm bảng. Thuộc tính đọc/ghi bên trái, trên cùng, chiều rộng và chiều cao

  • Thêm GroupShape thô sơ với các thuộc tính bên trái, trên cùng, chiều rộng và chiều cao

  • Thêm Trình kết nối thô sơ với các thuộc tính bên trái, trên cùng, chiều rộng và chiều cao

  • Thêm khung văn bản. thuộc tính auto_size

  • Thêm bản trình bày. slide_width và. thuộc tính đọc/ghi slide_height

  • Thêm lớp LineFormat cung cấp quyền truy cập để đọc và thay đổi màu sắc và chiều rộng của đường kẻ

  • Thêm hình tự động. đường kẻ

  • Thêm ảnh. đường kẻ

  • Hợp lý hóa phép liệt kê. Lưu ý sự không tương thích ngược bên dưới

SỰ KHÔNG TƯƠNG THÍCH LẠI

Các bảng liệt kê sau đã được di chuyển/đổi tên trong quá trình hợp lý hóa các bảng liệt kê

  • pptx. liệt kê. MSO_COLOR_TYPE –> pptx. liệt kê. dml. MSO_COLOR_TYPE

  • pptx. liệt kê. MSO_FILL –> pptx. liệt kê. dml. MSO_FILL

  • pptx. liệt kê. MSO_THEME_COLOR –> pptx. liệt kê. dml. MSO_THEME_COLOR

  • pptx. hằng số. MSO. ANCHOR_* –> pptx. liệt kê. chữ. MSO_ANCHOR. *

  • pptx. hằng số. MSO_SHAPE -> pptx. liệt kê. hình dạng. MSO_SHAPE

  • pptx. hằng số. PP. Căn chỉnh_* –> pptx. liệt kê. chữ. PP_ALIGN. *

  • pptx. hằng số. MSO. {SHAPE_TYPES} –> pptx. liệt kê. hình dạng. MSO_SHAPE_TYPE. *

Tài liệu cho tất cả các phép liệt kê có sẵn trong phần Bảng liệt kê của Hướng dẫn sử dụng

0. 3. 2 [2014-02-07]

  • bản sửa lỗi. sự cố #80 bản trình bày được tạo không tải được trong Keynote và các ứng dụng khác của Apple

0. 3. 1 [2014-01-10]

  • bản sửa lỗi. không thể tải một số bản trình bày có chứa hình ảnh có phần mở rộng chữ hoa

0. 3. 0 [2013-12-12]

  • Thêm thuộc tính màu phông chữ đọc/ghi hỗ trợ RGB, màu chủ đề và các loại màu kế thừa

  • Thêm kiểu chữ và hỗ trợ in nghiêng

  • Thêm lề khung văn bản và ngắt từ

  • Thêm hỗ trợ cho các mối quan hệ bên ngoài, đ. g. bảng tính được liên kết

  • Thêm hỗ trợ siêu liên kết cho văn bản chạy trong hình dạng và ô bảng

  • Thêm màu tô và độ sáng cho hình và ô bảng, cũng có thể đặt màu tô thành trong suốt [không tô]

  • Thêm thuộc tính vị trí và kích thước đọc/ghi vào hình dạng và hình ảnh

  • Thay thế phụ thuộc PIL bằng Gối

  • Tái cấu trúc các mô-đun để phù hợp hơn với kích thước của thư viện

0. 2. 6 [22-06-2013]

  • Thêm quyền truy cập đọc/ghi vào các thuộc tính tài liệu cốt lõi

  • Hotfix để chứa hình dạng kết nối trong AutoShapeType

  • Hotfix để cho phép các phần customXml tải khi xuất hiện

0. 2. 5 [2013-06-11]

  • Thêm thuộc tính căn chỉnh đoạn [trái, phải, căn giữa, v.v. ]

  • Thêm căn chỉnh theo chiều dọc trong ô của bảng [trên cùng, giữa, dưới cùng]

  • Thêm thuộc tính lề ô của bảng

  • Thêm thuộc tính boolean của bảng. cột đầu tiên [tiêu đề hàng], hàng đầu tiên [tiêu đề cột], hàng cuối cùng [đối với e. g. hàng tổng], cột cuối cùng [đối với e. g. tổng số hàng], dải ngang và dải dọc

  • Thêm hỗ trợ cho các giá trị điều chỉnh hình dạng tự động, e. g. thay đổi bán kính làm tròn góc trên hình chữ nhật tròn, vị trí của mũi tên chú thích, v.v.

0. 2. 4 [2013-05-16]

  • Thêm hỗ trợ cho hình dạng tự động [e. g. đa giác, biểu tượng sơ đồ, v.v. ]

0. 2. 3 [2013-05-05]

  • Thêm hỗ trợ cho hình dạng bảng

  • Thêm hỗ trợ thụt lề vào các hình dạng hộp văn bản, cho phép các dấu đầu dòng đa cấp trên các trang trình bày dấu đầu dòng

0. 2. 2 [25-03-2013]

  • Thêm hỗ trợ để mở và lưu bản trình bày từ/đến một đối tượng giống như tệp

  • Tái cấu trúc xử lý XML để sử dụng lxml objectify

0. 2. 1 [25-02-2013]

  • Thêm hỗ trợ cho Python 2. 6

  • Thêm hình ảnh từ một luồng [e. g. StringIO] ngoài đường dẫn, cho phép chèn hình ảnh được lấy từ cơ sở dữ liệu hoặc tài nguyên mạng mà không cần lưu trước

    Làm cách nào để đọc văn bản từ ppt trong python?

    Nếu bạn muốn trích xuất văn bản. .
    nhập Bản trình bày từ pptx [pip cài đặt python-pptx]
    cho mỗi tệp trong thư mục [sử dụng mô-đun toàn cầu]
    nhìn vào mọi trang chiếu và mọi hình dạng trong mỗi trang chiếu
    nếu có một hình dạng với thuộc tính văn bản, hãy in hình dạng đó. chữ

    Python có thể tương tác với PowerPoint không?

    Thật may mắn cho chúng tôi, có một thư viện python tuyệt vời để tạo và cập nhật các tệp PowerPoint. python-pptx . API được ghi lại rất tốt nên khá dễ sử dụng. Phần khó khăn duy nhất là hiểu cấu trúc tài liệu PowerPoint bao gồm các thành phần và bố cục chính khác nhau.

    Làm cách nào để nhập PPTX trong python?

    Chạy pip show python-pptx trong Terminal, tôi nhận được. Tên. Phiên bản python-pptx. 0. 6. 16 Tóm tắt. Tạo và thao tác Open XML PowerPoint [. .
    Chờ đợi. .
    @SanguineL. Cho chúng tôi thấy đầu ra của python -m pip show python-pptx và python -c 'import sys; . .
    Các chỉnh sửa được thêm vào bài đăng

    Làm cách nào để chuyển đổi ppt sang pdf trong python?

    Các bước viết mã. .
    Tạo phiên bản của lớp Trình bày và cung cấp cho nó tệp PowerPoint. . phần mở rộng ppt để tải tệp PPT bên trong lớp Trình bày. . phần mở rộng pptx để tải tệp PPTX bên trong lớp Trình bày. . .
    Lưu bản trình bày sang định dạng PDF bằng cách gọi phương thức Save và sử dụng SaveFormat. liệt kê PDF

Chủ Đề