Hướng dẫn visualize decision tree python - hình dung cây quyết định python
Một cây quyết định là một thuật toán được giám sát được sử dụng trong học máy. Nó đang sử dụng biểu đồ cây nhị phân (mỗi nút có hai con) để gán cho mỗi mẫu dữ liệu một giá trị đích. Các giá trị đích được trình bày trong lá cây. Để tiếp cận với lá, mẫu được truyền qua các nút, bắt đầu từ nút gốc. Trong mỗi nút, một quyết định được đưa ra, mà nút hậu duệ mà nó sẽ đi. Một quyết định được đưa ra dựa trên tính năng mẫu được chọn. Học cây quyết định là một quá trình tìm kiếm các quy tắc tối ưu trong mỗi nút cây bên trong theo số liệu đã chọn.
Show
Các cây quyết định có thể được chia, liên quan đến các giá trị mục tiêu, thành:
Cây quyết định là một công cụ phổ biến trong phân tích quyết định. Họ có thể hỗ trợ các quyết định nhờ đại diện trực quan của từng quyết định. Dưới đây tôi chỉ ra 4 cách để trực quan hóa cây quyết định trong Python:
Tôi sẽ chỉ ra cách hình dung cây trên các nhiệm vụ phân loại và hồi quy. Đào tạo cây quyết định về nhiệm vụ phân loạiTôi sẽ đào tạo một 1 trên bộ dữ liệu 8. Tôi sẽ sử dụng các tham số siêu mặc định cho trình phân loại.
In đại diện văn bảnXuất cây quyết định vào biểu diễn văn bản có thể hữu ích khi làm việc trên các ứng dụng giao diện người dùng Whitout hoặc khi chúng tôi muốn đăng nhập thông tin về mô hình vào tệp văn bản. Bạn có thể kiểm tra chi tiết về 9 trong tài liệu Sklearn.
Nếu bạn muốn lưu nó vào tệp, nó có thể được thực hiện với mã sau:
Cây âm mưu với text_representation = tree.export_text(clf) print(text_representation) 0Phương pháp 0 đã được thêm vào Sklearn trong phiên bản 2. Nó yêu cầu 3 phải được cài đặt. Nó cho phép chúng ta dễ dàng tạo ra con số của cây (không có xuất khẩu trung gian sang graphviz) càng nhiều thông tin về các đối số 0 có trong tài liệu.
. Để lưu hình vào tệp 7:
Xin lưu ý rằng tôi đã sử dụng 8 trong 0. Khi tham số này được đặt thành 0, phương thức sử dụng màu để chỉ ra phần lớn lớp. (Sẽ rất tuyệt nếu sẽ có một số huyền thoại với lớp học và màu sắc.)Trực quan hóa cây quyết định với graphvizVui lòng đảm bảo rằng bạn đã cài đặt 1 ( 2). Để vẽ cây trước tiên, chúng ta cần xuất nó sang định dạng DOT bằng phương thức 3 (liên kết đến tài liệu). Sau đó, chúng ta có thể vẽ nó trong sổ ghi chép hoặc lưu vào tệp.
0Cây quyết định cốt truyện với gói # Fit the classifier with default hyper-parameters clf = DecisionTreeClassifier(random_state=1234) model = clf.fit(X, y) 6Gói 6 có sẵn trong GitHub. Nó có thể được cài đặt với 6. Nó yêu cầu 1 phải được cài đặt (nhưng bạn không cần phải chuyển đổi thủ công giữa các tệp chấm và hình ảnh). Để vẽ cây chỉ chạy: 1Lưu trực quan hóa vào tệp: 2Hình dung cây quyết định trong nhiệm vụ hồi quyDưới đây, tôi trình bày tất cả 4 phương pháp cho 2 từ gói scikit-learn (tất nhiên là trong Python). 3 4Để giữ kích thước của cây nhỏ, tôi đã đặt 9. 5 6 7 8Xin lưu ý rằng màu sắc của lá là giá trị dự đoán. 9 0Từ các phương pháp trên yêu thích của tôi là trực quan hóa với gói 6. Tôi thích nó vì:
Thật tuyệt vời khi có trực quan hóa 6 ở chế độ tương tác, vì vậy người dùng có thể tự động thay đổi độ sâu của cây. Tôi đã sử dụng gói 6 trong gói Python học máy tự động học (Automl) 3. Bạn có thể kiểm tra các chi tiết của việc triển khai trong kho GitHub. Một điều quan trọng là, trong gói tự động của tôi, tôi không sử dụng cây quyết định với 4 lớn hơn 5. Tôi thêm giới hạn này để không có những cây quá lớn, theo tôi, điều này làm mất đi khả năng hiểu rõ những gì xảy ra trong mô hình. Dưới đây là ví dụ về báo cáo Markdown cho cây quyết định được tạo bởi 3.💌 Tham gia bản tin của chúng tôi 💌Đăng ký nhận bản tin của chúng tôi để nhận cập nhật sản phẩm Chia sẻ sổ ghi chép Python của bạn với những người khác |