Vẽ ma trận nhầm lẫn python

KHÔNG DÙNG. Chức năng plot_confusion_matrix không được dùng nữa trong 1. 0 và sẽ bị xóa trong 1. 2. Sử dụng một trong các phương thức của lớp. Nhầm LẫnMa TrậnMàn Hình. from_predictions hoặc ConfusionMatrixDisplay. from_estimator

Âm mưu ma trận nhầm lẫn

plot_confusion_matrix không được dùng trong 1. 0 và sẽ bị xóa trong 1. 2. Sử dụng một trong các phương thức lớp sau. from_predictions hoặc from_estimator

Đọc thêm trong Hướng dẫn sử dụng .

Thông số . công cụ ước tính trường hợp ước tính

Bộ phân loại được trang bị hoặc một Pipeline được trang bị trong đó công cụ ước tính cuối cùng là một bộ phân loại

X {dạng mảng, ma trận thưa thớt} của hình dạng [n_samples, n_features]

Giá trị đầu vào

y_true hình dạng giống như mảng [n_samples,]

Giá trị mục tiêu

nhãn hình dạng giống như mảng [n_classes,], default=None

Danh sách các nhãn để lập chỉ mục cho ma trận. Điều này có thể được sử dụng để sắp xếp lại hoặc chọn một tập hợp con các nhãn. Nếu None được đưa ra, những cái xuất hiện ít nhất một lần trong y_true hoặc y_pred được sử dụng theo thứ tự được sắp xếp

sample_weight hình dạng giống như mảng [n_samples,], default=None

trọng lượng mẫu

chuẩn hóa {'true', 'pred', 'all'}, default=None

Hoặc để bình thường hóa số lượng hiển thị trong ma trận

  • nếu

    #Importing of dataset to dataframe. 
    df = pd.read_csv["../input/iris-flower-dataset/IRIS.csv"]
    00, ma trận nhầm lẫn được chuẩn hóa theo điều kiện thực [e. g. hàng];

  • nếu

    #Importing of dataset to dataframe. 
    df = pd.read_csv["../input/iris-flower-dataset/IRIS.csv"]
    01, ma trận nhầm lẫn được chuẩn hóa theo các điều kiện dự đoán [e. g. cột];

  • nếu

    #Importing of dataset to dataframe. 
    df = pd.read_csv["../input/iris-flower-dataset/IRIS.csv"]
    02, ma trận nhầm lẫn được chuẩn hóa theo tổng số mẫu;

  • nếu None [mặc định], ma trận nhầm lẫn sẽ không được chuẩn hóa

display_labels hình dạng giống như mảng [n_classes,], default=None

Tên mục tiêu được sử dụng để vẽ đồ thị. Theo mặc định,

#Importing of dataset to dataframe. 
df = pd.read_csv["../input/iris-flower-dataset/IRIS.csv"]
04 sẽ được sử dụng nếu nó được xác định, nếu không, các nhãn duy nhất của y_truey_pred sẽ được sử dụng

include_values bool, mặc định=True

Bao gồm các giá trị trong ma trận nhầm lẫn

xticks_rotation {'dọc', 'ngang'} hoặc thả nổi, mặc định='ngang'

Xoay nhãn xtick

values_format str, mặc định=Không

Đặc tả định dạng cho các giá trị trong ma trận nhầm lẫn. Nếu None, đặc tả định dạng là 'd' hoặc '. 2g’ tùy theo cái nào ngắn hơn

Ma trận nhầm lẫn được sử dụng để biết hiệu suất của phân loại máy học. Nó được đại diện trong một hình thức ma trận

Ma trận nhầm lẫn giữa sự so sánh giữa các giá trị thực tế và dự đoán

Ma trận nhầm lẫn là ma trận N X N, trong đó n là số lượng các lớp hoặc đầu ra

Đối với 2 lớp, chúng ta nhận nhầm là nhầm lẫn 2 x 2

Đối với 3 lớp, chúng tôi nhận nhầm là nhầm lẫn 3 x 3

Ma nhầm lẫn có 4 thuật ngữ để hiểu dương tính thực [TP], dương tính giả [FP], tiêu cực thực [TN] và âm tính giả [FN]

Ma trận nhầm lẫn trông như thế nào?

Dưới đây là đại diện của ma trận nhầm lẫn

Vui lòng cho chúng tôi hiểu ma trận nhầm lẫn cho một ví dụ phân loại nhị phân đơn giản

Phân loại nhị phân có 2 đầu ra, đầu vào cho phân loại này sẽ rơi vào một trong 2 đầu ra hoặc lớp

Ví dụ. Dựa trên một số suy nghĩ đầu tiên, chúng ta phải quyết định xem người đó có bị bệnh hay không, tiểu đường hay không

Hãy cho chúng tôi xem cách xây dựng một ma trận nhầm lẫn và hiểu các thuật ngữ của nó. Hãy xem xét chúng ta phải mô hình hóa một phân loại phân loại 2 loại trái cây

Chúng tôi có 2 loại ứng dụng và nho và chúng tôi muốn mô hình máy học của chúng tôi được xác định hoặc phân loại trái cây đã cho là một ứng dụng hiệu quả hoặc nho

Vì vậy, chúng tôi lấy 15 mẫu của 2 loại cây trái, trong đó có 8 mẫu thuộc về app và 7 mẫu thuộc lớp nho. [Lớp không có gì ngoài đầu ra, trong ví dụ này, chúng tôi có 2 lớp đầu ra Apple và nho]. Chúng tôi sẽ đại diện cho Apple là 1 và nhớ là lớp 0

Lớp thực tế cho 8 quả táo và 7 nho, có thể được biểu diễn dưới dạng

Thực tế = [1,1,1,1,1,1,1,1,0,0,0,0,0,0,0]]

Mô hình phân loại để dự đoán 1 cho Apple và 0 cho nho

Giả sử rằng trình phân loại lấy tất cả 15 đầu vào và đưa ra các dự đoán sau

· Trong số 8 quả táo, nó sẽ phân loại 5 chính xác là Apple và dự đoán sai 3 là nhỏ

· Trong số 7 nho, nó sẽ phân loại 5 chính xác là nho và dự đoán sai 2 là một ứng dụng thực tế

Dự đoán của phân loại phân loại có thể là

Dự đoán = [1,0,0,0,1,1,1,1,0,0,0,0,0,1,1]]

Ma trận nhầm lẫn cho ví dụ này có thể được hiển thị như dưới đây

Ví dụ của tôi, giá trị dương là Apple và giá trị âm là nho

Tích cực thực sự

Nó có nghĩa là giá trị thực tế và giá trị dự đoán là như nhau

Trong trường hợp của chúng tôi, giá trị thực tế cũng là Apple và dự đoán mô hình cũng là Apple

Nếu bạn quan sát ô TP, giá trị dương giống nhau cho thực tế và dự đoán

Sai sound

Điều này có nghĩa là giá trị thực tế là tích cực trong trường hợp của chúng tôi là Apple nhưng mô hình đã dự đoán nó là âm, tức là, nhỏ. Vì vậy, mô hình đã đưa ra dự đoán sai, nó được cho là cho một tiêu cực [Apple] nhưng nó đã đưa ra một tiêu cực [nho] vì vậy bất cứ điều gì đầu ra tiêu cực của chúng ta là sai,

Dương tính giả

Điều này có nghĩa là giá trị thực tế là âm trong trường hợp của chúng tôi là nhỏ nhưng mô hình đã dự đoán nó là dương, tức là, ứng dụng. Vì vậy, mô hình đã đưa ra dự đoán sai, nó được cho là âm tính [nho] nhưng nó đã được cho là tích cực [Apple] vì vậy bất cứ điều gì đầu ra tích cực chúng ta có là sai, tên đó là

Đúng là tiêu cực

Nó có nghĩa là giá trị thực tế và giá trị dự đoán là như nhau. Trong trường hợp của chúng tôi, các giá trị thực tế cũng là nhỏ và dự đoán cũng là nhỏ

The value for example on is

TP = 5, fn = 3, fp = 2, tn = 5

Mixed mising to class many layer

Ví dụ trên là phân loại nhị phân chỉ có 2 đầu ra nên chúng tôi có ma trận 2 x 2

Vì vậy, điều gì sẽ xảy ra nếu các đầu ra lớn hơn 2 lớp, tức là phân loại nhiều lớp

Làm thế nào để tính toán TP, FN, FP, TN?

Lỗi nhầm lẫn giữa các lớp phân loại 3

Hãy cùng cố gắng trả lời câu hỏi trên bộ dữ liệu phổ biến - iris bộ dữ liệu

Bộ dữ liệu có 3 hoa dưới dạng đầu ra hoặc lớp, Versolor, Virginia, Setosa

Nguồn. Google

Với sự trợ giúp của chiều dài cánh hoa, chiều rộng cánh hoa, chiều dài vách ngăn, chiều rộng vách ngăn, mô hình phải phân loại có thể hiện cho là hoa Verscolor hoặc Virginia hoặc Setosa

Vui lòng áp dụng một mô hình phân loại ở đây, cây phân loại quyết định được áp dụng trên bộ dữ liệu. Bộ dữ liệu có 3 lớp do đó chúng ta nhận được ma trận nhầm lẫn 3 x 3

Nhưng làm thế nào để biết các giá trị TP, TN, FP, FN

Trong vấn đề phân loại đa lớp, chúng tôi đã giành được các giá trị TP, TN, FP, FN trực tiếp như trong vấn đề phân loại nhị phân. Chúng ta cần tính toán cho từng lớp

#importing packages
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
#Importing of dataset to dataframe. 
df = pd.read_csv["../input/iris-flower-dataset/IRIS.csv"]
______2

Cách tính FN, FP, TN, TP

Fn. Giá trị âm tính giả cho một lớp sẽ là tổng giá trị của các hàng tương ứng ngoại trừ giá trị TP. fp. Giá trị dương tính giả cho một lớp sẽ là giá trị tổng của cột tương ứng ngoại trừ giá trị TP. TN. Giá trị âm thanh thực tế cho một lớp sẽ là tổng giá trị của tất cả các cột và hàng ngoại trừ giá trị của lớp mà chúng tôi đang tính toán giá trị cho

TP. Giá trị thực tế dương là nơi giá trị thực tế và giá trị dự đoán giống nhau

Ma trận nhầm lẫn cho bộ dữ liệu IRIS như dưới đây

1. Hãy để tôi tính toán các giá trị TP, TN, FP, FN cho lớp setosa bằng cách sử dụng các thủ thuật trên. Setosa sử dụng các thủ thuật trên

TP. Giá trị thực tế và giá trị dự đoán phải giống nhau. Vì vậy, liên quan đến lớp setosa, giá trị của ô 1 là giá trị TP. Giá trị thực tế và giá trị dự đoán phải giống nhau. Vì vậy, liên quan đến lớp Setosa, giá trị của ô 1 là giá trị TP

Fn. tổng giá trị của các hàng tương ứng ngoại trừ giá trị TP. Tổng giá trị của các hàng tương ứng trừ giá trị TP

Fn = [ô 2 + ô 3]

= [0 + 0]

= 0

FP. Tổng giá trị của cột tương ứng ngoại trừ giá trị TP. Tổng giá trị của cột tương ứng trừ giá trị TP

Fp = [ô 4 + ô 7]

= [0 + 0]

= 0

FP. Tổng giá trị của cột tương ứng ngoại trừ giá trị TP. Tổng giá trị của tất cả các cột và hàng ngoại trừ các giá trị của lớp mà chúng tôi đang tính giá trị cho

Fp = [ô 4 + ô 7]

TN. Tổng giá trị của tất cả các cột và hàng ngoại trừ giá trị của các lớp mà chúng tôi đang tính toán các giá trị cho

TN = [ô 5 + ô 6 + ô 8 + ô 9]

= 17 + 1 +0 + 11Lớp Versicolor các giá trị/số liệu được tính như bên dưới

= 29

Tương tự, đối với lớp Versolor, các giá trị/số liệu được tính như dưới đây

TP. 17 [ô 5]

FN. 0 + 1 = 1 [ô 4 + ô 6]

FP. 0 + 0 = 0 [ô 2 + ô 8]

TN. 16 +0 +0 + 11 = 27 [ô 1 + ô 3 + ô 7 + ô 9]

Tôi hy vọng khái niệm này rõ ràng rằng bạn có thể thử cho lớp Virginia.
Độ chính xác và đường cong AUC-ROC là chỉ số đo lường hiệu suất của
mô hình.

in sao & nbsp;

Ma trận nhầm lẫn cho phép chúng tôi đo lường hiệu suất thu hồi, độ chính xác, độ chính xác và đường cong AUC-ROC là các số liệu để đo hiệu suất của mô hình

Thank vì đã đọc. ]

Nếu có bất kỳ nghi ngờ và vấn đề xuất hiện nào, hãy kết nối với tôi qua email. [Email & NBSP;

Làm thế nào để bạn vẽ hai ma trận nhầm lẫn trong Python?

Ma trận nhầm lẫn sơ đồ cho các lớp nhị phân với các nhãn bạn cần tạo danh sách các nhãn và chuyển đổi nó thành một mảng bằng NP. Phương pháp Asarray[] có hình 2,2. Sau đó, mảng nhãn này phải được chuyển đến thuộc tính Annot. Điều này sẽ hiển thị một trận đấu nhầm lẫn với chú thích nhãn. tạo danh sách các nhãn và chuyển đổi nó thành một mảng bằng hàm np. phương thức asarray[] với hình dạng 2,2. Sau đó, mảng nhãn này phải được chuyển đến thuộc tính annot. Điều này sẽ vẽ ma trận nhầm lẫn với chú thích nhãn.

Làm thế nào để bạn vẽ màn hình nhầm lẫn với các nhãn trong Python?

# Nhận dự đoán

y_pred = đường dẫn. dự đoán [x_test]

# Mixed error error

conf_matrix = conf_matrix [y_true = y_test, y_pred = y_pred]

# Trong khi nhầm lẫn bằng matplotlib

Hình, AX = PLT. Ô con [FIGSIZE = [7. 5, 7. 5]]

Đối chiếu với tôi trong phạm vi [conf_matrix. hình dạng [0]]

Làm thế nào để bạn tính toán ma nhầm lẫn cho nhiều

Ma trận nhầm lẫn giữa sự so sánh giữa các giá trị thực tế và dự đoán. Ma trận nhầm lẫn là ma trận n x n, trong đó n là số lượng các lớp hoặc đầu ra. Đối với 2 lớp, chúng ta nhận nhầm là nhầm lẫn 2 x 2. Đối với 3 lớp, chúng tôi nhận nhầm là nhầm lẫn 3 x 3. Ma trận nhầm lẫn là ma trận N x N, trong đó N là số lượng lớp hoặc đầu ra . Đối với 2 lớp, chúng tôi nhận được ma trận nhầm lẫn 2 x 2. Đối với lớp 3, chúng tôi nhận được ma trận nhầm lẫn 3 X 3.

Làm thế nào để bạn hiển thị một lỗi nhầm lẫn trong Python?

Tạo một nhầm lẫn ma. .

nhập khẩu numpy

thực tế = numpy. ngẫu nhiên. nhị thức [1, 0,9, kích thước = 1000] dự đoán = numpy. ngẫu nhiên. nhị thức [1, 0. 9, size = 1000]

from the input number sklearn

cm_display = số liệu. confusionmatrixdisplay [confusion_matrix = confusion_matrix, display_labels = [false, true]]

Chủ Đề