Excel có thể loại bỏ các ngoại lệ không?

Ngoại lệ như tên gợi ý là thứ gì đó không nằm trong phạm vi bắt buộc/đã cho. Cần loại bỏ các ngoại lệ trong thống kê vì chúng ảnh hưởng đến quyết định được đưa ra sau khi thực hiện các phép tính cần thiết. Những người ngoại lai thường đưa ra quyết định sai lệch. e họ đưa ra quyết định theo hướng tích cực hoặc tiêu cực. Đôi khi có thể dễ dàng tìm thấy một ngoại lệ bằng cách xem dữ liệu nhưng rất khó để tìm ra một ngoại lệ khi dữ liệu lớn. Chúng ta sẽ thấy điều này với sự trợ giúp của một ví dụ, được cung cấp một tập dữ liệu và bạn cần thực hiện tính trung bình của tập dữ liệu 1, 89, 57, 100, 150, 139, 49, 87, 200, 250. Vậy, trung bình cộng của tập dữ liệu đã cho là 112. 2. Tuy nhiên, rõ ràng là 1, 200 và 250 là các phạm vi quá nhỏ hoặc quá lớn để trở thành một phần của tập dữ liệu. Các phạm vi này được gọi là ngoại lệ trong dữ liệu. Sau khi loại bỏ các ngoại lệ, trung bình trở thành 95. 85. Có thể thấy rõ ràng từ ví dụ trên rằng một người ngoại lệ sẽ đưa ra quyết định dựa trên

Tìm ngoại lệ bằng cách sử dụng Sắp xếp trong Excel

Đây là một trong những cách dễ nhất để tìm giá trị ngoại lệ trong MS excel khi dữ liệu của bạn không lớn vì bằng cách xem dữ liệu, bạn sẽ biết về các giá trị khác xa với giá trị được ghi ban đầu

 

Từ hình ảnh trên, chúng tôi có thể nói rõ rằng dữ liệu không được sắp xếp và do đó sẽ mất một thời gian để chúng tôi xác định các giá trị ngoại lệ

 

Trong khi xem Img. 2, chúng ta có thể nói rõ ràng rằng các số 1, 200 và 250 là ngoại lệ.  

Tìm giá trị ngoại lệ bằng hàm LARGE/SMALL Excel

Một cách khác để tìm ngoại lệ là sử dụng các hàm MS Excel tích hợp được gọi là LARGE và SMALL. Hàm LARGE sẽ trả về giá trị lớn nhất từ ​​​​mảng dữ liệu và hàm SMALL sẽ trả về giá trị nhỏ nhất. Ở đây, chúng ta sẽ sử dụng hàm LARGE và SMALL là hàm có sẵn trong Microsoft excel. Xem xét ví dụ được sử dụng ở trên

 

Cú pháp hàm LỚN

LỚN($B$1. $B$12, 1)

Ở đây, chúng ta đang truyền một mảng và một số. Mảng có tập dữ liệu mà chúng ta phải tìm ngoại lệ và số 1 đại diện cho số lớn nhất đầu tiên từ mảng. Nếu chúng ta sử dụng 2, nó sẽ trả về giá trị lớn thứ hai từ mảng. Bây giờ khi chúng ta sử dụng chức năng này trong ví dụ trên, chúng ta sẽ nhận được đầu ra sau

 

Cú pháp hàm NHỎ

NHỎ($B$1. $B$12, 1)

Cú pháp và giá trị pass-on giống nhau. Bây giờ khi chúng ta sử dụng chức năng này trong ví dụ trên, chúng ta sẽ nhận được đầu ra sau

 

Ghi chú. Nếu có nhiều ngoại lệ trong dữ liệu thì bạn phải sử dụng lại chức năng này

Tìm ngoại lệ bằng cách sử dụng Inter Quartile Range (IQR)

Dữ liệu được trình bày trong ví dụ trên có kích thước mẫu nhỏ nhưng khi gặp tình huống thực tế, dữ liệu có thể rất lớn và đó là nơi xuất hiện vấn đề ban đầu. Theo IQR, Ngoại lệ là bất kỳ điểm dữ liệu nào nằm trên 1. 5 lần IQR dưới phần tư thứ nhất (Q1) và 1. 5 lần IQR trên phần tư thứ ba (Q3) trong một tập dữ liệu

Công thức là

Cao = Q3 + 1. 5 * IQR

Thấp = Q1 – 1. 5 * IQR

Tìm ngoại lệ bằng các bước sau

Bước 1. Mở trang tính nơi lưu trữ dữ liệu cần tìm ngoại lệ.  

Bước 2. Thêm hàm QUARTILE(mảng, quart), trong đó một mảng là tập dữ liệu mà phần tư đang được tính toán và một phần tư là số phần tư. Trong trường hợp của chúng tôi, phần tư là 1 vì chúng tôi muốn tính phần tư thứ nhất để tính giá trị ngoại lệ thấp nhất

Số phần tư Trả về phần tư 0Giá trị tối thiểu1 Phần tư thứ nhất (phân vị thứ 25)Giá trị trung bình (phân vị thứ 50)3Phần tư thứ ba (phân vị thứ 75)4Giá trị tối đa

Bước 3. Tương tự như bước 2, thêm công thức phần tư trong Q3 và viết 3 dưới dạng số phần tư vì chúng tôi muốn tính phần tư thứ 3 i. e Phân vị thứ 75 để tính giá trị phân vị cao nhất

Bước 4. Inter Quartile Range hay IQR là Q3-Q1, đặt công thức để lấy giá trị IQR

Bước 5. Để tìm giá trị Cao, công thức là Q3+(1. 5*IQR). Tương tự, đối với giá trị Thấp, công thức là Q1-(1. 5*IQR)

Bước 6. Để tìm xem số trong tập dữ liệu có phải là ngoại lệ hay không, chúng ta cần kiểm tra xem mục nhập dữ liệu cao hơn giá trị Cao hay thấp hơn giá trị Thấp. Để thực hiện điều này, chúng ta sẽ sử dụng hàm OR. Công thức sẽ là OR(B3>$G$3, B3<$H$3). Đặt công thức vào ô được yêu cầu và kéo xuống ô liền kề với tập dữ liệu cuối cùng, nếu giá trị trả về TRUE thì dữ liệu đó là ngoại lệ, ngược lại thì không

Vì bạn đã kiểm tra dữ liệu ngoại lệ. Giờ đây, bạn có thể loại bỏ các giá trị ngoại lệ và sử dụng dữ liệu còn lại để tính toán và nhận kết quả không thiên vị