Hướng dẫn interquartile range python - con trăn khoảng interquartile

scipy.stats.iqr (x, axis = none, rng = (25,75), scale = 1.0, nan_policy = 'tuyên truyền', nội suy = 'tuyến tính', netpiqr(x, axis=None, rng=(25, 75), scale=1.0, nan_policy='propagate', interpolation='linear', keepdims=False)[source]#

Tính phạm vi liên vùng của dữ liệu dọc theo trục được chỉ định.

Phạm vi liên vùng (IQR) là sự khác biệt giữa phần trăm thứ 75 và 25 của dữ liệu. Đây là thước đo sự phân tán tương tự như độ lệch hoặc phương sai tiêu chuẩn, nhưng mạnh mẽ hơn nhiều so với các ngoại lệ [2].

Tham số rng cho phép hàm này tính toán các phạm vi phần trăm khác so với IQR thực tế. Ví dụ: cài đặt rng=(0, 100) tương đương với numpy.ptp.

IQR của một mảng trống là np.nan.

Mới trong phiên bản 0.18.0.

Parametersxarray_likexarray_like

Mảng đầu vào hoặc đối tượng có thể được chuyển đổi thành một mảng.

trục hoặc trình tự của int, tùy chọnint or sequence of int, optional

Trục dọc theo đó phạm vi được tính toán. Mặc định là tính toán IQR cho toàn bộ mảng.

Trình tự rngtwo-phần tử chứa phao trong phạm vi [0,100] tùy chọnTwo-element sequence containing floats in range of [0,100] optional

Phần trăm trên đó để tính toán phạm vi. Mỗi người phải nằm trong khoảng từ 0 đến 100, bao gồm. Mặc định là IQR đúng: (25, 75). Thứ tự của các yếu tố không quan trọng.

Scalescalar hoặc STR, tùy chọnscalar or str, optional

Giá trị số của tỷ lệ sẽ được chia ra khỏi kết quả cuối cùng. Các giá trị chuỗi sau được nhận dạng:

  • ‘RAW, không có tỷ lệ, chỉ cần trả lại IQR thô. Khấu hao! Sử dụng scale=1 thay thế.Deprecated! Use scale=1 instead.

  • ‘Bình thường\(2 \sqrt{2} erf^{-1}(\frac{1}{2}) \approx 1.349\).

Mặc định là 1.0. Việc sử dụng scale='raw' không được chấp nhận. Thang đo giống mảng cũng được cho phép, miễn là nó phát sóng chính xác đến đầu ra sao cho out / scale là một hoạt động hợp lệ. Kích thước đầu ra phụ thuộc vào mảng đầu vào, x, đối số trục và cờ KeepDims.

nan_policy {‘tuyên truyền,‘ nâng cao, ‘omit,}, tùy chọn{‘propagate’, ‘raise’, ‘omit’}, optional

Xác định cách xử lý khi đầu vào chứa NAN. Các tùy chọn sau có sẵn (mặc định là ‘tuyên truyền):

  • ‘Tuyên truyền: Trả lại Nan

  • ‘Nâng cao: ném lỗi

  • ‘OMIT, thực hiện các tính toán bỏ qua các giá trị NAN

Nội suy, tùy chọnstr, optional

Chỉ định phương pháp nội suy để sử dụng khi ranh giới phần trăm nằm giữa hai điểm dữ liệu ij. Các tùy chọn sau có sẵn (mặc định là ‘tuyến tính):

  • ‘Tuyến tính: rng0, trong đó rng1 là phần phân đoạn của chỉ số được bao quanh bởi ij.

  • ’Hạ thấp hơn: i.

  • ’Cao hơn: j.

  • ’Gần nhất: i hoặc j tùy theo cách nào gần nhất.

  • Midpoint, rng8.

Đối với Numpy> = 1.22.0, các tùy chọn bổ sung được cung cấp bởi từ khóa rng9 của rng=(0, 100)0 cũng hợp lệ.

Keepdimsbool, tùy chọnbool, optional

Nếu điều này được đặt thành TRUE, các trục giảm được để lại trong kết quả là kích thước với kích thước một. Với tùy chọn này, kết quả sẽ phát sóng chính xác so với mảng X ban đầu.

ReturnSiqrScalar hoặc ndarrayiqrscalar or ndarray

Nếu rng=(0, 100)1, một vô hướng được trả lại. Nếu đầu vào chứa số nguyên hoặc phao có độ chính xác nhỏ hơn rng=(0, 100)2, thì loại dữ liệu đầu ra là rng=(0, 100)2. Mặt khác, loại dữ liệu đầu ra giống như đầu vào.

Người giới thiệu

1

Phạm vi Interquartile phạm vi của HTTPS://en.wikipedia.org/wiki/Interquartile_Range

2

Các biện pháp mạnh mẽ của quy mô

3

"Quantile" https://en.wikipedia.org/wiki/quantile

Ví dụ

>>> from scipy.stats import iqr
>>> x = np.array([[10, 7, 4], [3, 2, 1]])
>>> x
array([[10,  7,  4],
       [ 3,  2,  1]])
>>> iqr(x)
4.0
>>> iqr(x, axis=0)
array([ 3.5,  2.5,  1.5])
>>> iqr(x, axis=1)
array([ 3.,  1.])
>>> iqr(x, axis=1, keepdims=True)
array([[ 3.],
       [ 1.]])