Phạm vi tối thiểu/tối đa Python

Công cụ ước tính này chia tỷ lệ và dịch từng tính năng riêng lẻ sao cho nó nằm trong phạm vi nhất định trên tập huấn luyện, e. g. giữa không và một

Sự chuyển đổi được đưa ra bởi

X_std = [X - X.min[axis=0]] / [X.max[axis=0] - X.min[axis=0]]
X_scaled = X_std * [max - min] + min

trong đó tối thiểu, tối đa = Feature_range

Phép biến đổi này thường được sử dụng thay thế cho giá trị trung bình bằng 0, tỷ lệ phương sai đơn vị

Đọc thêm trong

Thông số . feature_range bộ [tối thiểu, tối đa], mặc định=[0, 1]

Phạm vi dữ liệu được chuyển đổi mong muốn

bản sao bool, mặc định=True

Đặt thành Sai để thực hiện chuẩn hóa hàng tại chỗ và tránh sao chép [nếu đầu vào đã là một mảng có nhiều mảng]

clip bool, mặc định=Sai

Đặt thành True để cắt các giá trị đã chuyển đổi của dữ liệu được giữ lại thành feature range được cung cấp

Mới trong phiên bản 0. 24

Thuộc tính . min_ ndarray của hình dạng [n_features,]

Mỗi điều chỉnh tính năng ở mức tối thiểu. Tương đương với min - X.min[axis=0] * self.scale_

scale_ ndarray của hình dạng [n_features,]

Mỗi tính năng chia tỷ lệ tương đối của dữ liệu. Tương đương với [max - min] / [X.max[axis=0] - X.min[axis=0]]

Mới trong phiên bản 0. 17. thuộc tính scale_.

data_min_ ndarray của hình dạng [n_features,]

Mỗi tính năng tối thiểu nhìn thấy trong dữ liệu

Mới trong phiên bản 0. 17. data_min_

data_max_ ndarray của hình dạng [n_features,]

Mỗi tính năng tối đa nhìn thấy trong dữ liệu

Mới trong phiên bản 0. 17. data_max_

data_range_ ndarray của hình dạng [n_features,]

Mỗi phạm vi tính năng [data_max_ - data_min_] được thấy trong dữ liệu

Mới trong phiên bản 0. 17. data_range_

n_features_in_ int

Số lượng các tính năng nhìn thấy trong

Mới trong phiên bản 0. 24

n_samples_seen_ int

Số lượng mẫu được xử lý bởi công cụ ước tính. Nó sẽ được đặt lại trên các cuộc gọi mới để phù hợp, nhưng tăng dần qua các cuộc gọi partial_fit

feature_names_in_ ndarray của hình dạng [____9_______,]

Tên của các tính năng nhìn thấy trong quá trình. Chỉ được xác định khi X có tên đối tượng là tất cả các chuỗi

Mới trong phiên bản 1. 0

Xem thêm

Hàm tương đương không có API công cụ ước tính

ghi chú

NaN được coi là giá trị bị thiếu. bỏ qua trong phù hợp, và duy trì trong biến đổi

Để so sánh các bộ chia tỷ lệ, máy biến áp và bộ chuẩn hóa khác nhau, hãy xem

ví dụ

>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler[]
>>> print[scaler.fit[data]]
MinMaxScaler[]
>>> print[scaler.data_max_]
[ 1. 18.]
>>> print[scaler.transform[data]]
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print[scaler.transform[[[2, 2]]]]
[[1.5 0. ]]

phương pháp

[X[, y]]

Tính giá trị tối thiểu và tối đa sẽ được sử dụng để chia tỷ lệ sau này

[X[, y]]

Phù hợp với dữ liệu, sau đó biến đổi nó

[[tính_năng_đầu_vào]]

Nhận tên tính năng đầu ra để chuyển đổi

[[sâu]]

Nhận thông số cho công cụ ước tính này

[X]

Hoàn tác tỷ lệ của X theo Feature_range

[X[, y]]

Tính toán trực tuyến tối thiểu và tối đa trên X để chia tỷ lệ sau này

[*[, biến đổi]]

Đặt vùng chứa đầu ra

[**thông số]

Đặt các tham số của công cụ ước tính này

[X]

Chia tỷ lệ các tính năng của X theo Feature_range

phù hợp[X , y=Không có]

Tính giá trị tối thiểu và tối đa sẽ được sử dụng để chia tỷ lệ sau này

Thông số . X hình dạng giống như mảng [n_samples, n_features]

Dữ liệu được sử dụng để tính toán mức tối thiểu và tối đa cho mỗi tính năng được sử dụng để chia tỷ lệ sau này dọc theo trục tính năng

y Không có

Mặc kệ

Trả về . bản thân mục tiêu

Máy chia tỷ lệ được trang bị

fit_transform[X , y=Không có , **fit_params]

Phù hợp với dữ liệu, sau đó biến đổi nó

Khớp máy biến áp với Xsklearn.preprocessing1 với các tham số tùy chọn sklearn.preprocessing2 và trả về phiên bản đã biến đổi của X

Thông số . X hình dạng giống như mảng [n_samples, n_features]

mẫu đầu vào

y hình dạng giống như mảng [n_samples,] hoặc [n_samples, n_outputs], default=None

Giá trị mục tiêu [Không có đối với các phép biến đổi không giám sát]

**fit_params mệnh lệnh

Thông số phù hợp bổ sung

Trả về . X_new mảng hình ndarray [n_samples, n_features_new]

mảng chuyển đổi

get_feature_names_out[input_features=Không có]

Nhận tên tính năng đầu ra để chuyển đổi

Thông số . input_features giống như mảng của str hoặc Không, mặc định = Không

tính năng đầu vào

  • Nếu sklearn.preprocessing4 là sklearn.preprocessing5, thì sklearn.preprocessing6 được sử dụng làm tên đối tượng địa lý trong. Nếu sklearn.preprocessing6 không được xác định, thì các tên tính năng đầu vào sau đây sẽ được tạo. sklearn.preprocessing8

  • Nếu sklearn.preprocessing4 giống như một mảng, thì sklearn.preprocessing4 phải khớp với sklearn.preprocessing6 nếu sklearn.preprocessing6 được xác định

Trả về . feature_names_out ndarray của các đối tượng str

Giống như các tính năng đầu vào

get_params[deep=Đúng]

Nhận thông số cho công cụ ước tính này

Thông số . deep bool, mặc định=True

Nếu Đúng, sẽ trả về các tham số cho công cụ ước tính này và chứa các đối tượng con là công cụ ước tính

Trả về . params mệnh lệnh

Tên tham số được ánh xạ tới giá trị của chúng

inverse_transform[X]

Hoàn tác tỷ lệ của X theo Feature_range

Thông số . X hình dạng giống như mảng [n_samples, n_features]

Dữ liệu đầu vào sẽ được chuyển đổi. Nó không thể thưa thớt

Trả về . Xt ndarray của hình dạng [n_samples, n_features]

Dữ liệu đã chuyển đổi

partial_fit[X , y=Không có]

Tính toán trực tuyến tối thiểu và tối đa trên X để chia tỷ lệ sau này

Tất cả X được xử lý dưới dạng một đợt duy nhất. Điều này dành cho các trường hợp không khả thi do số lượng rất lớn feature range4 hoặc do X được đọc từ một luồng liên tục

Thông số . X hình dạng giống như mảng [n_samples, n_features]

Dữ liệu được sử dụng để tính toán giá trị trung bình và độ lệch chuẩn được sử dụng để chia tỷ lệ sau này dọc theo trục đối tượng địa lý

y Không có

Mặc kệ

Trả về . bản thân mục tiêu

Máy chia tỷ lệ được trang bị

set_output[* , biến đổi=Không có]

Đặt vùng chứa đầu ra

Xem ví dụ về cách sử dụng API

Thông số . biến đổi {“mặc định”, “gấu trúc”}, default=None

Định cấu hình đầu ra của

>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler[]
>>> print[scaler.fit[data]]
MinMaxScaler[]
>>> print[scaler.data_max_]
[ 1. 18.]
>>> print[scaler.transform[data]]
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print[scaler.transform[[[2, 2]]]]
[[1.5 0. ]]
9 và
>>> from sklearn.preprocessing import MinMaxScaler
>>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
>>> scaler = MinMaxScaler[]
>>> print[scaler.fit[data]]
MinMaxScaler[]
>>> print[scaler.data_max_]
[ 1. 18.]
>>> print[scaler.transform[data]]
[[0.   0.  ]
 [0.25 0.25]
 [0.5  0.5 ]
 [1.   1.  ]]
>>> print[scaler.transform[[[2, 2]]]]
[[1.5 0. ]]
2

  • feature range7. Định dạng đầu ra mặc định của máy biến áp

  • feature range8. Đầu ra khung dữ liệu

  • sklearn.preprocessing5. Cấu hình chuyển đổi không thay đổi

Trả về . self trường hợp ước tính

ví dụ ước tính

set_params[**tham số]

Đặt các tham số của công cụ ước tính này

Phương pháp này hoạt động trên các công cụ ước tính đơn giản cũng như trên các đối tượng lồng nhau [chẳng hạn như ]. Cái sau có các tham số dạng min - X.min[axis=0] * self.scale_1 để có thể cập nhật từng thành phần của một đối tượng lồng nhau

Làm cách nào để tính phạm vi trong Python?

Cú pháp hàm range[] trong Python .
bắt đầu. [ tùy chọn ] giá trị bắt đầu của chuỗi
dừng lại. giá trị tiếp theo sau giá trị kết thúc của chuỗi
bươc. [ tùy chọn ] giá trị số nguyên, biểu thị hiệu giữa hai số bất kỳ trong dãy

Phạm vi tối thiểu và tối đa là gì?

Mức tối thiểu và tối đa của tập dữ liệu lần lượt là mục nhập nhỏ nhất và lớn nhất . Không có gì ngạc nhiên ở đây… Phạm vi là sự khác biệt giữa mức tối đa và mức tối thiểu và xác định mức độ lan truyền của dữ liệu.

Chủ Đề