Công cụ ước tính này chia tỷ lệ và dịch từng tính năng riêng lẻ sao cho nó nằm trong phạm vi nhất định trên tập huấn luyện, e. g. giữa không và một
Sự chuyển đổi được đưa ra bởi
X_std = [X - X.min[axis=0]] / [X.max[axis=0] - X.min[axis=0]] X_scaled = X_std * [max - min] + min
trong đó tối thiểu, tối đa = Feature_range
Phép biến đổi này thường được sử dụng thay thế cho giá trị trung bình bằng 0, tỷ lệ phương sai đơn vị
Đọc thêm trong
Thông số . feature_range bộ [tối thiểu, tối đa], mặc định=[0, 1]Phạm vi dữ liệu được chuyển đổi mong muốn
bản sao bool, mặc định=TrueĐặt thành Sai để thực hiện chuẩn hóa hàng tại chỗ và tránh sao chép [nếu đầu vào đã là một mảng có nhiều mảng]
clip bool, mặc định=SaiĐặt thành True để cắt các giá trị đã chuyển đổi của dữ liệu được giữ lại thành feature range
được cung cấp
Mới trong phiên bản 0. 24
Thuộc tính . min_ ndarray của hình dạng [n_features,]Mỗi điều chỉnh tính năng ở mức tối thiểu. Tương đương với min - X.min[axis=0] * self.scale_
Mỗi tính năng chia tỷ lệ tương đối của dữ liệu. Tương đương với [max - min] / [X.max[axis=0] - X.min[axis=0]]
Mới trong phiên bản 0. 17. thuộc tính scale_.
data_min_ ndarray của hình dạng [n_features,]Mỗi tính năng tối thiểu nhìn thấy trong dữ liệu
Mới trong phiên bản 0. 17. data_min_
data_max_ ndarray của hình dạng [n_features,]Mỗi tính năng tối đa nhìn thấy trong dữ liệu
Mới trong phiên bản 0. 17. data_max_
data_range_ ndarray của hình dạng [n_features,]Mỗi phạm vi tính năng [data_max_ - data_min_]
được thấy trong dữ liệu
Mới trong phiên bản 0. 17. data_range_
n_features_in_ intSố lượng các tính năng nhìn thấy trong
Mới trong phiên bản 0. 24
n_samples_seen_ intSố lượng mẫu được xử lý bởi công cụ ước tính. Nó sẽ được đặt lại trên các cuộc gọi mới để phù hợp, nhưng tăng dần qua các cuộc gọi partial_fit
Tên của các tính năng nhìn thấy trong quá trình. Chỉ được xác định khi X
có tên đối tượng là tất cả các chuỗi
Mới trong phiên bản 1. 0
Xem thêm
Hàm tương đương không có API công cụ ước tính
ghi chú
NaN được coi là giá trị bị thiếu. bỏ qua trong phù hợp, và duy trì trong biến đổi
Để so sánh các bộ chia tỷ lệ, máy biến áp và bộ chuẩn hóa khác nhau, hãy xem
ví dụ
>>> from sklearn.preprocessing import MinMaxScaler >>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] >>> scaler = MinMaxScaler[] >>> print[scaler.fit[data]] MinMaxScaler[] >>> print[scaler.data_max_] [ 1. 18.] >>> print[scaler.transform[data]] [[0. 0. ] [0.25 0.25] [0.5 0.5 ] [1. 1. ]] >>> print[scaler.transform[[[2, 2]]]] [[1.5 0. ]]
phương pháp
[X[, y]]
Tính giá trị tối thiểu và tối đa sẽ được sử dụng để chia tỷ lệ sau này
[X[, y]]
Phù hợp với dữ liệu, sau đó biến đổi nó
[[tính_năng_đầu_vào]]
Nhận tên tính năng đầu ra để chuyển đổi
[[sâu]]
Nhận thông số cho công cụ ước tính này
[X]
Hoàn tác tỷ lệ của X theo Feature_range
[X[, y]]
Tính toán trực tuyến tối thiểu và tối đa trên X để chia tỷ lệ sau này
[*[, biến đổi]]
Đặt vùng chứa đầu ra
[**thông số]
Đặt các tham số của công cụ ước tính này
[X]
Chia tỷ lệ các tính năng của X theo Feature_range
phù hợp[X , y=Không có]Tính giá trị tối thiểu và tối đa sẽ được sử dụng để chia tỷ lệ sau này
Thông số . X hình dạng giống như mảng [n_samples, n_features]Dữ liệu được sử dụng để tính toán mức tối thiểu và tối đa cho mỗi tính năng được sử dụng để chia tỷ lệ sau này dọc theo trục tính năng
y Không cóMặc kệ
Trả về . bản thân mục tiêuMáy chia tỷ lệ được trang bị
fit_transform[X , y=Không có , **fit_params]Phù hợp với dữ liệu, sau đó biến đổi nó
Khớp máy biến áp với X
và sklearn.preprocessing
1 với các tham số tùy chọn sklearn.preprocessing
2 và trả về phiên bản đã biến đổi của X
mẫu đầu vào
y hình dạng giống như mảng [n_samples,] hoặc [n_samples, n_outputs], default=NoneGiá trị mục tiêu [Không có đối với các phép biến đổi không giám sát]
**fit_params mệnh lệnhThông số phù hợp bổ sung
Trả về . X_new mảng hình ndarray [n_samples, n_features_new]mảng chuyển đổi
get_feature_names_out[input_features=Không có]Nhận tên tính năng đầu ra để chuyển đổi
Thông số . input_features giống như mảng của str hoặc Không, mặc định = Khôngtính năng đầu vào
Nếu
sklearn.preprocessing
4 làsklearn.preprocessing
5, thìsklearn.preprocessing
6 được sử dụng làm tên đối tượng địa lý trong. Nếusklearn.preprocessing
6 không được xác định, thì các tên tính năng đầu vào sau đây sẽ được tạo.sklearn.preprocessing
8Nếu
sklearn.preprocessing
4 giống như một mảng, thìsklearn.preprocessing
4 phải khớp vớisklearn.preprocessing
6 nếusklearn.preprocessing
6 được xác định
Giống như các tính năng đầu vào
get_params[deep=Đúng]Nhận thông số cho công cụ ước tính này
Thông số . deep bool, mặc định=TrueNếu Đúng, sẽ trả về các tham số cho công cụ ước tính này và chứa các đối tượng con là công cụ ước tính
Trả về . params mệnh lệnhTên tham số được ánh xạ tới giá trị của chúng
inverse_transform[X]Hoàn tác tỷ lệ của X theo Feature_range
Thông số . X hình dạng giống như mảng [n_samples, n_features]Dữ liệu đầu vào sẽ được chuyển đổi. Nó không thể thưa thớt
Trả về . Xt ndarray của hình dạng [n_samples, n_features]Dữ liệu đã chuyển đổi
partial_fit[X , y=Không có]Tính toán trực tuyến tối thiểu và tối đa trên X để chia tỷ lệ sau này
Tất cả X được xử lý dưới dạng một đợt duy nhất. Điều này dành cho các trường hợp không khả thi do số lượng rất lớn feature range
4 hoặc do X được đọc từ một luồng liên tục
Dữ liệu được sử dụng để tính toán giá trị trung bình và độ lệch chuẩn được sử dụng để chia tỷ lệ sau này dọc theo trục đối tượng địa lý
y Không cóMặc kệ
Trả về . bản thân mục tiêuMáy chia tỷ lệ được trang bị
set_output[* , biến đổi=Không có]Đặt vùng chứa đầu ra
Xem ví dụ về cách sử dụng API
Thông số . biến đổi {“mặc định”, “gấu trúc”}, default=NoneĐịnh cấu hình đầu ra của
>>> from sklearn.preprocessing import MinMaxScaler >>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] >>> scaler = MinMaxScaler[] >>> print[scaler.fit[data]] MinMaxScaler[] >>> print[scaler.data_max_] [ 1. 18.] >>> print[scaler.transform[data]] [[0. 0. ] [0.25 0.25] [0.5 0.5 ] [1. 1. ]] >>> print[scaler.transform[[[2, 2]]]] [[1.5 0. ]]9 và
>>> from sklearn.preprocessing import MinMaxScaler >>> data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]] >>> scaler = MinMaxScaler[] >>> print[scaler.fit[data]] MinMaxScaler[] >>> print[scaler.data_max_] [ 1. 18.] >>> print[scaler.transform[data]] [[0. 0. ] [0.25 0.25] [0.5 0.5 ] [1. 1. ]] >>> print[scaler.transform[[[2, 2]]]] [[1.5 0. ]]2
feature range
7. Định dạng đầu ra mặc định của máy biến ápfeature range
8. Đầu ra khung dữ liệusklearn.preprocessing
5. Cấu hình chuyển đổi không thay đổi
ví dụ ước tính
set_params[**tham số]Đặt các tham số của công cụ ước tính này
Phương pháp này hoạt động trên các công cụ ước tính đơn giản cũng như trên các đối tượng lồng nhau [chẳng hạn như ]. Cái sau có các tham số dạng min - X.min[axis=0] * self.scale_
1 để có thể cập nhật từng thành phần của một đối tượng lồng nhau