Hướng dẫn how do you add test and training data in python? - làm thế nào để bạn thêm dữ liệu thử nghiệm và đào tạo trong python?


Đánh giá mô hình của bạn

Trong học máy, chúng tôi tạo ra các mô hình để dự đoán kết quả của một số sự kiện nhất định, như trong chương trước, nơi chúng tôi dự đoán phát xạ CO2 của một chiếc xe khi chúng tôi biết trọng lượng và kích thước động cơ.

Để đo lường nếu mô hình đủ tốt, chúng ta có thể sử dụng một phương thức gọi là Train/Test.


Train/Test là gì

Train/Test là một phương pháp để đo độ chính xác của mô hình của bạn.

Nó được gọi là Train/Test vì bạn chia bộ dữ liệu thành hai bộ: một bộ đào tạo và bộ thử nghiệm.

80% cho đào tạo, và 20% cho thử nghiệm.

Bạn đào tạo mô hình bằng cách sử dụng bộ đào tạo.

Bạn kiểm tra mô hình bằng cách sử dụng bộ thử nghiệm.

Huấn luyện mô hình có nghĩa là tạo mô hình.

Kiểm tra mô hình có nghĩa là kiểm tra độ chính xác của mô hình.


Bắt đầu với một tập dữ liệu

Bắt đầu với một tập dữ liệu bạn muốn kiểm tra.

Bộ dữ liệu của chúng tôi minh họa 100 khách hàng trong một cửa hàng và thói quen mua sắm của họ.

Thí dụ

Nhập Numpyimport matplotlib.pyplot dưới dạng pltnumpy.random.seed (2)
import matplotlib.pyplot as plt
numpy.random.seed(2)

x = numpy.random.nqual (3, 1, 100) y = numpy.random.nqual (150, 40, 100) / x
y = numpy.random.normal(150, 40, 100) / x

plt.scatter (x, y) plt.show ()
plt.show()

Result:

Trục X đại diện cho số phút trước khi mua hàng.

Trục Y đại diện cho số tiền chi tiêu cho việc mua.

Hướng dẫn how do you add test and training data in python? - làm thế nào để bạn thêm dữ liệu thử nghiệm và đào tạo trong python?

Chạy ví dụ »



Chia thành tàu/thử nghiệm

Bộ đào tạo phải là một lựa chọn ngẫu nhiên là 80% dữ liệu gốc.

Bộ thử nghiệm phải là 20%còn lại.

train_x = x[:80]
train_y = y[:80]

test_x = x[80:]
test_y = y[80:]


Hiển thị bộ đào tạo

Hiển thị cùng một biểu đồ phân tán với bộ đào tạo:

Thí dụ

Nhập Numpyimport matplotlib.pyplot dưới dạng pltnumpy.random.seed (2)
plt.show()

Result:

x = numpy.random.nqual (3, 1, 100) y = numpy.random.nqual (150, 40, 100) / x

Hướng dẫn how do you add test and training data in python? - làm thế nào để bạn thêm dữ liệu thử nghiệm và đào tạo trong python?

Chạy ví dụ »


Chia thành tàu/thử nghiệm

Bộ đào tạo phải là một lựa chọn ngẫu nhiên là 80% dữ liệu gốc.

Thí dụ

Nhập Numpyimport matplotlib.pyplot dưới dạng pltnumpy.random.seed (2)
plt.show()

Result:

x = numpy.random.nqual (3, 1, 100) y = numpy.random.nqual (150, 40, 100) / x

Hướng dẫn how do you add test and training data in python? - làm thế nào để bạn thêm dữ liệu thử nghiệm và đào tạo trong python?

Chạy ví dụ »


Chia thành tàu/thử nghiệm

Bộ đào tạo phải là một lựa chọn ngẫu nhiên là 80% dữ liệu gốc.

Bộ thử nghiệm phải là 20%còn lại.

Thí dụ

Nhập Numpyimport matplotlib.pyplot dưới dạng pltnumpy.random.seed (2)

Nhập Numpyimport matplotlib.pyplot dưới dạng pltnumpy.random.seed (2)
import matplotlib.pyplot as plt
numpy.random.seed(2)

x = numpy.random.nqual (3, 1, 100) y = numpy.random.nqual (150, 40, 100) / x
y = numpy.random.normal(150, 40, 100) / x

plt.scatter (x, y) plt.show ()
train_y = y[:80]

Trục X đại diện cho số phút trước khi mua hàng.
test_y = y[80:]

Trục Y đại diện cho số tiền chi tiêu cho việc mua.

Chạy ví dụ »

Chia thành tàu/thử nghiệm
plt.plot(myline, mymodel(myline))
plt.show()

Result:

Hướng dẫn how do you add test and training data in python? - làm thế nào để bạn thêm dữ liệu thử nghiệm và đào tạo trong python?

Chạy ví dụ »

Chia thành tàu/thử nghiệm

Bộ đào tạo phải là một lựa chọn ngẫu nhiên là 80% dữ liệu gốc.


R2

Bộ thử nghiệm phải là 20%còn lại.

Hiển thị bộ đào tạo

Hiển thị cùng một biểu đồ phân tán với bộ đào tạo:

plt.scatter (Train_x, Train_y) plt.show ()

Thí dụ

Nhập Numpyimport matplotlib.pyplot dưới dạng pltnumpy.random.seed (2)

x = numpy.random.nqual (3, 1, 100) y = numpy.random.nqual (150, 40, 100) / x
from sklearn.metrics import r2_score
numpy.random.seed(2)

x = numpy.random.nqual (3, 1, 100) y = numpy.random.nqual (150, 40, 100) / x
y = numpy.random.normal(150, 40, 100) / x

plt.scatter (x, y) plt.show ()
train_y = y[:80]

Trục X đại diện cho số phút trước khi mua hàng.
test_y = y[80:]

Trục Y đại diện cho số tiền chi tiêu cho việc mua.

Chạy ví dụ »

print(r2)

Chia thành tàu/thử nghiệm

Bộ đào tạo phải là một lựa chọn ngẫu nhiên là 80% dữ liệu gốc. The result 0.799 shows that there is a OK relationship.

Bộ thử nghiệm phải là 20%còn lại.

Hiển thị bộ đào tạo

Hiển thị cùng một biểu đồ phân tán với bộ đào tạo:

Thí dụ

Nhập Numpyimport matplotlib.pyplot dưới dạng pltnumpy.random.seed (2)

x = numpy.random.nqual (3, 1, 100) y = numpy.random.nqual (150, 40, 100) / x
from sklearn.metrics import r2_score
numpy.random.seed(2)

x = numpy.random.nqual (3, 1, 100) y = numpy.random.nqual (150, 40, 100) / x
y = numpy.random.normal(150, 40, 100) / x

plt.scatter (x, y) plt.show ()
train_y = y[:80]

Trục X đại diện cho số phút trước khi mua hàng.
test_y = y[80:]

Trục Y đại diện cho số tiền chi tiêu cho việc mua.

Chạy ví dụ »

print(r2)

Chia thành tàu/thử nghiệm

Bộ đào tạo phải là một lựa chọn ngẫu nhiên là 80% dữ liệu gốc. The result 0.809 shows that the model fits the testing set as well, and we are confident that we can use the model to predict future values.


Dự đoán giá trị

Bây giờ chúng tôi đã thiết lập rằng mô hình của chúng tôi là OK, chúng tôi có thể bắt đầu dự đoán các giá trị mới.

Thí dụ

Mua khách hàng sẽ chi bao nhiêu tiền, nếu cô ấy hoặc anh ấy ở trong cửa hàng trong 5 phút?

In (MyModel (5))

Chạy ví dụ »

Ví dụ dự đoán khách hàng chi 22,88 đô la, dường như tương ứng với sơ đồ:

Hướng dẫn how do you add test and training data in python? - làm thế nào để bạn thêm dữ liệu thử nghiệm và đào tạo trong python?



Làm thế nào để bạn tạo một bộ dữ liệu kiểm tra và đào tạo trong Python?

Học máy - Train/Test..
Nhập khẩu Numpy. Nhập matplotlib.pyplot như plt. numpy.random.seed (2) ....
Vẽ một đường hồi quy đa thức thông qua các điểm dữ liệu: nhập Numpy. ....
Dữ liệu đào tạo của tôi phù hợp với hồi quy đa thức như thế nào? Nhập khẩu Numpy. ....
Hãy để chúng tôi tìm điểm R2 khi sử dụng dữ liệu thử nghiệm: Nhập Numpy ..

Làm thế nào để bạn tải dữ liệu đào tạo trong Python?

5 cách khác nhau để tải dữ liệu trong Python..
Hàm thủ công ..
Chức năng LoadTXT ..
Chức năng GenFromTxt ..
hàm read_csv ..
Pickle..

Làm thế nào để bạn kiểm tra độ chính xác và đào tạo trong Python?

Bước 1 - Nhập thư viện.Từ sklearn.model_selection nhập Cross_val_score từ Sklearn.Tree Nhập RANSTREECLASSIFIER từ các bộ dữ liệu nhập Sklearn.....
Bước 2 - Thiết lập dữ liệu.Chúng tôi đã sử dụng một bộ dữ liệu rượu vang sẵn có.....
Bước 3 - Mô hình và độ chính xác của nó ..

Làm thế nào để bạn chia dữ liệu thành đào tạo và thử nghiệm trong Python Sklearn?

Phương thức Train_Test_Split () được sử dụng để chia dữ liệu của chúng tôi thành các bộ đào tạo và thử nghiệm.Đầu tiên, chúng ta cần chia dữ liệu của mình thành các tính năng (x) và nhãn (y).DataFrame được chia thành X_Train, X_Test, Y_Train và Y_Test.Các bộ x_train và Y_Train được sử dụng để đào tạo và lắp mô hình.. First, we need to divide our data into features (X) and labels (y). The dataframe gets divided into X_train,X_test , y_train and y_test. X_train and y_train sets are used for training and fitting the model.