Hướng dẫn sklearn bootstrap - sklearn bootstrap

Đây là một hướng dẫn về lấy mẫu bootstrap trong Python. Trong hướng dẫn này, chúng tôi sẽ tìm hiểu những gì là bootstrapping và sau đó xem cách thực hiện nó.

Nội phân chính

  • Lấy mẫu bootstrap là gì?
  • Làm thế nào để thực hiện lấy mẫu bootstrap trong Python?
  • 1. Nhập các mô -đun cần thiết.
  • 2. Tạo dữ liệu ngẫu nhiên
  • 3. Sử dụng lấy mẫu bootstrap để ước tính giá trị trung bình
  • Hoàn thành mã để thực hiện lấy mẫu bootstrap trong Python

Bắt đầu nào.

Lấy mẫu bootstrap là gì?

Làm thế nào để thực hiện lấy mẫu bootstrap trong Python?

1. Nhập các mô -đun cần thiết.

2. Tạo dữ liệu ngẫu nhiên

3. Sử dụng lấy mẫu bootstrap để ước tính giá trị trung bình

Hoàn thành mã để thực hiện lấy mẫu bootstrap trong Python1000. Then to find the mean, instead of considering all the 1000 entries you can take 50 samples of size 4 each and calculate the mean for each sample. This way you will be taking an average of 200 entries (50X4) chosen randomly.

Bắt đầu nào.

Làm thế nào để thực hiện lấy mẫu bootstrap trong Python?

1. Nhập các mô -đun cần thiết.

2. Tạo dữ liệu ngẫu nhiên

3. Sử dụng lấy mẫu bootstrap để ước tính giá trị trung bình

1. Nhập các mô -đun cần thiết.

2. Tạo dữ liệu ngẫu nhiên

  • 3. Sử dụng lấy mẫu bootstrap để ước tính giá trị trung bình
  • Hoàn thành mã để thực hiện lấy mẫu bootstrap trong Python

Bắt đầu nào.

import numpy as np
import random

Định nghĩa cho việc lấy mẫu bootstrap như sau:

Trong thống kê, lấy mẫu bootstrap là một phương pháp liên quan đến việc vẽ dữ liệu mẫu nhiều lần bằng cách thay thế từ nguồn dữ liệu để ước tính tham số dân số.

Điều này về cơ bản có nghĩa là lấy mẫu bootstrap là một kỹ thuật sử dụng mà bạn có thể ước tính các tham số như trung bình cho toàn bộ dân số mà không xem xét rõ ràng từng điểm dữ liệu trong dân số.300 and with 1000 entries.

Thay vì nhìn vào toàn bộ dân số, chúng tôi nhìn vào nhiều tập hợp con cùng kích thước được lấy từ dân số.

x = np.random.normal(loc= 300.0, size=1000)

Ví dụ: nếu kích thước dân số của bạn là 1000. Sau đó, để tìm giá trị trung bình, thay vì xem xét tất cả 1000 mục bạn có thể lấy 50 mẫu có kích thước 4 mỗi mẫu và tính giá trị trung bình cho mỗi mẫu. Bằng cách này, bạn sẽ lấy trung bình 200 mục (50x4) được chọn ngẫu nhiên.

print (np.mean(x))

Một chiến lược tương tự được các nhà nghiên cứu thị trường sử dụng để thực hiện nghiên cứu trong một dân số khổng lồ.

300.01293472373254

Bây giờ, hãy để Lôi nhìn vào cách thực hiện lấy mẫu bootstrap trong Python.

3. Sử dụng lấy mẫu bootstrap để ước tính giá trị trung bình

Hoàn thành mã để thực hiện lấy mẫu bootstrap trong Python

Bắt đầu nào.

sample_mean = []

for i in range(50):
  y = random.sample(x.tolist(), 4)
  avg = np.mean(y)
  sample_mean.append(avg)

Định nghĩa cho việc lấy mẫu bootstrap như sau:

Trong thống kê, lấy mẫu bootstrap là một phương pháp liên quan đến việc vẽ dữ liệu mẫu nhiều lần bằng cách thay thế từ nguồn dữ liệu để ước tính tham số dân số.

print(np.mean(sample_mean))

Một chiến lược tương tự được các nhà nghiên cứu thị trường sử dụng để thực hiện nghiên cứu trong một dân số khổng lồ.

Bây giờ, hãy để Lôi nhìn vào cách thực hiện lấy mẫu bootstrap trong Python.

Chúng tôi sẽ tạo ra một số dữ liệu ngẫu nhiên với giá trị trung bình được xác định trước. Để làm điều đó, chúng tôi sẽ sử dụng mô -đun Numpy trong Python.

Hãy bắt đầu bằng cách nhập các mô -đun cần thiết.

299.99137705245636

Các mô -đun chúng ta cần là:

300.13411004148315

Hoàn thành mã để thực hiện lấy mẫu bootstrap trong Python

Bắt đầu nào.

import numpy as np
import random

x = np.random.normal(loc= 300.0, size=1000)
print(np.mean(x))

sample_mean = []
for i in range(50):
  y = random.sample(x.tolist(), 4)
  avg = np.mean(y)
  sample_mean.append(avg)

print(np.mean(sample_mean))

Định nghĩa cho việc lấy mẫu bootstrap như sau:

Trong thống kê, lấy mẫu bootstrap là một phương pháp liên quan đến việc vẽ dữ liệu mẫu nhiều lần bằng cách thay thế từ nguồn dữ liệu để ước tính tham số dân số.