Ba phương pháp lấy mẫu phổ biến là gì?

Đây là lý do tại sao. Nếu bạn là nhà khoa học dữ liệu và muốn phát triển các mô hình, bạn cần có dữ liệu. Và nếu bạn cần dữ liệu, ai đó cần thu thập dữ liệu đó. Và nếu ai đó đang thu thập dữ liệu, thì họ cần đảm bảo rằng dữ liệu đó không thiên vị, nếu không sẽ rất tốn kém về lâu dài

Do đó, nếu bạn muốn thu thập dữ liệu không thiên vị thì bạn cần biết về lấy mẫu ngẫu nhiên.

4 loại kỹ thuật lấy mẫu ngẫu nhiên

  1. Phương pháp lấy mẫu ngẫu nhiên đơn giản
  2. lấy mẫu ngẫu nhiên phân tầng
  3. Lấy mẫu ngẫu nhiên theo cụm
  4. lấy mẫu ngẫu nhiên có hệ thống

Thông tin khác từ Terence Shin 10 khái niệm SQL nâng cao bạn nên biết cho các cuộc phỏng vấn về khoa học dữ liệu

 

Lấy mẫu ngẫu nhiên là gì?

Lấy mẫu ngẫu nhiên chỉ đơn giản mô tả trạng thái trong đó mọi phần tử trong tổng thể đều có cơ hội được chọn vào mẫu như nhau. Nghe có vẻ đơn giản phải không? .  bốn loại kỹ thuật lấy mẫu ngẫu nhiên này sẽ cho phép bạn thực hiện điều đó.

 

1. Phương pháp lấy mẫu ngẫu nhiên đơn giản

Lấy mẫu ngẫu nhiên đơn giản yêu cầu sử dụng các số được tạo ngẫu nhiên để chọn mẫu. Cụ thể hơn, ban đầu nó yêu cầu khung lấy mẫu, là danh sách hoặc cơ sở dữ liệu của tất cả các thành viên của dân số. Sau đó, bạn có thể tạo ngẫu nhiên một số cho từng phần tử, chẳng hạn như sử dụng Excel và lấy n số đầu tiên .

Ba phương pháp lấy mẫu phổ biến là gì?
Hình ảnh được tạo bởi tác giả

Để đưa ra một ví dụ, hãy tưởng tượng bảng bên phải là khung lấy mẫu của bạn. Khi sử dụng phần mềm như Excel, bạn có thể tạo các số ngẫu nhiên cho từng phần tử trong khung lấy mẫu. Nếu bạn cần cỡ mẫu là ba, thì bạn sẽ lấy các mẫu có số ngẫu nhiên từ một đến ba

 

2. Lấy mẫu ngẫu nhiên phân tầng

Lấy mẫu ngẫu nhiên phân tầng liên quan đến việc chia dân số thành các nhóm có thuộc tính tương tự và lấy mẫu ngẫu nhiên từng nhóm

Ba phương pháp lấy mẫu phổ biến là gì?
Hình ảnh được tạo bởi tác giả

Phương pháp này đảm bảo rằng các phân khúc khác nhau trong tổng thể được đại diện như nhau. Để đưa ra một ví dụ, hãy tưởng tượng một cuộc khảo sát được thực hiện tại một trường học để xác định mức độ hài lòng chung. Ở đây, lấy mẫu ngẫu nhiên phân tầng có thể đại diện như nhau cho ý kiến ​​​​của sinh viên trong mỗi khoa

 

3. Lấy mẫu ngẫu nhiên theo cụm

Lấy mẫu theo cụm bắt đầu bằng cách chia tổng thể thành các nhóm hoặc cụm. Điều làm cho điều này khác với lấy mẫu phân tầng là mỗi cụm phải đại diện cho tổng thể lớn hơn. Sau đó, bạn chọn ngẫu nhiên toàn bộ cụm để lấy mẫu.

Ba phương pháp lấy mẫu phổ biến là gì?
Hình ảnh được tạo bởi tác giả

Ví dụ: nếu một trường có năm lớp tám khác nhau, lấy mẫu ngẫu nhiên theo cụm có nghĩa là bất kỳ một lớp nào cũng sẽ được dùng làm mẫu

 

4. Lấy mẫu ngẫu nhiên có hệ thống

Lấy mẫu ngẫu nhiên có hệ thống là kỹ thuật phổ biến trong đó bạn lấy mẫu mọi kphần tử. Ví dụ: nếu bạn đang tiến hành khảo sát tại trung tâm mua sắm, bạn có thể khảo sát mọi người thứ 100 bước vào.

Nếu bạn có khung lấy mẫu, thì bạn sẽ chia kích thước của khung, N, cho kích thước mẫu mong muốn, n, to get the index number, k. You would then choose every kphần tử trong khung để tạo mẫu của mình.

Ba phương pháp lấy mẫu phổ biến là gì?
Hình ảnh được tạo bởi tác giả

Sử dụng cùng các biểu đồ từ ví dụ đầu tiên, nếu lần này chúng tôi muốn kích thước mẫu là hai, thì chúng tôi sẽ lấy mọi hàng thứ ba trong khung lấy mẫu

Thông tin thêm về Khoa học dữ liệu Cách tạo công cụ tìm kiếm bằng Python và Laravel

 

Giải thích lấy mẫu ngẫu nhiên

Bây giờ bạn đã hiểu về lấy mẫu ngẫu nhiên là gì và một số kỹ thuật phổ biến để tiến hành lấy mẫu. Nắm vững khái niệm này là cực kỳ quan trọng để giảm thiểu sai lệch và tạo ra các mô hình tốt hơn

Phương pháp lấy mẫu phổ biến nhất là gì?

Có rất nhiều cách để lấy mẫu, nhưng đây là những phương pháp lấy mẫu được sử dụng phổ biến nhất. .
Lấy mẫu ngẫu nhiên. .
Lấy mẫu phân tầng. .
Lấy mẫu hệ thống. .
Lấy mẫu thuận tiện. .
Lấy mẫu hạn ngạch. .
Lấy mẫu có mục đích

Các loại lấy mẫu chính là gì?

Trong thống kê, lấy mẫu là quá trình chọn một tập hợp con dữ liệu từ tập dữ liệu lớn hơn. Có hai loại lấy mẫu chính. lấy mẫu xác suất và lấy mẫu phi xác suất. Sự khác biệt chính giữa hai loại lấy mẫu là cách chọn mẫu từ dân số

3 kỹ thuật được sử dụng trong lấy mẫu ngẫu nhiên là gì?

Có bốn phương pháp lấy mẫu chính, ngẫu nhiên (xác suất) – lấy mẫu ngẫu nhiên đơn giản, lấy mẫu hệ thống, lấy mẫu phân tầng và lấy mẫu cụm .

5 kỹ thuật lấy mẫu là gì?

Có năm loại lấy mẫu. Ngẫu nhiên, có hệ thống, thuận tiện, cụm và phân tầng. .
Lấy mẫu ngẫu nhiên tương tự như đặt tên của mọi người vào một chiếc mũ và rút ra một số tên. .
Lấy mẫu hệ thống dễ thực hiện hơn lấy mẫu ngẫu nhiên