Do đó, nếu bạn muốn thu thập dữ liệu không thiên vị thì bạn cần biết về lấy mẫu ngẫu nhiên.
4 loại kỹ thuật lấy mẫu ngẫu nhiên
- Phương pháp lấy mẫu ngẫu nhiên đơn giản
- lấy mẫu ngẫu nhiên phân tầng
- Lấy mẫu ngẫu nhiên theo cụm
- lấy mẫu ngẫu nhiên có hệ thống
Thông tin khác từ Terence Shin 10 khái niệm SQL nâng cao bạn nên biết cho các cuộc phỏng vấn về khoa học dữ liệu
Lấy mẫu ngẫu nhiên là gì?
Lấy mẫu ngẫu nhiên chỉ đơn giản mô tả trạng thái trong đó mọi phần tử trong tổng thể đều có cơ hội được chọn vào mẫu như nhau. Nghe có vẻ đơn giản phải không? . bốn loại kỹ thuật lấy mẫu ngẫu nhiên này sẽ cho phép bạn thực hiện điều đó.
1. Phương pháp lấy mẫu ngẫu nhiên đơn giản
Lấy mẫu ngẫu nhiên đơn giản yêu cầu sử dụng các số được tạo ngẫu nhiên để chọn mẫu. Cụ thể hơn, ban đầu nó yêu cầu khung lấy mẫu, là danh sách hoặc cơ sở dữ liệu của tất cả các thành viên của dân số. Sau đó, bạn có thể tạo ngẫu nhiên một số cho từng phần tử, chẳng hạn như sử dụng Excel và lấy n số đầu tiên .
Để đưa ra một ví dụ, hãy tưởng tượng bảng bên phải là khung lấy mẫu của bạn. Khi sử dụng phần mềm như Excel, bạn có thể tạo các số ngẫu nhiên cho từng phần tử trong khung lấy mẫu. Nếu bạn cần cỡ mẫu là ba, thì bạn sẽ lấy các mẫu có số ngẫu nhiên từ một đến ba
2. Lấy mẫu ngẫu nhiên phân tầng
Lấy mẫu ngẫu nhiên phân tầng liên quan đến việc chia dân số thành các nhóm có thuộc tính tương tự và lấy mẫu ngẫu nhiên từng nhóm
Phương pháp này đảm bảo rằng các phân khúc khác nhau trong tổng thể được đại diện như nhau. Để đưa ra một ví dụ, hãy tưởng tượng một cuộc khảo sát được thực hiện tại một trường học để xác định mức độ hài lòng chung. Ở đây, lấy mẫu ngẫu nhiên phân tầng có thể đại diện như nhau cho ý kiến của sinh viên trong mỗi khoa
3. Lấy mẫu ngẫu nhiên theo cụm
Lấy mẫu theo cụm bắt đầu bằng cách chia tổng thể thành các nhóm hoặc cụm. Điều làm cho điều này khác với lấy mẫu phân tầng là mỗi cụm phải đại diện cho tổng thể lớn hơn. Sau đó, bạn chọn ngẫu nhiên toàn bộ cụm để lấy mẫu.
Ví dụ: nếu một trường có năm lớp tám khác nhau, lấy mẫu ngẫu nhiên theo cụm có nghĩa là bất kỳ một lớp nào cũng sẽ được dùng làm mẫu
4. Lấy mẫu ngẫu nhiên có hệ thống
Lấy mẫu ngẫu nhiên có hệ thống là kỹ thuật phổ biến trong đó bạn lấy mẫu mọi kphần tử. Ví dụ: nếu bạn đang tiến hành khảo sát tại trung tâm mua sắm, bạn có thể khảo sát mọi người thứ 100 bước vào.
Nếu bạn có khung lấy mẫu, thì bạn sẽ chia kích thước của khung, N, cho kích thước mẫu mong muốn, n, to get the index number, k. You would then choose every kphần tử trong khung để tạo mẫu của mình.
Sử dụng cùng các biểu đồ từ ví dụ đầu tiên, nếu lần này chúng tôi muốn kích thước mẫu là hai, thì chúng tôi sẽ lấy mọi hàng thứ ba trong khung lấy mẫu
Thông tin thêm về Khoa học dữ liệu Cách tạo công cụ tìm kiếm bằng Python và Laravel
Giải thích lấy mẫu ngẫu nhiên
Bây giờ bạn đã hiểu về lấy mẫu ngẫu nhiên là gì và một số kỹ thuật phổ biến để tiến hành lấy mẫu. Nắm vững khái niệm này là cực kỳ quan trọng để giảm thiểu sai lệch và tạo ra các mô hình tốt hơn
Phương pháp lấy mẫu phổ biến nhất là gì?
Các loại lấy mẫu chính là gì?
3 kỹ thuật được sử dụng trong lấy mẫu ngẫu nhiên là gì?
5 kỹ thuật lấy mẫu là gì?