Ba phương pháp lấy mẫu phổ biến là gì?
Đây là lý do tại sao. Nếu bạn là nhà khoa học dữ liệu và muốn phát triển các mô hình, bạn cần có dữ liệu. Và nếu bạn cần dữ liệu, ai đó cần thu thập dữ liệu đó. Và nếu ai đó đang thu thập dữ liệu, thì họ cần đảm bảo rằng dữ liệu đó không thiên vị, nếu không sẽ rất tốn kém về lâu dài
Do đó, nếu bạn muốn thu thập dữ liệu không thiên vị thì bạn cần biết về lấy mẫu ngẫu nhiên. Show
4 loại kỹ thuật lấy mẫu ngẫu nhiên
Thông tin khác từ Terence Shin 10 khái niệm SQL nâng cao bạn nên biết cho các cuộc phỏng vấn về khoa học dữ liệu
Lấy mẫu ngẫu nhiên là gì?Lấy mẫu ngẫu nhiên chỉ đơn giản mô tả trạng thái trong đó mọi phần tử trong tổng thể đều có cơ hội được chọn vào mẫu như nhau. Nghe có vẻ đơn giản phải không? . bốn loại kỹ thuật lấy mẫu ngẫu nhiên này sẽ cho phép bạn thực hiện điều đó.
1. Phương pháp lấy mẫu ngẫu nhiên đơn giảnLấy mẫu ngẫu nhiên đơn giản yêu cầu sử dụng các số được tạo ngẫu nhiên để chọn mẫu. Cụ thể hơn, ban đầu nó yêu cầu khung lấy mẫu, là danh sách hoặc cơ sở dữ liệu của tất cả các thành viên của dân số. Sau đó, bạn có thể tạo ngẫu nhiên một số cho từng phần tử, chẳng hạn như sử dụng Excel và lấy n số đầu tiên . Hình ảnh được tạo bởi tác giảĐể đưa ra một ví dụ, hãy tưởng tượng bảng bên phải là khung lấy mẫu của bạn. Khi sử dụng phần mềm như Excel, bạn có thể tạo các số ngẫu nhiên cho từng phần tử trong khung lấy mẫu. Nếu bạn cần cỡ mẫu là ba, thì bạn sẽ lấy các mẫu có số ngẫu nhiên từ một đến ba
2. Lấy mẫu ngẫu nhiên phân tầngLấy mẫu ngẫu nhiên phân tầng liên quan đến việc chia dân số thành các nhóm có thuộc tính tương tự và lấy mẫu ngẫu nhiên từng nhóm Phương pháp này đảm bảo rằng các phân khúc khác nhau trong tổng thể được đại diện như nhau. Để đưa ra một ví dụ, hãy tưởng tượng một cuộc khảo sát được thực hiện tại một trường học để xác định mức độ hài lòng chung. Ở đây, lấy mẫu ngẫu nhiên phân tầng có thể đại diện như nhau cho ý kiến của sinh viên trong mỗi khoa
3. Lấy mẫu ngẫu nhiên theo cụmLấy mẫu theo cụm bắt đầu bằng cách chia tổng thể thành các nhóm hoặc cụm. Điều làm cho điều này khác với lấy mẫu phân tầng là mỗi cụm phải đại diện cho tổng thể lớn hơn. Sau đó, bạn chọn ngẫu nhiên toàn bộ cụm để lấy mẫu. Hình ảnh được tạo bởi tác giảVí dụ: nếu một trường có năm lớp tám khác nhau, lấy mẫu ngẫu nhiên theo cụm có nghĩa là bất kỳ một lớp nào cũng sẽ được dùng làm mẫu
4. Lấy mẫu ngẫu nhiên có hệ thốngLấy mẫu ngẫu nhiên có hệ thống là kỹ thuật phổ biến trong đó bạn lấy mẫu mọi kphần tử. Ví dụ: nếu bạn đang tiến hành khảo sát tại trung tâm mua sắm, bạn có thể khảo sát mọi người thứ 100 bước vào. Nếu bạn có khung lấy mẫu, thì bạn sẽ chia kích thước của khung, N, cho kích thước mẫu mong muốn, n, to get the index number, k. You would then choose every kphần tử trong khung để tạo mẫu của mình. Hình ảnh được tạo bởi tác giảSử dụng cùng các biểu đồ từ ví dụ đầu tiên, nếu lần này chúng tôi muốn kích thước mẫu là hai, thì chúng tôi sẽ lấy mọi hàng thứ ba trong khung lấy mẫu Thông tin thêm về Khoa học dữ liệu Cách tạo công cụ tìm kiếm bằng Python và Laravel
Giải thích lấy mẫu ngẫu nhiênBây giờ bạn đã hiểu về lấy mẫu ngẫu nhiên là gì và một số kỹ thuật phổ biến để tiến hành lấy mẫu. Nắm vững khái niệm này là cực kỳ quan trọng để giảm thiểu sai lệch và tạo ra các mô hình tốt hơn
|