R có nghĩa là khoảng tin cậy bootstrap

Gói khởi động cung cấp các phương tiện mở rộng để khởi động và các phương pháp lấy mẫu lại có liên quan. Bạn có thể bootstrap một thống kê duy nhất (e. g. một trung vị) hoặc một vectơ (e. g. , trọng số hồi quy). Phần này sẽ giúp bạn bắt đầu với việc khởi động phi tham số cơ bản

Hàm bootstrapping chính là boot() và có dạng như sau

bootobject <- boot(data= , statistic= , R=,. ) ở đâu

tham số mô tả dữ liệu Một véc-tơ, ma trận hoặc khung thống kê dữ liệu Một hàm tạo ra thống kê k cần khởi động (k=1 nếu khởi động một thống kê)
Hàm phải bao gồm một tham số chỉ mục mà hàm boot() có thể sử dụng để chọn các trường hợp cho mỗi bản sao (xem ví dụ bên dưới). RSố bản sao bootstrap. Các tham số bổ sung được chuyển đến hàm tạo thống kê quan tâm

boot() gọi hàm thống kê R lần. Mỗi lần, nó tạo ra một tập hợp các chỉ số ngẫu nhiên, có sự thay thế, từ các số nguyên 1. thu hẹp (dữ liệu). Các chỉ số này được sử dụng trong hàm thống kê để chọn mẫu. Các số liệu thống kê được tính toán trên mẫu và kết quả được tích lũy trong bootobject. Cấu trúc bootobject bao gồm

mô tả phần tử t0 Các giá trị quan sát của thống kê k được áp dụng cho dữ liệu gốc. tMột ma trận R x k trong đó mỗi hàng là bản sao bootstrap của thống kê k

Bạn có thể truy cập chúng dưới dạng bootobject$t0 và bootobject$t

Khi bạn tạo các mẫu bootstrap, print(bootobject) và plot(bootobject) có thể được sử dụng để kiểm tra kết quả. Nếu kết quả có vẻ hợp lý, bạn có thể sử dụng boot. hàm ci( ) để lấy khoảng tin cậy cho (các) thống kê

định dạng là

khởi động. ci(bootobject, conf=, type= ) ở đâu

tham số mô tảbootobjectĐối tượng được trả về bởi hàm khởi độngconf Khoảng tin cậy mong muốn (mặc định. conf=0. 95)typeLoại khoảng tin cậy được trả về. Các giá trị có thể là "norm", "basic", "stud", "perc", "bca" và "all" (mặc định. loại = "tất cả")

Bootstrapping một thống kê duy nhất (k=1)

Ví dụ sau đây tạo khoảng tin cậy 95% đã khởi động cho bình phương R trong hồi quy tuyến tính của dặm trên gallon (mpg) trên trọng lượng ô tô (wt) và dung tích dịch chuyển (độ phân tán). Nguồn dữ liệu là mtcars. Khoảng tin cậy bootstrapped dựa trên 1000 lần lặp lại

# Bootstrap 95% CI for R-Squared
library(boot)
# function to obtain R-Squared from the data
rsq <- function(formula, data, indices) {
  d <- data[indices,] # allows boot to select sample
  fit <- lm(formula, data=d)
  return(summary(fit)$r.square)
}
# bootstrapping with 1000 replications
results <- boot(data=mtcars, statistic=rsq,
   R=1000, formula=mpg~wt+disp)

# view results
results
plot(results)

# get 95% confidence interval
boot.ci(results, type="bca")

nhấp để xem

Bootstrapping một số Thống kê (k>1)

Trong ví dụ trên, hàm rsq trả về một số và khởi động. ci trả về một khoảng tin cậy duy nhất. Hàm thống kê bạn cung cấp cũng có thể trả về một vectơ. Trong ví dụ tiếp theo, chúng tôi nhận được 95% CI cho ba hệ số hồi quy mô hình (chặn, trọng lượng xe, chuyển vị). Trong trường hợp này, chúng tôi thêm một tham số chỉ mục vào biểu đồ ( ) và khởi động. ci( ) để chỉ ra cột nào trong bootobject$t được phân tích

# Bootstrap 95% CI for regression coefficients
library(boot)
# function to obtain regression weights
bs <- function(formula, data, indices) {
  d <- data[indices,] # allows boot to select sample
  fit <- lm(formula, data=d)
  return(coef(fit))
}
# bootstrapping with 1000 replications
results <- boot(data=mtcars, statistic=bs,
   R=1000, formula=mpg~wt+disp)

# view results
results
plot(results, index=1) # intercept
plot(results, index=2) # wt
plot(results, index=3) # disp

# get 95% confidence intervals
boot.ci(results, type="bca", index=1) # intercept
boot.ci(results, type="bca", index=2) # wt
boot.ci(results, type="bca", index=3) # disp

nhấp để xem

Đi xa hơn

Hàm boot( ) có thể tạo cả lấy mẫu lại tham số và phi tham số. Đối với bootstrap không tham số, các phương pháp lấy mẫu lại bao gồm thông thường, cân bằng, phản đối và hoán vị. Đối với bootstrap không tham số, hỗ trợ lấy mẫu lại phân tầng. Trọng lượng lấy mẫu lại tầm quan trọng cũng có thể được chỉ định

Chiếc ủng. hàm ci( ) lấy một đối tượng khởi động và tạo ra 5 loại khoảng tin cậy không tham số hai phía khác nhau. Chúng bao gồm xấp xỉ bình thường bậc một, khoảng thời gian bootstrap cơ bản, khoảng thời gian bootstrap được sinh viên hóa, khoảng phần trăm bootstrap và khoảng phần trăm bootstrap được điều chỉnh (BCa)

Nhìn vào trợ giúp (khởi động), trợ giúp (khởi động. ci) và trợ giúp (âm mưu. khởi động) để biết thêm chi tiết

Học nhiều hơn nữa

Các nguồn thông tin tốt bao gồm Phương pháp lấy mẫu lại trong R. Gói khởi động của Angelo Canty, Bắt đầu với gói khởi động của Ajay Shah, Mô hình hồi quy khởi động của John Fox, và Phương pháp Bootstrap và ứng dụng của chúng bởi Davison và Hinkley

Luyện tập

Hãy thử bài tập tương tác này với gói khởi động từ khóa học Giới thiệu về tài chính tính toán với R của DataCamp

Khoảng tin cậy bootstrap có nghĩa là gì?

tạo nhiều mẫu lại (có thay thế) từ một tập hợp các quan sát và tính toán mức độ ảnh hưởng quan tâm trên mỗi mẫu lại này . Sau đó, các mẫu khởi động lại của kích thước hiệu ứng có thể được sử dụng để xác định 95% CI. Với máy tính, chúng ta có thể thực hiện 5000 mẫu lại rất dễ dàng.

Bootstrapping có nghĩa là gì trong R?

Bootstrapping là một phương pháp phi tham số cho phép chúng tôi tính toán các sai số chuẩn ước tính, khoảng tin cậy và thử nghiệm giả thuyết . Nói chung bootstrapping tuân theo các bước cơ bản giống nhau. Lấy mẫu lại một tập dữ liệu nhất định một số lần được chỉ định. Tính toán một thống kê cụ thể từ mỗi mẫu.

Khoảng tin cậy 95% trong R là gì?

Bằng cách áp dụng công thức CI ở trên, Khoảng tin cậy 95% sẽ là [12. 23, 15. 21]. Điều này chỉ ra rằng ở mức độ tin cậy 95%, giá trị trung bình thực sự của việc sản xuất hiệu giá kháng thể có thể nằm trong khoảng từ 12. 23 và 15. 21. Tuy nhiên có 5% khả năng nó sẽ không

Bootstrap có giống như khoảng tin cậy không?

Bootstrap cũng là một cách thích hợp để kiểm soát và kiểm tra tính ổn định của kết quả. Mặc dù đối với hầu hết các vấn đề, không thể biết khoảng tin cậy thực sự, bootstrap chính xác hơn một cách tiệm cận so với các khoảng chuẩn thu được bằng cách sử dụng phương sai mẫu và các giả định về tính chuẩn .