Hướng dẫn welchs t-test confidence interval python - trăn khoảng tin cậy t-test của Welch

Không chắc chắn về Scripy. Có thể có một trang web trợ giúp kinh điển sẽ hiển thị mã. [Có lẽ điều này.]

Trong R, CI 95% là một phần của đầu ra

me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118
7, trong đó phiên bản Welch của thử nghiệm T 2 mẫu là mặc định [và đối số
me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118
8 giúp bạn kiểm tra gộp].

ts1 = c[11,9,10,11,10,12,9,11,12,9]
ts2 = c[11,13,10,13,12,9,11,12,12,11]
t.test[ts1, ts2]

        Welch Two Sample t-test

data:  ts1 and ts2
t = -1.8325, df = 17.9, p-value = 0.08356
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -2.1469104  0.1469104
sample estimates:
mean of x mean of y 
     10.4      11.4 

Bởi vì CI 95% bao gồm $ 0 $, thử nghiệm 2 mặt không từ chối $ h_0: \ mu_1 = \ mu_2 $ ở mức 5%.$0$ the 2-sided test does not reject $H_0: \mu_1=\mu_2$ at the 5% level.

Biên độ lỗi 95% là $ t^*\ sqrt {\ frac {s_1^2} {n_1}+\ frac {s_2^2} {n_2}}, $ trong đó $ t^*$ %$ từ đuôi trên của phân phối t của sinh viên với mức độ tự do $ \ nu^\ Prime $ như được tìm thấy từ công thức Welch liên quan đến các phương sai mẫu và cỡ mẫu. [Ở đây, $ \ nu^\ Prime = 17.9, $ trong một số phần mềm được làm tròn xuống một số nguyên. Một luôn luôn có $ \ min [n_1-1, n_2-1] \ le \ nu^\ Prime \ le n_1+n_2-2.] $$t^*\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}},$ where $t^*$ cuts probability $0.025=2.5\%$ from the upper tail of Student's t distribution with degrees of freedom $\nu^\prime$ as found from the Welch formula involving sample variances and sample sizes. [Here, $\nu^\prime = 17.9,$ in some software rounded down to an integer. One always has $\min[n_1-1,n_2-1] \le \nu^\prime \le n_1+n_2-2.]$

me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118

Luôn luôn là một ý tưởng tốt để ghi nhớ các công thức thực tế, ngay cả khi người ta hy vọng sẽ chỉ sử dụng chúng.

Giả sử rằng chúng ta đang ở trong nhóm khoa học dữ liệu cho một công ty nước cam. Trong cuộc họp, nhóm tiếp thị tuyên bố rằng chiến lược tiếp thị mới của họ dẫn đến tăng doanh số. Đội ngũ quản lý yêu cầu chúng tôi xác định xem điều này có thực sự đúng không.

Đây là dữ liệu từ tháng 1 và tháng hai.

  • Doanh số trung bình hàng ngày trong tháng 1 = \ $ 10.000, cỡ mẫu = 31, phương sai = 10.000.000
  • Doanh số trung bình hàng ngày trong tháng 2 = \ $ 12.000, cỡ mẫu = 28, phương sai = 20.000.000

Làm thế nào để chúng ta biết rằng sự gia tăng doanh số bán nước cam hàng ngày không phải do sự thay đổi ngẫu nhiên trong dữ liệu?

NULL và giả thuyết thay thế

Số tiền bán hàng mỗi ngày không nhất quán trong suốt tháng. Dữ liệu tháng 1 có phương sai 10.000.000 và độ lệch chuẩn là ~ 3162. Vào những ngày tồi tệ, chúng tôi sẽ bán \ 8.000 đô la nước cam. Vào những ngày tốt, chúng tôi sẽ bán 14.000 đô la nước cam. Chúng tôi phải chứng minh rằng sự gia tăng doanh số trung bình hàng ngày trong tháng Hai đã không hoàn toàn xảy ra.

Giả thuyết khống sẽ là:

$ H_0: \ mu_0 - \ mu_1 = 0 $

Có ba giả thuyết thay thế có thể:

  1. $ H_a: \ mu_0 \ mu_1 $
  2. $ H_a: \ mu_0 \ ne \ mu_1 $

Trong đó $ \ mu_0 $ là doanh số trung bình hàng ngày trong tháng 1 và $ \ mu_1 $ là doanh số trung bình hàng ngày trong tháng Hai. Giả thuyết khống của chúng tôi chỉ đơn giản là nói rằng không có thay đổi về doanh số trung bình hàng ngày.

Nếu chúng tôi quan tâm đến việc kết luận rằng doanh số trung bình hàng ngày đã tăng thì chúng tôi sẽ đi với giả thuyết thay thế đầu tiên. Nếu chúng tôi quan tâm đến việc kết luận rằng doanh số trung bình hàng ngày đã giảm, thì chúng tôi sẽ đi với giả thuyết thay thế thứ hai. Nếu chúng tôi quan tâm đến việc kết luận rằng doanh số trung bình hàng ngày đã thay đổi, thì chúng tôi sẽ đi với giả thuyết thay thế thứ ba.

Trong trường hợp của chúng tôi, bộ phận tiếp thị tuyên bố rằng doanh số đã tăng lên. Vì vậy, chúng tôi sẽ sử dụng giả thuyết thay thế đầu tiên.

Lỗi loại I và II

Chúng tôi phải xác định xem chúng tôi chấp nhận hoặc từ chối giả thuyết null. Điều này có thể dẫn đến bốn kết quả khác nhau.

  1. Giữ lại giả thuyết null, và giả thuyết null là chính xác. [Không có lỗi]
  2. Giữ lại giả thuyết null, nhưng giả thuyết thay thế là chính xác. [Lỗi loại II, Sai âm]
  3. Bác bỏ giả thuyết null, nhưng giả thuyết null là chính xác. [Lỗi loại I, dương tính giả]
  4. Bác bỏ giả thuyết null, và giả thuyết thay thế là chính xác. [Không có lỗi]

Kiểm tra giả thuyết sử dụng logic tương tự như một phiên tòa xét xử. Giả thuyết khống [bảo vệ] là vô tội cho đến khi được chứng minh là có tội. Chúng tôi sử dụng dữ liệu làm bằng chứng để xác định xem các khiếu nại có đưa ra giả thuyết null là đúng hay không.

Mức độ đáng kể¶

Để đưa ra quyết định, chúng ta cần biết liệu dữ liệu tháng hai có ý nghĩa thống kê hay không. Chúng ta sẽ phải tính toán xác suất tìm thấy dữ liệu được quan sát hoặc dữ liệu cực đoan hơn giả định rằng giả thuyết null, $ h_0 $ là đúng. Xác suất này được gọi là giá trị p.p-value.

Nếu xác suất này cao, chúng tôi sẽ giữ lại giả thuyết null. Nếu xác suất này thấp, chúng tôi sẽ từ chối giả thuyết null. Ngưỡng xác suất này được gọi là mức ý nghĩa, hoặc $ \ alpha $. Nhiều nhà thống kê thường sử dụng $ \ alpha $ = 0,05.significance level, or $\alpha$. Many statisticians typically use $\alpha$ = 0.05.

Để trực quan hóa điều này bằng cách sử dụng phân phối Sababiliy, hãy nhớ rằng chúng tôi đã chọn để chứng minh rằng $ \ mu_0 30.

Chúng ta có thể tính toán khoảng này bằng cách nhân lỗi tiêu chuẩn với 1.96, đó là điểm cho độ tin cậy 95%. Điều này có nghĩa là chúng tôi tự tin 95% rằng dân số có nghĩa là ở đâu đó trong khoảng thời gian này.

In [6]:

me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118
0

Nói cách khác, nếu chúng ta lấy nhiều mẫu và khoảng tin cậy 95% được tính toán cho mỗi mẫu, 95% các khoảng sẽ chứa trung bình dân số.

Từ biểu đồ trên, chúng ta có thể thấy rằng các thanh lỗi cho các bài đăng 'trả tiền' và các bài đăng "không trả tiền 'có vùng chồng chéo. Chúng ta cũng có thể thấy rằng giá trị trung bình của' lượt thích 'trong các bài đăng có trả tiền cao hơn giá trị trung bình của mẫu' ' Thích 'trong các bài đăng chưa trả tiền. Chúng tôi cần xác định xem dữ liệu chúng tôi có có ý nghĩa thống kê và đảm bảo rằng kết quả của chúng tôi không xảy ra hoàn toàn do tình cờ.

Giả thuyết khống sẽ đề xuất rằng việc trả tiền cho quảng cáo không làm tăng số lượng lượt thích.

$$ h_0: \ mu_0 = \ text {139 lượt thích} $$

Giả thuyết thay thế sẽ đề xuất rằng việc trả tiền cho quảng cáo sẽ làm tăng số lượng lượt thích.

$$ h_a: \ mu_1> \ text {139 lượt thích} $$

In [7]:

me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118
1

me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118
2

In [8]:

me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118
3

me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118
4

Chúng ta có thể đi đến một quyết định bằng cách sử dụng bài kiểm tra t của Welch phải. Lần này, chúng tôi sẽ tính toán giá trị p trong việc sử dụng các công thức trong phần trước thay vì mô-đun SCIPY.

Sử dụng Table T ở đây. Chúng tôi chỉ cần điểm T là 1,658 và mức độ tự do ít nhất 120 để có được giá trị p là 0,05.

In [9]:

me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118
5

Out[9]:

me = qt[.975, 17.9]*sqrt[var[ts1]/10+var[ts2]/10]; me
[1] 1.146912
pm=c[-1,1]
-1 + pm*me
[1] -2.1469118  0.1469118
6

Tiếp theo, chúng tôi sẽ sử dụng SCIPY một lần nữa để xác định giá trị p chính xác.

Từ bài kiểm tra t của tiếng Welch, chúng tôi đã kết thúc với giá trị P hai đuôi là ~ 0,07, hoặc ~ 0,035 cho bài kiểm tra một đuôi. Chúng tôi sẽ từ chối giả thuyết null và chấp nhận rằng quảng cáo trên Facebook có tác động tích cực đến số "lượt thích" trên một bài đăng.

  1. Ghi chú:
  2. Giá trị p không cho chúng ta xác suất giả thuyết null là sai. Chúng tôi cũng không biết xác suất của giả thuyết thay thế là đúng.
  3. Giá trị p không chỉ ra mức độ của hiệu ứng quan sát được, chúng ta chỉ có thể kết luận rằng các hiệu ứng là dương.
  4. Giá trị p 0,05 chỉ là một quy ước để xác định ý nghĩa thống kê.

Làm thế nào để bạn làm một người xứ Wales t

Để tiến hành thử nghiệm t của Welch, người ta cần sử dụng phương thức StatS.TTest_ind [] trong khi chuyển giao sai trong đối số của Bình đẳng Giá trị p là có ý nghĩa, do đó người ta có thể bác bỏ giả thuyết null để hỗ trợ cho sự thay thế.use the stats. ttest_ind[] method while passing “False” in the “equal_var=” argument. The p-value is significant, therefore one can reject the null hypothesis in support of the alternative.

Làm thế nào để bạn tìm thấy khoảng tin cậy trong Python?

Tạo một mẫu mới dựa trên bộ dữ liệu của chúng tôi, với sự thay thế và với cùng một số điểm.Tính giá trị trung bình và lưu trữ nó trong một mảng hoặc danh sách.Lặp lại quá trình nhiều lần [ví dụ: 1000] trong danh sách các giá trị trung bình, tính toán phần trăm 2,5 và 97,5 phần trăm [nếu bạn muốn khoảng tin cậy 95%]

P là gì

Nếu giá trị tuyệt đối của thống kê t [| t |] lớn hơn giá trị tới hạn, thì sự khác biệt là đáng kể.Nếu không thì không.Mức độ ý nghĩa hoặc [giá trị p] tương ứng với rủi ro được biểu thị bằng bảng T cho tính toán | t |giá trị.corresponds to the risk indicated by the t table for the calculated |t| value.

Sự khác biệt giữa sinh viên t là gì

Sự khác biệt quan trọng nhất giữa bài kiểm tra t của sinh viên và bài kiểm tra của Welch, và thực sự lý do chính khiến bài kiểm tra của Welch được phát triển, là khi cả phương sai và kích thước mẫu khác nhau giữa các nhóm, giá trị t, mức độ tự do vàGiá trị p Tất cả đều khác nhau giữa bài kiểm tra t của sinh viên và bài kiểm tra t của Welch.both the variances and the sample sizes differ between groups, the t-value, degrees of freedom, and p-value all differ between Student's t-test and Welch's t-test.

Bài Viết Liên Quan

Chủ Đề