Bài tập lớn xác suất thống kê nhóm 6 năm 2024

  • 1. dẫn môn Lý thuyết Xác suất và Thống kê 1 CHƯƠNG 1: XÁC SUẤT VÀ CÔNG THỨC TÍNH XÁC SUẤT 1.1 ÔN TẬP VỀ GIẢI TÍCH TỔ HỢP 1.1.1 Một số khái niệm và công thức tính Hoán vị Tổ hợp Chỉnh hợp Chỉnh hợp lặp Số cách sắp xếp ngẫu nhiên n phần tử Số cách chọn ngẫu nhiên k phần tử từ n phần tử (k n) sao cho k phần tử đó không lặp và không có phân biệt thứ tự. Số cách chọn ngẫu nhiên k phần tử từ n phần tử (k n) sao cho k phần tử đó không lặp và có phân biệt thứ tự. Số cách chọn ngẫu nhiên k phần tử từ n phần tử sao cho k phần tử đó có thể lặp lại và có phân biệt thứ tự. n P n!  )! ( ! ! k n k n C k n   )! ( ! k n n Ak n   k k n n B  Ví dụ 1.1: 1. Cho tập hợp   A 1,2,3,4,5  , từ tập hợp A có thể thành lập được bao nhiêu số tự nhiên thoả mãn: a. Có 5 chữ số khác nhau. b. Có 3 chữ số khác nhau. c. Có 3 chữ số. 2. Một tổ có 5 học sinh, có bao nhiêu cách phân công 3 học sinh đi lao động. Giải 1.a 5 P 5! 120   số 1.b   60 ! 3 5 ! 5 3 5    A số 1.c 3 3 5 B 5 125   2.   3 5 5! C 10 3! 5 3 !    số 1.1.2 Quí tắc cộng: Giả sử một công việc có k trường hợp thực hiện khác nhau đều thỏa yêu cầu. Trường hợp 1 có n1 cách thực hiện, trường hợp 2 có n2 cách thực hiện,..., trường hợp k có nk cách thực hiện. Khi đó, số cách thực hiện công việc là: 1 2 k n n n     Ví dụ 1.2: Một nhóm có 3 nam và 2 nữ, có bao nhiêu cách chọn ra 3 người sao cho có ít nhất là 2 nam. Giải: Trường hợp 1: 3 người chọn ra có 2 nam và 1 nữ: 2 1 3 2 C C 3 2 6    cách Trường hợp 2: 3 người chọn ra có 3 nam 3 3 C 1  cách Vậy số cách chọn ra 3 người sao cho có ít nhất là 2 nam là: 6 + 1 = 7 cách 1.1.3 Quy tắc nhân: Giả sử một công việc phải trải qua k giai đoạn. Giai đoạn thứ nhất có n1 cách thực hiện; giai đoạn thứ hai có n2 cách thực hiện;...; giai đoạn thứ k có nk cách thực hiện. Khi đó, số cách thực hiện công việc là: 1 2 k n n n     Ví dụ 1.3: Có 12 quyển sách gồm 5 quyển sách Toán, 4 quyển sách Lý, 3 quyển sách Hóa. Hỏi có bao nhiêu cách để lấy ra mỗi loại 2 quyển sách? Giải: Số cách lấy ra 2 quyển sách toán:   2 5 5! C 10 2! 5 2 !    cách.
  • 2. dẫn môn Lý thuyết Xác suất và Thống kê 2 Số cách lấy ra 2 quyển sách lý:   2 4 4! C 6 2! 4 2 !    cách Số cách lấy ra 2 quyển sách hóa:   2 3 3! C 3 2! 3 2 !    cách Vậy số cách lấy: n 10 6 3 180     cách Ví dụ 1.4: Có 3 cách đi từ địa điểm A đến địa điểm B, có 5 cách đi từ địa điểm B đến địa điểm C và có 2 cách đi từ địa điểm C đến địa điểm D. Hỏi có bao nhiêu cách đi từ địa điểm A đến địa điểm D? Giải: Số cách đi từ thành phố A đến thành phố D là : n 3 5 2 30     cách 1.2 PHÉP THỬ VÀ BIẾN CỐ 1.2.1 Khái niệm Phép thử: Thực hiện một nhóm điều kiện xác định lên đối tượng để quan sát một hiện tượng nào đó. Phép thử ngẫu nhiên: Là những phép thử thỏa mãn hai tính chất - Không biết trước kết quả nào sẽ xảy ra. - Có thể xác định tất cả các kết quả có thể xảy ra. Biến cố: Là kết quả có thể xảy ra trong một phép thử. Ví dụ 1.5: Các phép thử ngẫu nhiên: tung một đồng xu, tung một con súc sắc, rút một cây bài trong bộ bài 52 lá. 1.2.2 Phân loại biến cố và mối quan hệ giữa các biến cố: Biến cố chắc chắn: Là biến cố chắc chắn xảy ra trong một phép thử. Kí hiệu: W Ví dụ 1.6: Tung một con súc sắc. Gọi A là biến cố súc sắc xuất hiện mặt có số chấm nhỏ hơn hoặc bằng 6. Khi đó ta nói A là biến cố chắc chắn, A = W. Biến cố không thể: Là biến cố không thể xảy ra trong một phép thử. Kí hiệu:  Ví dụ 1.7: Tung một con súc sắc. Gọi B là biến cố súc sắc xuất hiện mặt 7 chấm. Khi đó ta nói A là biến cố không thể, A = . Biến cố ngẫu nhiên: Là biến cố có thể xảy ra cũng không thể xảy ra trong một phép thử. Kí hiệu: A, B, C,... 1 2 A ,A  Ví dụ 1.8: Một xạ thủ bắn vào một tấm bia, gọi A là biến cố xạ thủ bắn trúng bia, A là biến cố ngẫu nhiên. A B C 1 2 3 D 3 4 5 2 1 2 1
  • 3. dẫn môn Lý thuyết Xác suất và Thống kê 3 Biến cố thuận lợi (Biến cố kéo theo): Biến cố A được gọi là thuận lợi cho biến cố B nếu A xảy ra thì B cũng xảy ra. Kí hiệu: A B. Ví dụ 1.9: Tung ngẫu nhiên một con súc sắc. Gọi A là biến cố súc sắc xuất hiện mặt 2 chấm và B là biến cố xuất hiện mặt chẵn. Khi đó ta nói A B. Biến cố tương đương: Nếu A B và B A thì A và B là hai biến cố tương đương. Kí hiệu: A = B. Ví dụ 1.10: Tung ngẫu nhiên đồng thời ba con súc sắc. Gọi A là biến cố mỗi con súc sắc đều xuất hiện mặt 1 chấm, B là biến cố tổng số chấm của ba con súc sắc là 3 chấm. Khi đó A=B. Biến cố sơ cấp: Biến cố A được gọi là biến cố sơ cấp nếu nó không có biến cố nào thuận lợi cho nó (trừ chính nó), tức là không thể phân tích được nữa. Tập hợp tất cả các biến cố sơ cấp của một phép thử được gọi là không gian các biến cố sơ cấp và kí hiệu: W Ví dụ 1.11: Tung ngẫu nhiên một con súc sắc. Gọi Ai là biến cố súc sắc xuất hiện mặt i chấm (i=1, .., 6) thì A1, A2, .. , A6 là các biến cố sơ cấp. Gọi B là biến cố thu được mặt có số chấm chẵn.  B = A2 A4 A6  B không phải là biến cố sơ cấp. và W = {A1, A2, A3, A4, A5, A6}. Biến cố hiệu: Hiệu của hai biến cố A và B là một biến cố xảy ra khi và chỉ khi A xảy ra nhưng B không xảy ra. Kí hiệu AB Ví dụ 1.12: Tung một con súc sắc. Gọi A là biến cố súc sắc xuất hiện mặt có số chấm lẻ. B là biến cố súc sắc xuất hiện mặt có số chấm lẻ nhỏ hơn 5. C là biến cố súc sắc xuất hiện mặt 5 chấm. Ta có: C = AB Biến cố tổng: Tổng của hai biến cố A và B là một biến cố xảy ra khi và chỉ khi ít nhất một trong hai biến cố A và B xảy ra. Kí hiệu A B Ví dụ 1.13: Hai xạ thủ cùng bắn vào một con thú. Gọi A là biến cố xạ thủ thứ nhất bắn trúng, B là biến cố xạ thủ thứ hai bắn trúng. Khi đó biến cố thú bị trúng đạn là C = A B Tổng quát: Tổng của n biến cố A1, A2, .., An là một biến cố xảy ra  ít nhất một trong các biến cố Ai xảy ra (i = 1,..,n). Kí hiệu: A1 A2 ...  An Chú ý: Biến cố chắc chắn W là tổng của mọi biến cố sơ cấp có thể, nghĩa là mọi biến cố sơ cấp đều thuận lợi cho W. Do đó, W còn được gọi là không gian các biến cố sơ cấp. Biến cố tích: Tích của hai biến cố A và B là một biến cố xảy ra  cả hai biến cố A và B đồng thời xảy ra. Kí hiệu: AB Ví dụ 1.14: Hai xạ thủ cùng bắn vào một con thú. Gọi A là biến cố xạ thủ thứ nhất bắn không trúng, B là biến cố xạ thủ thứ hai bắn không trúng. Khi đó biến cố thú không bị trúng đạn là C = AB.
  • 4. dẫn môn Lý thuyết Xác suất và Thống kê 4 Tổng quát: Tích của n biến cố A1, A2, .., An là một biến cố xảy ra  tất cả các biến cố Ai đều xảy ra. Kí hiệu: A1A2 ...  An Biến cố xung khắc: Hai biến cố A và B được gọi là xung khắc nếu chúng không đồng thời xảy ra trong một phép thử. Ví dụ 1.15: Tung một con súc sắc, gọi A là biến cố súc sắc xuất hiện mặt chẵn, B là biến cố súc sắc xuất hiện mặt 3 chấm  A, B xung khắc. Hệ biến cố đầy đủ, xung khắc từng đôi: Hệ biến cố {A1, A2, …, An } được gọi là hệ biến cố đầy đủ, xung khắc từng đôi nếu hai biến cố bất kỳ trong hệ là xung khắc và tổng tất cả các biến cố là biến cố chắc chắn, tức là: Ai Aj=  i, j  và n i i 1 A   = W. Biến cố đối lập: Biến cố A được gọi là biến cố đối lập của A. A và A đối lập  A A A A W           Ví dụ 1.16: Tung ngẫu nhiên một con súc sắc, A là biến cố súc sắc xuất hiện mặt chẵn, A là biến cố súc sắc xuất hiện mặt lẻ. Chú ý: Hai biến cố đối lập thì xung khắc nhưng ngược lại hai biến cố xung khắc thì chưa chắc đối lập. Biến cố đồng khả năng: Các biến cố A, B, C,... được gọi là đồng khả năng nếu chúng có cùng một khả năng xuất hiện như nhau trong một phép thử. Ví dụ 1.17: Tung ngẫu nhiên một đồng xu, gọi S là biến cố đồng xu xuất hiện mặt sấp, N là biến cố xuất hiện mặt ngửa  S, N là hai biến cố đồng khả năng. Biến cố độc lập: Hai biến cố A và B được gọi là độc lập nếu việc xảy ra hay không xảy ra biến cố này không làm ảnh hưởng đến việc xảy ra hay không xảy ra biến cố kia và ngược lại. Hệ biến cố độc lập toàn phần: Hệ biến cố {A1, A2,…, An } được gọi là độc lập toàn phần nếu mỗi biến cố trong hệ độc lập với tích của một tổ hợp bất kỳ các biến cố còn lại. Nhận xét: Các khái niệm về biến cố tổng, hiệu, tích, đối lập tương ứng với hợp, giao, hiệu, phần bù của lý thuyết tập hợp, do đó có thể sử dụng các phép toán trên tập hợp cho các phép toán trên biến cố. 1.3 ĐỊNH NGHĨA XÁC SUẤT 1.3.1 Định nghĩa xác suất theo lối cổ điển Giả sử một phép thử có n biến cố sơ cấp đồng khả năng có thể xảy ra, trong đó có m biến cố sơ cấp thuận lợi cho biến cố A. Khi đó xác suất của biến cố A được định nghĩa bởi công thức sau: P(A) = n m Ví dụ 1.19: Tung ngẫu nhiên một con súc sắc. Tính xác suất để súc sắc xuất hiện ở mặt trên là chẵn.
  • 5. dẫn môn Lý thuyết Xác suất và Thống kê 5 Giải: Gọi Ai là biến cố xuất hiện mặt trên là i chấm. Gọi A là biến cố xuất hiện mặt trên là chẵn, ta có A = A2  A4 A6 Khi tung con súc sắc có 6 biến cố đồng khả năng có thể xảy ra trong đó có 3 biến cố thuận lợi cho A nên P(A) = n m = 6 3 = 0.5 Ví dụ 1.20: Tung ngẫu nhiên đồng thời 2 con súc sắc. Tính xác suất để tổng số chấm xuất hiện ở hai mặt trên của 2 con súc sắc là 7. Giải : Gọi A là biến cố tổng số chấm xuất hiện ở hai mặt trên của 2 con súc sắc là 7. i A là biến cố súc sắc thứ nhất xuất hiện mặt trên là i chấm ) 6 , 1 (  i . i B là biến cố súc sắc thứ hai xuất hiện mặt trên là i chấm ) 6 , 1 (  i . Khi ta tung 2 con súc sắc cùng lúc thì có 36 biến cố sơ cấp đồng khả năng có thể xảy ra, cụ thể:   ) , ( ); , ( ); , ( ) , ( ); , ( ); , ( ) , ( ); , ( ); , ( 6 6 2 6 1 6 6 2 2 2 1 2 6 1 2 1 1 1 B A B A B A B A B A B A B A B A B A W ...; ... ... ... ... ...; ...;  Và có 6 biến cố thuận lợi cho biến cố A: ) , ( ); , ( ); , ( ); , ( ); , ( ); , ( 1 6 2 5 3 4 4 3 5 2 6 1 B A B A B A B A B A B A 6 1 36 6 ) (    A P Ví dụ 1.21: Một người gọi điện thoại nhưng lại quên hai số cuối của số điện thoại, chỉ biết rằng hai số đó là khác nhau. Tính xác suất để người đó chỉ bấm số một lần đúng số cần gọi. Giải: Gọi B là biến cố người đó chỉ quay một lần đúng số cần gọi. Số biến cố thuận lợi cho B là: m = 1 Số biến cố đồng khả năng có thể xảy ra là: 2 10 n A 90    P(A) = 90 1 Ví dụ 1.22: Một hộp gồm 6 bi trắng và 4 bi đen, lấy ngẫu nhiên 2 bi từ hộp. Tính xác suất để a) Có 1 bi trắng. b) Có 2 bi trắng. Giải: Gọi A là biến cố có 1 bi trắng trong 2 bi lấy ra. Gọi B là biến cố có 2 bi trắng trong 2 bi lấy ra. P(A) = n m = 1 1 6 4 2 10 C C C = 15 8 P(B) = n m = 2 6 2 10 C C = 3 1
  • 6. dẫn môn Lý thuyết Xác suất và Thống kê 6 Ví dụ 2.23: Trong một hộp đựng 20 quả cầu trong đó có 14 quả cầu đỏ và 06 quả cầu trắng. Lấy ngẫu nhiên (không hoàn lại) 5 quả cầu từ trong hộp. Tính xác suất để trong 5 quả cầu lấy ra có 3 quả cầu đỏ. Biết rằng các quả cầu là cân đối và giống nhau. Giải: Gọi A là biến cố trong 5 quả cầu lấy ra có 3 quả cầu đỏ và 2 quả cầu trắng. Số cách lấy 3 quả cầu đỏ: 3 14 C Số cách lấy 2 quả cầu trắng: 2 6 C  2 3 6 14 5 20 C C m P(A) n C   Tổng quát: Cho một hộp đựng N quả cầu cân đối và giống nhau trong đó có M quả cầu đỏ (M< N) và (N – M) quả cầu trắng. Lấy ngẫu nhiên (không hoàn lại) n quả cầu (n  N) từ trong hộp. Tính xác suất để trong n quả cầu lấy ra có k (k  n) quả cầu đỏ. Gọi A là biến cố trong n quả cầu lấy ra có k quả cầu đỏ  k n k M N M n N C C P(A) C    Nhận xét: Khi tính xác suất của các biến cố, ta không cần phải chỉ ra các biến cố sơ cấp có thể xảy ra và các biến cố sơ cấp thuận lợi mà chỉ cần chỉ ra số các biến cố sơ cấp có thể xảy ra, số các biến cố sơ cấp thuận lợi cho các biến cố đó. Định nghĩa xác suất theo lối cổ điển có hạn chế là: Chỉ xét cho hệ hữu hạn các biến cố sơ cấp, không phải lúc nào cũng phân tích được thành các biến cố đồng khả năng. 1.3.2 Định nghĩa xác suất theo lối thống kê: Giả sử thực hiện 1 phép thử nào đó n lần độc lập (kết quả của phép thử sau không phụ thuộc vào kết quả của phép thử trước), trong đó biến cố A xảy ra m lần. Khi đó: m gọi là tần số xuất hiện của biến cố A. f = n m gọi là tần xuất của biến cố A. Khi n  , tần xuất f đạt giá trị ổn định và giá trị đó được xem là xác suất của biến cố A. Ta có: n m f A P n n lim lim ) (       Ví dụ 1.24: Thống kê kết quả xổ số kiến thiết cửa một Tỉnh từ 01/01/2006 đến 21/01/2010 với tổng số lần quay 12715, kết quả như sau Số bóng Số lần Tỷ lệ 0 1266 9.96% 1 1305 10.26% 2 1224 9.63% 3 1276 10.04% 4 1251 9.84%
  • 7. dẫn môn Lý thuyết Xác suất và Thống kê 7 5 1289 10.14% 6 1262 9.93% 7 1298 10.21% 8 1253 9.85% 9 1291 10.15% Tổng 12715 100% Theo công thức xác suất cổ điển, xác suất để mỗi quả bóng rơi xuống lòng cầu trong một lần quay lòng cầu là 10%. Bảng thống kê trên cho thấy tỷ lệ xuất hiện của mỗi quả bóng cũng giao động quanh 10%. Ví dụ 1.25: Tiến hành sản xuất thử trên một hệ thống máy thu được kết quả như sau: Số sản phẩm n 100 150 200 250 300 … Số sản phẩm khuyết tật m 14 12 22 24 32 … Tần xuất f 0.14 0.08 0.11 0.096 0.106 … Sản xuất một sản phẩm là thực hiện một phép thử. Chúng ta quan tâm tỷ lệ sản phẩm khuyết tật. Như vậy số sản phẩm sản xuất ra n là số phép thử độc lập, số sản phẩm khuyết tật thu được m. Kết quả trên cho thấy khi n tăng dần, tần xuất f thay đổi và đạt tới giá trị ổn định là 0,1. Có thể cho rằng, xác suất của biến cố 1 sản phẩm sản xuất bị khuyết tật hay tỷ lệ sản phẩm khuyết tật của hệ thống là 0.1. 1.3.3 Định nghĩa xác suất theo hình học Xét một phép thử có không gian các biến cố sơ cấp là miền hình học W (đoạn thẳng, hình phẳng, khối không gian,…) có số đo (độ dài, diện tích, thể tích,…) hữu hạn, khác không. Giả sử một chất điểm rơi ngẫu nhiên vào miền W, xét miền con A của W. Khi đó xác suất để chất điểm rơi vào miền A là: Số đo miền A P(A) = Số đo miền W Ví dụ 1.26: Ném chất điểm vào trong hình vuông có cạnh dài 2R. Tính xác suất để chất điểm đó rơi vào hình tròn nội tiếp hình vuông. Giải: Gọi A là biến cố chất điểm rơi vào hình tròn nội tiếp hình vuông . Trường hợp có thể của phép thử được biểu diễn bằng hình vuông ABCD. Trường hợp thuận lợi của biến cố A được biểu diễn bằng hình tròn (O,3). Suy ra: 4 4 ) ( 2 2 ) ( ) , ( ) ( ) , (       R R S S S S A P ABCD R O ABCD R O Ví dụ 1.27: (Bài toán hai người gặp nhau) Hai người hẹn gặp nhau ở một địa điểm xác định vào khoảng từ 7 giờ đến 8 giờ. Mỗi người đến (chắc chắn sẽ đến) điểm hẹn trong khoảng thời gian trên một cách độc lập với A 2R D C B A . O Chất điểm
  • 8. dẫn môn Lý thuyết Xác suất và Thống kê 8 nhau, chờ trong 20 phút, nếu không thấy người kia sẽ bỏ đi. Tìm xác suất để hai người gặp nhau. Giải: Gọi A là biến cố 2 người gặp nhau trong cuộc hẹn.; x, y lần lượt là thời gian đến điểm hẹn của người thứ 1 và người thứ 2. Biểu diễn x, y lên hệ trục tọa độ Descartes. Chọn gốc tọạ độ là lúc 7h . Trường hợp có thể của phép thử:     1 , 0 : ,    y x y x W được biểu diễn bằng hình vuông OABC. Ta có:                3 1 3 1 3 1 y x y x y x             3 1 3 1 x y x y Trường hợp thuận lợi cho biến cố A được biểu diễn bằng đa giác OMNBPQ. Suy ra xác suất của A là: ABC AMN OABC OMNBPQ S S S S A P      . 2 1 ) ( ) ( ) ( 9 5 1 3 2 3 2 2 1 . 2 1    Nhận xét: Định nghĩa xác suất theo hình học được xem như là sự mở rộng của định nghĩa xác suất theo lối cổ điển trong trường hợp số khả năng có thể xảy ra là vô hạn. 1.3.4 Các tính chất của xác suất: i) 1 ) ( 0 :     A P W A ii) ) ( 1 ) ( A P A P   iii) P() = 0, với  là biến cố rỗng. iv) P(W) = 1, với W là biến cố chắc chắn. v) Nếu A B thì P(A)  P(B). 1.4 MỘT SỐ CÔNG THỨC TÍNH XÁC SUẤT 1.4.1 Công thức cộng  A và B là hai biến cố bất kỳ: P(AB) = P(A) + P(B) – P(AB)  A1, A2 và A3 là ba biến cố bất kỳ: P(A1 A2 A3)=P(A1)+P(A2)+P(A3)–P(A1 A2)–P(A1 A3)–P(A2 A3)+P(A1 A2 A3)  Xét hệ các biến cố {A1, A2, …, An }: n i i 1 P A         =  n i i A P 1 ) ( - n i j i j P(A A )    + n i j k i j k P(A A A )        n 1 1 2 n ( 1) P A A A          Đặc biệt: i) Nếu {A1, A2 , …, An }là hệ biến cố xung khắc từng đôi thì: W O 7h 1/3 8h x(I) 1/3 8h y (II) A 1 1 M A B P N Q
  • 9. dẫn môn Lý thuyết Xác suất và Thống kê 9 n i i 1 P A         =   n i i A P 1 ) ( ii) Nếu {A1, A2 ,…, An }là hệ biến cố đầy đủ, xung khắc từng đôi thì n i i 1 P(A ) 1    Ví dụ 1.28: Một lô hàng có 10 sản phẩm, trong đó có 2 phế phẩm. Lấy ngẫu nhiên không hoàn lại từ lô hàng ra 6 sản phẩm. Tìm xác suất để có không quá 1 phế phẩm trong 6 sản phẩm được lấy ra. Giải: Gọi A là biến cố không có phế phẩm trong 6 sản phẩm lấy ra B là biến cố có đúng một phế phẩm. C là biến cố có không quá một phế phẩm. Khi đó A và B là hai biến cố xung khắc và C = AB Ta có 15 2 210 28 ) ( 6 10 6 8    C C A P 15 8 210 112 . ) ( 6 10 5 8 1 2    C C C B P 3 2 15 8 15 2 ) ( ) ( ) (      B P A P C P Ví dụ 1.29: Một lớp có 100 sinh viên, trong đó có 40 sinh viên giỏi ngoại ngữ, 30 sinh viên giỏi tin học, 20 sinh viên giỏi cả ngoại ngữ lẫn tin học. Sinh viên nào giỏi ít nhất một trong hai môn sẽ được thêm điểm trong kết quả học tập của học kỳ. Chọn ngẫu nhiên một sinh viên trong lớp. Tìm xác suất để sinh viên đó được thêm điểm. Giải: Gọi A là biến cố gọi được sinh viên được tăng điểm. B là biến cố gọi được sinh viên giỏi ngoại ngữ. C là biến cố gọi được sinh viên giỏi tin học. Khi đó A = BC, với B và C là hai biến cố không xung khắc Ta có: P(A) = P(BC) = P(B) + P(C) – P(BC) 100 50 100 20 100 40 100 30     Ví dụ 1.30: Chọn ngẫu nhiên 6 cây bài từ bộ bài có 52 cây bài. Tính xác suất để ít nhất có 2 cây 9 nút. Giải: Gọi A là biến cố chọn ít nhất 2 cây 9 nút từ 6 cây bài chọn ra. i A là biến cố chọn được i cây 9 nút từ 6 cây bài chọn ra ) 4 , 0 (  i . Suy ra: 2 3 4 A A A A    Ta có: Hệ các biến cố } , , { 4 3 2 A A A xung khắc từng đôi, nên: 2 3 4 2 3 4 P(A) P(A A A ) P(A ) P(A ) P(A )      
  • 10. dẫn môn Lý thuyết Xác suất và Thống kê 10 2 4 3 3 4 2 4 48 4 48 4 48 6 6 6 52 52 52 C C C C C C 0.06 C C C     1.4.2 Công thức nhân xác suất Xác suất có điều kiện, ký hiệu P(AB): Là xác suất của biến cố A với điều kiện biến cố B đã xãy ra. Ví dụ 1.31: Hộp có 10 viên bi trong đó có 4 viên màu đỏ, 6 viên màu trắng. Lần lượt rút không hoàn lại 2 viên bi. Giả sử lần thứ nhất rút được bi màu đỏ, tính xác suất để lần thứ hai rút được bi màu đỏ. Giải: Gọi i A là biến cố rút được bi màu đỏ lần thứ i. Ta có: P( 2 A 1 A ) = 9 3 Công thức nhân xác suất:  A và B là hai biến cố bất kỳ: P(AB) = P(A)P(BA) = P(B)P(AB)  Xét hệ các biến cố {A1, A2, …, An }: n i i 1 P A         = P(A1)P(A2A1) P(A3A1 A2) ... n 1 n i i 1 P A A          Đặc biệt:  Nếu A và B độc lập thì P(A∩B) = P(A) P(B)  Nếu hệ các biến cố {A1, A2, …, An }độc lập toàn phần thì n i i 1 P A         =   n i i 1 P A   Ví dụ 1.32: Tung ngẫu nhiên đồng thời hai con súc sắc. Tính xác suất để cả 2 con súc sắc đều xuất hiện mặt 6 chấm. Giải: Gọi A là biến cố cả hai súc sắc đều xuất hiện mặt 6 chấm. i A là biến cố súc sắc thứ i xuất hiện mặt 6 chấm (i = 1, 2) Ta có: A= 1 2 A A  Do 1 A và 2 A độc lập, nên: 1 2 1 2 P(A) P(A A ) P(A )P(A )     1 1 1 6 6 36   Ví dụ 1.33: Thi 2 môn, xác suất đậu môn thứ nhất là 0.6. Nếu môn thứ nhất đậu thì khả năng sinh viên đó đậu môn thứ hai là 0.8. Nếu môn thứ nhất không đậu thì khả năng sinh viên đó đậu môn thứ 2 chỉ là 0.6. Tính xác suất trong các trường hợp sau: a) Sinh viên đó đậu chỉ một môn. b) Sinh viên đó đậu 2 môn. Giải: a. Gọi A là biến cố sinh viên đó đậu chỉ một môn. i A là biến cố sinh viên đó đậu môn thứ i (i =1, 2).
  • 11. dẫn môn Lý thuyết Xác suất và Thống kê 11 Ta có:     1 2 1 2 A A A A A     Suy ra: 1 2 1 2 1 2 1 2 P(A) P(A A A A ) P(A A ) P(A A )         1 2 1 1 2 1 P(A )P(A A ) P(A )P(A A )   = 0.60.2 + 0.40.6 = 0.36 b. Gọi B là biến cố sinh viên đậu hai môn. Ta có: 1 2 1 2 1 B A A P(A )P(A A ) 0.6 0.8 0.48       Ví dụ 1.34: Hai xạ thủ mỗi người bắn một phát đạn vào bia. Xác suất bắn trúng của người thứ nhất là p = 0.9; của người thứ hai là p = 0.7. Giả sử hai người bắn độc lập với nhau, tính xác suất để: a) Cả hai đều bắn trúng. b) Có đúng một viên đạn trúng bia. c) Bia bị trúng đạn. Giải : Gọi A là biến cố xạ thủ I bắn trúng bia. B là biến cố xạ thủ II bắn trúng bia. C là biến cố cả hai xạ thủ trúng bia. D là biến cố có một viên đạn trúng bia. E là biến cố bia bị trúng đạn. a) Xác suất để cả hai đều bắn trúng: Ta có C = AB P(C) = P(AB) = P(A) P(B) = 0.90.7 = 0.63 b) Xác suất để có một viên đạn trúng bia: Ta có:     D A B A B     . Vì A B  và A B  là xung khắc với nhau  P(D) P(A B) P(A B) P(A)P(B) P(A)P(B)         0.1 0.7 0.9 0.3 0.34 P D       c.) Xác suất để bia bị trúng đạn: Ta có: E A B    P(E) P(A B) P(A)P(B)    0.3 0.1 0.03    P(E) = 1 – 0.03 = 0.97 1.4.3 Công thức xác suất đầy đủ và công thức Bayes Giả sử {A1, A2,. . ,An } là hệ biến cố đầy đủ, xung khắc từng đôi và B là biến cố bất kỳ có thể xảy ra đồng thời với một trong các biến cố Ai (i= 1, .. , n). Khi đó xác suất B được tính bởi công thức: n i i i 1 P(B) P(A )P(B / A )    (công thức đầy đủ) và k k k k k n i i i 1 P(A )P(B / A ) P(A )P(B / A ) P(A / B) P(B) P(A )P(B / A )     (công thức Bayes)
  • 12. dẫn môn Lý thuyết Xác suất và Thống kê 12 Chú ý: Vận dụng công thức xác suất đầy đủ và công thức Bayes để giải một bài toán, vấn đề quan trọng là phải chỉ ra được nhóm biến cố đầy đủ và xung khắc từng đôi. Trong thực tế việc này thường gặp ở 2 hình thức sau:  Công việc tiến hành trải qua 2 phép thử. Thực hiện phép thử thứ nhất ta có một trong n khả năng xảy ra là các biến cố n A A A ,..., , 2 1 . Sau khi thực hiện phép thử thứ nhất ta thực hiện phép thử thứ hai. Trong phép thử thứ hai ta quan tâm đến biến cố B. Khi đó biến cố B sẽ được tính theo công thức xác suất đầy đủ với hệ biến cố đầy đủ và xung khắc từng đôi là các biến cố i A ) , 1 ( n i  .  Một tập hợp chứa n nhóm phần tử. Mỗi nhóm phần tử có một tỷ lệ phần tử có tính chất P nào đó. Lấy ngẫu nhiên từ tập hợp ra 1 phần tử. Gọi Ai là biến cố chọn được phần tử thuộc nhóm thứ i. Khi đó xác suất của biến cố chọn được phần tử có tính chất P trong phép thử sẽ được tính theo công thức xác suất đầy đủ với hệ biến cố đầy đủ và xung khắc từng đôi là i A ) , 1 ( n i  . Ví dụ 1.35: Xét một lô sản phẩm, trong đó sản phẩm của nhà máy 1 chiếm 20%, nhà máy 2 sản phẩm chiếm 30%, nhà máy 3 sản phẩm chiếm 50%. Tỷ lệ phế phẩm của nhà máy 1, 2, 3 lần lượt là 0.001; 0.005; 0.006. Lấy ngẫu nhiên 1 sản phẩm từ lô hàng a/ Tính xác suất để sản phẩm lấy ra là phế phẩm. b/ Giả sử sản phẩm lấy ra là phế phẩm, tính xác suất để sản phẩm đó là của nhà máy 1. Giải : Gọi B là biến cố lấy được sản phẩm là phế phẩm. A1, A2, A3 lần lượt là biến cố lấy được sản phẩm của nhà máy 1, 2, 3. Do {A1, A2, A3 } là hệ biến cố đầy đủ, xung khắc từng đôi nên a. Theo công thức xác suất đầy đủ, ta có: P(B) = 3 i i i 1 P(A )P(B / A )   = P(A1)P(B/A1) + P(A2)P(B/A2) + P(A3)P(B/A3) = 20 100 0.001 + 30 100 0.005 + 50 100 0.006 = 0.0047. b. Theo công thức bayes, ta có: 1 1 1 P(A )P(B / A ) P(A / B) P(B)   0.2 0.001 0.0047  =0.0426 Ví dụ 1.36: Một phân xưởng sản xuất chi tiết máy có hai máy: Máy I sản xuất 60% sản phẩm của phân xưởng; Máy II sản xuất 40% sản phẩm của phân xưởng. Tỷ lệ sản phẩm bị lỗi của máy I là 0,1 và tỷ lệ sản phẩm bị lỗi của máy II là 0,05. Sản phẩm của phân xưởng sau khi sản xuất được đem trộn lẫn với nhau. Lấy ngẫu nhiên một sản phẩm của phân xưởng thì thấy sản phẩm đó là sản phẩm bị lỗi, tính xác suất để sản phẩm đó do máy I sản xuất. Giải: Gọi B1 là biến cố sản phẩm lấy ra do máy I sản xuất. B2 là biến cố sản phẩm lấy ra do máy II sản xuất. A là biến cố sản phẩm lấy ra là sản phẩm bị lỗi.  B1, B2 lập thành hệ biến cố đầy đủ và xung khắc. Theo công thức xác suất đầy đủ: P(A) = P(B1) P(A/B1) + P(B1)P(A/B2) = 0.08.
  • 13. dẫn môn Lý thuyết Xác suất và Thống kê 13 Theo công thức Bayes: 1 1 1 ( ) ( / ) 0.6 0.1 ( / ) 0.75 ( ) 0.08 P B P A B P B A P A     . Vậy xác suất để sản phẩm đó do máy I sản xuất là P(B1A) = 0.75. Ví dụ 1.37: Có 3 hộp đựng sản phẩm, mỗi hộp có 10 sản phẩm, trong đó sản phẩm loại I lần lượt là 2, 3, 4. Chọn ngẫu nhiên một hộp, rồi từ hộp đã chọn, rút ra ngẫu nhiên một sản phẩm. a) Tính xác suất để sản phẩm chọn ra là sản phẩm loại I. b) Nếu sản phẩm rút ra là sản phẩm loại I, thì theo bạn sản phẩm đó có khả năng thuộc hộp nào nhiều nhất, tại sao? Giải: Gọi B là biến cố rút được sản phẩm là sản phẩm loại I. i A là biến cố chọn được hộp thứ i ( 3 , 1  i ). a. Theo công thức xác suất đầy đủ, ta có: 1 1 2 2 3 3 P(B) P(A )P(B / A ) P(A )P(B / A ) P(A )P(B / A )    1 2 1 3 1 4 3 0.3 3 10 3 10 3 10 10         b. Theo công thức Bayes, ta có: 1 1 1 1 2 P(A )P(B / A ) 2 3 10 P(A / B) 3 P(B) 9 10     2 2 2 1 3 P(A )P(B / A ) 1 3 3 10 P(A / B) 3 P(B) 3 9 10      3 3 3 1 4 P(A )P(B / A ) 4 3 10 P(A /B) 3 P(B) 9 10     So sánh các kết quả, ta thấy phế phẩm rút ra có khả năng thuộc hộp thứ III nhiều nhất. 1.4.4 Công thức Bernoulli Ta tiến hành n phép thử độc lập. Giả sử trong mỗi phép thử chỉ xảy ra hai trường hợp: Hoặc biến cố A xảy ra với xác suất p hoặc biến cố A không xảy ra với xác suất q = 1 – p. Khi đó xác suất để trong n phép thử độc lập, biến cố A xuất hiện k lần được được tính bằng công thức:     ; ; 1    n k k k n P n k p C p p (công thức Bernoulli) Ví dụ 1.38: Trong một phân xưởng có 5 máy hoạt động độc lập, xác suất để một máy bị hư trong một ca sản xuất là bằng nhau và bằng p = 0.1. Tính xác suất để trong 1 ca có hai máy bị hư.
  • 14. dẫn môn Lý thuyết Xác suất và Thống kê 14 Giải: Do 5 máy hoạt động độc lập nên ta có thể coi như tiến hành 5 phép thử độc lập và mỗi phép thử chỉ có hai kết cục máy hoạt động tốt hoặc máy bị hư với xác suất p = 0.1. Theo công thức Bernoulli, xác suất để trong 1 ca có hai máy bị hư: P(5; 2; 0.1)= 2 5 C (0.1)2 (0.9)3 Ví dụ 1.39: Một sinh viên thi trắc nghiệm môn Ngoại Ngữ gồm có 10 câu hỏi. Mỗi câu có 4 phương án lựa chọn, trong đó chỉ có 1 phương án đúng. Giả sử sinh viên làm bài bằng cách chọn ngẫu nhiên các câu hỏi. Tính xác suất để: a) Sinh viên vừa đủ điểm đậu (5 điểm). b) Sinh viên chọn đúng ít nhất 1 câu hỏi. Giải: Gọi A là biến cố sinh viên vừa đủ điểm đậu. Xem việc chọn câu trả lời ở mỗi câu hỏi của sinh viên là 1 phép thử thì trong mỗi phép thử có 1 trong 2 khả năng xảy ra :  Sinh viên trả lời đúng với xác suất là p =0.25.  Sinh viên trả lời sai với xác suất là q =0.75. a.     5 5 5 10 P(A) P(10; 5; 0.25) C 0.25 0.75 0.058    b. Gọi B là biến cố sinh viên chọn đúng ít nhất 1 câu hỏi. B  là biến cố sinh viên không chọn đúng câu hỏi nào. Ta có:         0 10 10 0 10 P(B) P 10; 0; 0.25 C 0.25 0.75 0.75      10 P(B) 1 P(B) 1 0.75 0.056       Ví dụ 3.40: Một bác sĩ có xác suất chữa khỏi bệnh là 0.8. Có người nói rằng cứ 10 người đến chữa bệnh thì chắc chắn có 8 người khỏi bệnh. Điều khẳng định đó có đúng không? Giải: Ta có thể xem việc chữa bệnh cho 10 người là một dãy của một phép thử độc lập. Nếu gọi A là biến cố chữa khỏi bệnh cho một người thì P(A) = 0.8 Do đó: Xác suất để trong 10 người đến chữa bệnh thì có 8 người khỏi bệnh là: P(10; 8; 0.8) = 8 8 2 10 C (0.8) (0.2) 0.3108    . Vậy điều khẳng định trên là sai. Định nghĩa: Một lược đồ Bernoulli mở rộng gồm:  Dãy n phép thử độc lập.  Hệ biến cố } ,..., , { 2 1 k A A A đầy đủ, xung khắc. Trong đó: k k p A P p A P p A P    ) ( ,..., ) ( , ) ( 2 2 1 1 và 1 ... 2 1     k p p p . 1.4.5 Công thức Bernoulli mở rộng Giả sử ta thực hiện n phép thử độc lập, hệ biến cố } ,..., , { 2 1 k A A A là đầy đủ, xung khắc từng đôi và k k p A P p A P p A P    ) ( ,..., ) ( , ) ( 2 2 1 1 và 1 ... 2 1     k p p p . Khi đó xác suất để trong n phép thử độc lập, biến cố 1 A xảy ra 1 m lần, biến cố 2 A xảy ra 2 m lần , …, biến cố k A xảy ra k m lần (trong đó n m m m k     ... 2 1 ) là được tính theo công thức:
  • 15. dẫn môn Lý thuyết Xác suất và Thống kê 15 k m k m m k k p p p m m m n m m m n P ... . ! !... ! ! ) ,..., , ; ( 2 1 2 1 2 1 2 1  Ví dụ 1.41: Lô hàng có 100 sản phẩm trong đó có 30 sản phẩm loại A, 50 sản phẩm loại B và 20 sản phẩm loại C. Lần lượt rút có hoàn lại 9 sản phẩm để kiểm tra. Tính xác suất để trong 9 lần rút đó có 3 lần rút được sản phẩm loại A, 4 lần rút được sản phẩm loại B và 2 lần rút được sản phẩm loại C. Giải:Gọi A, B, C lần lượt là biến cố rút được sản phẩm loại A, B, C trong mỗi lần rút. Rõ ràng hệ biến cố   C B A , , đầy đủ và xung khắc từng đôi. và 100 30 ) (  A P , 100 50 ) (  B P , 100 20 ) (  A P Do đó: 3 4 2 9! 30 50 20 P(9;3A,4B,2C) 0.086 3!4!2! 100 100 100                     BÀI TẬP CHƯƠNG 1 Bài 1: Một tổ gồm có 8 nam và 6 nữ. Tính xác suất để chọn ngẫu nhiên một nhóm 5 người sao cho: a/ Có ít nhất 1 nữ. b/ Số nữ nhiều hơn số nam. Bài 2: Ở một hội đồng nhân dân tỉnh có 20 đại biểu trong đó có 6 người nữ. Để điều hành một công việc nào đó cần thành lập một tiểu ban gồm 5 người. Tính xác suất sao cho trong tiểu ban đó có số đại biểu nam không ít hơn 3. Bài 3: Một lớp có 30 học sinh gồm: 10 học sinh giỏi toán, 10 học sinh giỏi văn, 10 học sinh giỏi ngoại ngữ. Trong đó có 5 học sinh vừa giỏi ngoại ngữ và toán, 3 học sinh vừa giỏi ngoại ngữ và văn, không có học sinh nào giỏi văn và toán hoặc giỏi cả 3 môn. Chọn ngẫu nhiên một học sinh, tính xác suất để được học sinh giỏi ít nhất 1 trong 3 môn nói trên. Bài 4: Theo thống kê trung bình một năm (365 ngày) có 60 ngày có mưa thật to, 40 ngày có gió thật lớn và 20 ngày có bão (vừa mưa thật to vừa gió thật lớn). Tính xác suất để một ngày chọn ngẫu nhiên trong năm là có thời tiết bất thường (có mưa thật to hoặc có gió thật lớn). Bài 5: Trong cơ quan có 100 người. Trong đó có 60 người gần cơ quan, 30 nữ, 40 nam gần cơ quan. Tính xác suất để gọi ngẫu nhiên một người trong danh sách a/ Người đó phải trực cơ quan (theo quy định của cơ quan thì người nào hoặc là nam hoặc gần cơ quan sẽ phải tham gia trực). b/ Người đó phải trực cơ quan với điều kiện người đó là nữ. Bài 6: Bắn liên tiếp vào một mục tiêu cho đến khi viên đạn đầu tiên trúng mục tiêu hoặc hết đạn thì ngừng. Xác suất bắn trúng mục tiêu của mỗi lần bắn là 0,6. a/ Nếu người đó có 4 viên đạn. Tính xác suất để bắn đến viên đạn thứ tư. b/ Nếu người đó có số viên đạn không hạn chế. Tính xác suất để việc bắn ngừng lại ở lần thứ tư. Bài 7: Có 3 hộp bi, mỗi hộp có 10 bi. Trong hộp thứ i có i bi đỏ, (10 – i) bi trắng (i = 1,2,3). Lấy ngẫu nhiên từ mỗi hộp ra 1 bi. Tính xác suất a/ Cả 3 bi lấy ra đều đỏ. b/ 3 bi lấy ra có 2 bi đỏ, 1 bi trắng. c/ Biết 3 bi lấy ra có 2 bi đỏ, 1 bi trắng. Tính xác suất bi lấy ra từ hộp thứ hai màu trắng.
  • 16. dẫn môn Lý thuyết Xác suất và Thống kê 16 Bài 8: Hộp I có 15 lọ thuốc tốt, 5 lọ thuốc hỏng. Hộp II có 17 lọ thuốc tốt, 3 lọ thuốc hỏng. Hộp III có 10 lọ thuốc tốt, 10 lọ thuốc hỏng. a/ Lấy ở mỗi hộp 1 lọ. Tính xác suất để có 1 lọ thuốc hỏng. b/ Chọn ngẫu nhiên 1 hộp, rồi từ hộp đã chọn lấy ra 3 lọ. Tính xác suất để được 2 lọ tốt và 1 lọ hỏng. c/ Trộn chung 3 hộp lại rồi từ đó lấy ra 3 lọ. Tính xác suất để được 3 lọ thuốc tốt. d/ Kiểm tra từng lọ ở hộp II cho đến khi phát hiện đủ 3 lọ thuốc hỏng thì dừng lại. Tính xác suất để việc kiểm tra dừng lại ở lần kiểm tra thứ 4. Bài 9: Ba khẩu súng độc lập bắn vào một mục tiêu. Xác suất để các khẩu súng bắn trúng mục tiêu lần lượt là: 0,7 ; 0,8 ; 0,5 (mỗi khẩu bắn 1 viên). Tính xác suất để: a/ Có 1 khẩu bắn trúng. b/ Có 2 khẩu bắn trúng. c/ Có ít nhất 1 khẩu bắn trúng. d/ Khẩu thứ nhất bắn trúng, biết rằng có 2 viên trúng. Bài 10: Có 2 chuồng thỏ: Chuồng thứ nhất có 5 con đực và 2 con cái; Chuồng thứ hai có 2 con đực và 4 con cái. Từ chuồng thứ nhất có 1 con thỏ chạy qua chuồng thứ hai (không rõ giới tính). Sau khi con thỏ từ chuồng thứ nhất chạy qua thì từ chuồng thứ hai ta bắt ra 1 con. Tính xác suất con thỏ bắt ra từ chuồng thứ hai là con thỏ đực. Bài 11: Một hộp đựng 3 bi đỏ và 7 bi xanh. Lấy ngẫu nhiên từ hộp ra 1 bi, nếu bi lấy ra là bi đỏ thì bỏ vào hộp 1 bi xanh, nếu bi lấy ra là bi xanh thì bỏ vào hộp 1 bi đỏ. Sau đó từ hộp ta lấy tiếp ra 1 bi. a/ Tính xác suất để bi lấy ra lần sau là bi đỏ. b/ Tìm xác suất để 2 bi lấy ra (lấy lần đầu và lấy lần sau) cùng màu. c/ Nếu 2 bi lấy ra cùng màu, tính xác suất để 2 bi này cùng màu xanh. Bài 12: Một cuộc thi có 3 vòng thi: Vòng I lấy 90% thí sinh; vòng II lấy 80% thí sinh của vòng I và vòng III lấy 90% thí sinh của vòng II. a/ Tính xác suất để thí sinh lọt qua 3 vòng thi. b/ Tính xác suất để thí sinh đó bị loại ở vòng II, nếu biết rằng thí sinh đó bị loại. Bài 13: Một chuồng gà có 9 con mái và 1 con trống. Chuồng gà kia có 1 con mái và 5 con trống. Từ mỗi chuồng ta bắt ngẫu nhiên ra 1 con đem bán. Các con gà còn lại được dồn vào một chuồng thứ ba. Nếu ta lại bắt ngẫu nhiên 1 con gà nữa từ chuồng này ra thì xác suất bắt được con gà trống là bao nhiêu? Bài 14: Một công ty bảo hiểm cho người bị tai nạn. Công ty chia khách hàng của mình ra thành 3 nhóm: Người ít bị rủi ro, người bị rủi ro trung bình và người thường xuyên bị rủi ro với tỷ lệ là: 60% , 30% và 10%. Xác suất bị rủi ro của các nhóm lần lượt là: 0,01 ; 0,05 ; 0,1. a/ Tính tỷ lệ người bị tai nạn trong năm. b/ Nếu người bị tai nạn trong năm, họ có khả năng thuộc nhóm nào nhiều nhất? Bài 15: Có 20 kiện hàng, mỗi kiện có 10 sản phẩm. Trong đó có: - 8 kiện loại I, mỗi kiện có 1 phế phẩm; - 7 kiện loại II, mỗi kiện có 3 phế phẩm; - 5 kiện loại III, mỗi kiện có 5 phế phẩm. Lấy ngẫu nhiên 1 kiện, rồi từ kiện đã chọn lấy ngẫu nhiên 1 sản phẩm a/ Tính xác suất sản phẩm lấy ra là phế phẩm. b/ Biết sản phẩm lấy ra là phế phẩm. Tính xác suất kiện lấy ra là loại II. Bài 16: Ở hội chợ có 3 cửa hàng: Cửa hàng loại I phục vụ những người “may mắn” bán hàng có tỷ lệ phế phẩm là 1%; Cửa hàng loại II phục vụ những người “bình thường”
  • 17. dẫn môn Lý thuyết Xác suất và Thống kê 17 bán hàng có tỷ lệ phế phẩm là 5%; Cửa hàng loại III phục vụ những người “rủi ro” bán hàng có tỷ lệ phế phẩm là 10%. Một người vào hội chợ phải gieo 2 đồng xu. Người đó là may mắn nếu cả 2 đồng xu đều sấp, là rủi ro nếu cả 2 đồng xu đều ngửa. Tính xác suất để 1 người vào hội chợ và mua phải hàng xấu. Bài 17: Một công ty có 30 công nhân nam và 20 công nhân nữ. Xác suất tốt nghiệp PTTH của nam là 20%, của nữ là 15%. Chọn ngẫu nhiên 1 người trong công ty a/ Tính xác suất để người này tốt nghiệp PTTH. b/ Trong điều kiện gặp được người tốt nghiệp PTTH, tính xác suất để người này là nam. Bài 18: Tỷ lệ hút thuốc ở một địa phương là 40%. Theo thống kê, tỷ lệ người mắc bệnh phổi trong số những người hút thuốc là 70%, trong số những người không hút thuốc là 5%. Chọn ngẫu nhiên 1 người ở địa phương này thì thấy người đó mắc bệnh phổi. Tính xác suất người đó có hút thuốc. Bài 19: Hai nhà máy cùng sản xuất ra một loại chi tiết. Năng suất của máy I gấp đôi máy II. Tỷ lệ chi tiết đạt tiêu chuẩn của máy I là 64%, của máy II là 80%. Lấy ngẫu nhiên 1 chi tiết từ lô hàng do 2 nhà máy sản xuất thì được chi tiết đạt tiêu chuẩn. Tính xác suất để chi tiết đó do máy I sản xuất. Bài 20: Theo kết quả điều tra, tỷ lệ bệnh lao ở một vùng là 0,1%. Tính xác suất để khi khám cho 10 người: a/ Có 5 người bệnh lao. b/ Có ít nhất 1 người bệnh lao. Bài 21: Một sinh viên thi trắc nghiệm môn ngoại ngữ gồm 20 câu hỏi. Mỗi câu có 4 phần để chọn, trong đó chỉ có 1 phần đúng. Giả sử sinh viên đó đã biết rõ 8 câu hỏi, còn lại thì chọn một cách ngẫu nhiên. a/ Tính xác suất để sinh viên đó làm đúng được toàn bài. b/ Nếu chọn đúng từ phân nữa trở đi thì sinh viên đó sẽ đậu. Tính xác suất để sinh viên đó đậu.
  • 18. dẫn môn Lý thuyết Xác suất và Thống kê 18 CHƯƠNG 2: BIẾN NGẪU NHIÊN VÀ QUI LUẬT PHÂN PHỐI XÁC SUẤT 2.1 BIẾN NGẪU NHIÊN (BNN) 2.1.1 Các định nghĩa Biến ngẫu nhiên là biến dùng để biểu thị các giá trị cho các kết quả của một phép thử ngẫu nhiên. Ta thường dùng các kí hiệu X, Y, Z,… để biểu thị cho biến ngẫu nhiên. Ví dụ 2.1:  Tung một con súc sắc, gọi X là biểu thị số chấm xuất hiện trên mặt con súc sắc. Khi đó, X là BNN.  Đo chiều cao của các thiếu niên Việt Nam ở độ tuổi 13. Gọi Y là chiều cao đo được của các sinh viên. Giả sử Y [1m ; 1.5m]. Vậy Y là BNN. Phân loại BNN: + BNN rời rạc: là BNN có một số hữu hạn hoặc vô hạn đếm được các giá trị. Các giá trị có thể của BNN X được ký hiệu x1, x2, … + BNN liên tục: là BNN mà các giá trị của nó lắp đầy một khoảng trên trục số. Trong ví dụ 2.1, X là BNN rời rạc, Y là BNN liên tục. 2.1.2 Bảng phân phối xác suất Bảng phân phối xác suất dùng để thiết lập luật phân phối xác suất của BNN rời rạc. Bảng gồm 2 dòng: Dòng trên ghi các giá trị có thể có của BNN là: x1, x2, .. , xn; dòng dưới ghi các xác suất tương ứng là: P1, P2, .. , Pn. X x1 x2 x3 . . . xn P P1 P2 P3 . . . Pn Chú ý: P(X = xi): Xác suất để BNN X nhận giá trị xi.   n i i P 1 = 1 Ví dụ 2.2: Tung 1 con súc sắc, gọi X là số chấm xuất hiện trên mặt của một con súc sắc. Khi đó bảng phân phối xác suất của X là: X 1 2 3 4 5 6 P 1 6 1 6 1 6 1 6 1 6 1 6 Ví dụ 2.3: Tiến hành thử độ bền của 3 loại vật liệu, với điều kiện vật liệu thử trước phải vượt qua được phép thử mới thử tiếp vật liệu sau. Biết rằng khả năng vượt qua phép thử của các vật liệu đều bằng 0.8. Hãy tìm luật phân phối xác suất của số vật liệu vượt qua phép thử. Giải: Gọi X là số vật liệu vượt qua phép thử. i A là biến cố vật liệu thứ i vượt qua phép thử   3 , 1  i . Ta có: P(X = 0) = P( 1 A ) = 0.2
  • 19. dẫn môn Lý thuyết Xác suất và Thống kê 19 P(X = 1) = P( 1 2 A A  ) = P( 1 A )P( 2 A ) = 0.80.2 = 0.16 P(X = 2) = P( 1 2 3 A A A   ) = P( 1 A )P( 2 A )P( 3 A ) = 0.80.80.2 = 0.128 P(X = 3) = P( 1 2 3 A A A   ) = P( 1 A )P( 2 A )P( 3 A ) = 0.80.80.8 = 0.512 Bảng phân phối xác suất của X là: X 0 1 2 3 P 0.2 0.16 0.128 0.512 Ví dụ 2.4: Hộp có 10 viên bi, trong đó có 6 viên màu đỏ, còn lại màu trắng. Rút đồng thời 4 viên bi và gọi X là số viên bi màu đỏ được rút ra. Lập luật phân phối xác suất của X. Giải: Gọi i A là biến cố rút được i viên bi màu đỏ ( 0,4) i  . Các xác suất được tính theo nguyên tắc hộp kín như sau: 0 4 6 4 0 4 10 C C 1 P(X 0) P(A ) 0.005 C 210      1 3 6 4 1 4 10 C C 24 P(X 1) P(A ) 0.114 C 210      2 2 6 4 2 4 10 C C P(X 2) P(A ) 0.429 C     3 1 6 4 3 4 10 C C P(X 3) P(A ) 0.318 C     4 0 6 4 4 4 10 C C P(X 4) P(A ) 0.071 C     Vậy ta có bảng phân phối xác suất của X là: X 0 1 2 3 4 P 0.005 0.114 0.429 0.381 0.071 2.1.3 Hàm mật độ xác suất Hàm số y = f(x) xác định trên (- , +) được gọi là hàm mật độ xác suất của BNN liên tục X nếu: i) x x f   , 0 ) ( ii)      1 ) ( dx x f  Tính chất: i) P(X = x0) = 0. ii) ) ( ) ( b X a P b X a P      ) ( b X a P    ) ( b X a P      b a dx x f ) (
  • 20. dẫn môn Lý thuyết Xác suất và Thống kê 20 iii) ) ( ) (        X P X P     dx x f ) ( iv)            dx x f X P X P ) ( ) ( ) ( v) Đặc biệt: f(x) chỉ nhận giá trị trên [a; b] thì: 1 ) (   b a dx x f Ví dụ 2.5: Cho BNN liên tục có hàm mật độ xác suất       2 c 3x x , x 0,3 f(x) 0 , x 0,3          a) Xác định hằng số c. b) Tính ) 2 1 (   X P . Giải: a. Ta có:     dx x f ). ( 1 0 3 0 3 f (x)dx f (x)dx f (x)dx         0 3 2 0 3 0dx c(3x x )dx 0dx          9 c 2  Vậy: 9 2  c b. Ta có: P (1 < X < 2)   2 1 dx f(x) =   2 1 2 dx ) x (3x 9 2  27 13 . 2.1.4 Hàm phân phối xác suất Hàm phân phối xác suất của BNN X (liên tục hoặc rời rạc), ký hiệu F(x), là hàm được xác định như sau: F(x) = P(X < x)  Nếu X là BNN rời rạc:    x x i i p x F ) (  Nếu X là BNN liên tục:    x dx x f x F ) ( ) ( (Bằng diện tích hình thang cong, cạnh trái t  -, cạnh phải t  x). Tính chất: i) x x F    , 1 ) ( 0 ii) F(x) là hàm không giảm 2 1 0 f(x) P(1 < X < 3 t x O F(x) = P( X< x) f(t)
  • 21. dẫn môn Lý thuyết Xác suất và Thống kê 21 iii) F(-) = 0 F(+) = 1 iv) P(a  X < b) = F(b) - F(a) v) Nếu X là ĐLNN rời rạc thì F(x) có dạng bậc thang vi) Nếu X là ĐLNN liên tục có hàm mật độ xác suất f(x) thì F/ (x) = f(x) Ý nghĩa: Hàm phân phối xác suất F(x) phản ánh mức độ tập trung xác suất về phía bên trái của điểm x. Ví dụ 2. 6: Cho X có bảng phân phối xác suất X 1 2 3 P 0.5 0.2 0.3 Tìm F(x) và vẽ đồ thị. Giải: Ta có: i i x x F(x) p     x 1: F(x) 0    1 x 2: F(x) 0.5     2 3: ( ) 0.5 0.2 0.7      x F x  3: ( ) 0.5 0.2 0.3 1      x F x Vậy: 0 khi x 1 0.5 khi 1 x 2 F(x) 0.7 khi 2 x 3 1 khi x 3               Ví dụ 2.7: Cho BNN X có: 0 khi x 0 x khi 0 x 1 f(x) 2 x khi 1 x 2 0 khi x 2                Tìm hàm phân phối xác suất F(x) và vẽ đồ thị của nó . Giải: Ta có: * x 0: F(x) 0    x 0 x 0 0 x 1: F(x) f (x)dx f(x)dx f (x)dx                   0 0 2 0 2 2 2 0 x x x x xdx dx  x 0 1 x 0 1 1 x 2: F(x) f (x)dx f (x)dx f(x)dx f(x)dx              0 1 x 0 1 0dx xdx (2 x)dx          1 0.5 O 0.7 1 2 3 x y Đồ thị F(x) Đồ thị hàm số có dạng bậc thang
  • 22. dẫn môn Lý thuyết Xác suất và Thống kê 22 1 2 2 2 1 2 2 2 2 1 2 2           x x x x  x 0 1 2 x 0 1 2 x 2: F(x) f (x)dx f(x)dx f (x)dx f (x)dx f (x)dx                          1 0 2 1 1 2 1 2 2 4 2 1 ) 2 ( dx x xdx Vậy: 2 2 0 khi x 0 x khi 0 x 1 2 F(x) x 2x 1 khi 1 x 2 2 1 khi x 2                   2.2 THAM SỐ ĐẶC TRƯNG CỦA BNN 2.2.1 Kỳ vọng (expectation) Định nghĩa: Giả sử X là BNN rời rạc có thể nhận các giá trị x1, x2, .. , xn với các xác suất tương ứng P1, P2, .. , Pn  Khi đó kỳ vọng của X, kí hiệu là E(X) hay M(X) được xác định bởi công thức: n i i i 1 E(X) x P     Nếu X là BNN liên tục có hàm mật độ xác suất là f(x) thì kỳ vọng của X là: E(X) x.f (x)dx     Ví dụ 2.9: Cho X là BNN rời rạc có bảng phân phối xác suất sau: X 5 6 7 8 9 10 11 P 1/12 2/12 3/12 2/12 2/12 1/12 1/12 Ta có: 7 i i i 1 1 2 3 2 2 1 1 93 E(X) x p 5 6 7 8 9 10 11 7.75 12 12 12 12 12 12 12 12                    Ví dụ 2.10: Cho X là BNN rời rạc có luật phân phối: X 0 1 3 4 7 8 P 30 1 30 3 30 12 30 8 30 4 30 2 Đồ thị 1 0.5 O 1 2 x F(x)
  • 23. dẫn môn Lý thuyết Xác suất và Thống kê 23 Ta có: 6 1 1 3 12 8 4 2 125 25 ( ) 0 1 3 4 7 8 4.17 30 30 30 30 30 30 30 6                   i i i E X x p Ví dụ 2.11: Cho BNN liên tục X có hàm mật độ xác suất:       2 3 4x x , x 0,4 32 f(x) 0 , x 0,4          Ta có: 4 2 0 3 E(X) xf(x)dx x (4x x )dx 32                   4 0 4 0 4 3 3 2 4 3 4 32 3 ) 4 ( 32 3 x x dx x x 4 4 4 4 4 2 3 3 4 4 3 4 4 3 4 4 2 32 3 4 2 4 3 4 2 4                   Tính chất: i) E(C) = C ii) E(CX) = CE(X) , với C là hằng số. iii) E(X + Y) = E(X) + E(Y) iv) Nếu X, Y là hai BNN độc lập thì: E(XY) = E(X)E(Y). Chú ý: Tính chất iii) và iv) có thể mở rộng cho nhiều biến ngẫu nhiên. Ý nghĩa: Kỳ vọng của 1 BNN chính là giá trị trung bình (theo xác suất) của BNN đó. Nó là trung tâm điểm của phân phối mà các giá trị cụ thể của X sẽ tập trung quanh đó. Ví dụ 2.12: Giả sử ta có cái bình lớn đựng 10 quả cầu giống nhau nhưng khác nhau về trọng lượng: 5 quả nặng 1 kg, 2 quả nặng 2 kg, 3 quả nặng 3 kg. Ta lấy ngẫu nhiên từ bình ra 1 quả cầu và gọi X là trọng lượng của quả cầu đó. Tính E(X) và so sánh E(X) với trọng lượng trung bình của 1 quả cầu trong hộp.  Bảng phân phối xác suất của X: X 1 2 3 P 10 5 10 2 10 3 3 i i x 1 5 2 3 18 E(X) x p 1 2 3 10 10 10 10             Gọi M là trọng lượng trung bình của các quả cầu trong bình. Ta có: 5 1 2 2 3 3 18 M 10 10        Vậy: E(X) = M 2.2.2 Phương sai: (Variance) Định nghĩa: Phương sai (độ lệch bình phương trung bình) của BNN X, kí hiệu Var(X) được xác định bởi công thức:
  • 24. dẫn môn Lý thuyết Xác suất và Thống kê 24 Var(X) = E{[X – E(X)]2 }  Nếu X là BNN rời rạc có thể nhận các giá trị là x1, x2, .., xn với các xác suất tương ứng là P1, P2, .. , Pn thì:   n 2 i i i 1 Var(X) x E(X) .P      Nếu X là BNN liên tục có hàm mật độ xác suất là f(x) thì:   2 Var(X) x E(X) f(x)dx      Chú ý: Trong thực tế ta thường tính phương sai bằng công thức: Var(X) = E(X2 ) – [E(X)]2 Ví dụ 2.13: Cho X là BNN rời rạc có bảng phân phối xác suất sau: X 1 3 5 P 0.1 0.4 0.5 Ta có: E(X) = 3.8 Var(X) = E(X2 ) – [E(X)]2 = 1.76 Ví dụ 2.14: Cho X là BNN liên tục có hàm mật độ xác suất sau:     3 cx x 0,3 f(x) 0 x 0,3         Tìm hằng số c, E(X), Var(X) Giải: Ta có: 3 3 4 3 0 0 x 81c 1 cx dx c 4 4           Dễ dàng tính được c = 4/81; E(X) = 2.4; Var(X) = 0.24  Tính chất: i) Var(C) = 0 ii) Var(CX) = C2 Var(X) iii) Nếu X, Y là 2 BNN độc lập thì: Var(X+Y) = Var(X) + Var(Y); Var(X – Y) = Var(X) + Var(Y) iv) Var(C+X) = Var(X) Ý nghĩa: Ta thấy X - E(X) là độ lệch khỏi giá trị trung bình. Do đó phương sai Var(X) = E{[X – E(X)]2 } gọi là độ lệch bình phương trung bình. Nên phương sai phản ánh mức độ phân tán các giá trị của BNN xung quanh giá trị trung bình. Như vậy, phương sai phản ánh mức độ phân tán các giá trị của BNN chung quanh kỳ vọng. BNN có phương sai càng lớn thì các giá trị càng phân tán và ngược lại.
  • 25. dẫn môn Lý thuyết Xác suất và Thống kê 25 Ứng dụng: Trong công nghiệp, phương sai biểu thị độ chính xác của sản xuất. Trong chăn nuôi, nó biểu thị độ đồng đều của các con gia súc. Trong trồng trọt, nó biểu thị mức độ ổn định của năng suất, ... Ví dụ 2.15: Giả sử X là khối lượng các gói bột giặt của phân xưởng I, Y là khối lượng các gói bột giặt của phân xưởng II. Trong đó: E(X) = E(Y) = 500g và Var(X) >Var(Y). Khi đó, các gói bột giặt của phân xưởng II có khối lượng tập trung hơn xung quanh khối lương 500g. Nói cách khác, hệ thống đóng gói của phân xưởng II hoạt động tốt hơn phân xưởng I. 2.2.3 Độ lệch tiêu chuẩn Độ lệch tiêu chuẩn của BNN X, kí hiệu (X) được xác định bởi công thức: ) ( ) ( X Var X   2.2.4 Môment Môment cấp k của BNN X là số mk = E(Xk ) Môment quy tâm cấp k của BNN X là số: k  = E{[X – E(X)]k }  Nhận xét: Môment cấp 1 của X là kỳ vọng của X Môment quy tâm cấp 2 của X là phương sai của X 2.2.5 Mode ModX là giá trị của BNN X có xác suất lớn nhất. Đối với BNN rời rạc, mod(X) là giá trị của X ứng với xác suất lớn nhất. Còn đối với BNN liên tục thì mod(X) là giá trị của X tại đó hàm mật độ đạt giá trị cực đại. Chú ý: Một BNN có thể có 1 mode hoặc nhiều mode. Ví dụ 2.16: X là BNN rời rạc có luật phân phối: X 0 1 3 4 7 8 P 30 1 30 3 30 12 30 8 30 4 30 2 Ta thấy 12 P(X 3) max 30    => mod(X) = 3. Ví dụ 2.17: Cho BNN X liên tục có hàm mật độ: 2 x 2 4 0 x 0 f(x) x e x 0 2          Hãy tìm mod(X). Xét: 4 2 2 ) ( x e x x f   Có: 4 4 ' ) ( 2 2 x - 2 x - e 4 x e 2 1   x f
  • 26. dẫn môn Lý thuyết Xác suất và Thống kê 26 ' 4 4 4 ( ) 0 0 (1 0 (1 0 2 f x x               2 2 2 x x x 2 2 - - - 2 1 x 1 x e e )e 2 4 2 2 x ) 2 Và: 2 2 2 2 2 2 3 3 2 4 4 4 4 4 4 3 ''( ) ( 3) 4 2 8 4 8 2 4 x x x x x x x x x x x x x f x e e e e e e                        Suy ra: 1 1 2 2 2 : ''( 2) (2 3) 0 ( 2) max 4 4 2 2 2 : ''( 2) (2 3) 0 ( 2) min 4 4 x f e f e x f e f e                       Vậy: 414 , 1 2 ) mod(   X 2.2.6 Trung vị (medX) Định nghĩa: Trung vị của BNN X là giá trị của X chia phân phối xác suất thành 2 phần có xác suất giống nhau. 2 1 )) ( ( )) ( (     X med X P X med X P Nhận xét: Từ định nghĩa ta thấy để tìm trung vị chỉ cần giải phương trình 2 1 )) ( (  X med F . Trong ứng dụng, trung vị là đặc trưng vị trí tốt nhất, nhiều khi tốt hơn cả kỳ vọng, nhất là khi trong số liệu có nhiều sai sót. Trung vị còn gọi là phân vị 50% của phân phối. Ví dụ 2.18: Cho X như trong ví dụ 2.17. Hãy xác định med(X). Med(X) là nghiệm của phương trình: 2 1 ) ( )) ( ( ) (     X med dx x f X med F 2 1 ) ( ) ( 0 4 ) ( 0      X med X med dx dx x f 2 x - e 2 x 2 2 ( ) ( ) 2 4 4 0 0 1 1 ( ) 4 2 2 med X med X x x x e d e               2 4 4 2 1 1 1 1 ln 0.693 2 2 4 2 2,772 ( ) 1,665 ( ( ) 0)                        med X med X med X domed X 2 2 [med(X)] [med(X)] - - e e Vậy: med(X) = 1.665 Chú ý: Nói chung, ba số đặc trưng: E(X), mod(X), med(X) không trùng nhau. Chẳng hạn, từ các ví dụ 2.17 và 2.17 và ta tính thêm kỳ vọng ta có: E(X) = 1.772, mod(X) = 1.414 và med(X) = 1.665. Tuy nhiên nếu phân phối đối xứng chỉ có một mod thì 3 đặc trưng đó trùng nhau.
  • 27. dẫn môn Lý thuyết Xác suất và Thống kê 27 2.3 MỘT SỐ QUI LUẬT PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 2.3.1 Phân phối nhị thức, X  B(n,p) Định nghĩa: BNN X có phân phối nhị thức là BNN rời rạc nhận các giá trị 0, 1, 2,…,n với các xác suất tương ứng được tính theo công thức Bernoulli:     n x x x n P(X x) C p 1 p ; x 0,1, ,n       Ví dụ 2.19: Tỷ lệ sản phẩm bị lỗi trong 1 lô hàng là 3%. Lấy ngẫu nhiên lần lượt 100 sản phẩm ra để kiểm tra. Tính xác suất để: a) Có 3 sản phẩm bị lỗi. b) Có không quá 3 sản phẩm bị lỗi. Giải: Mỗi lần kiểm tra một sản phẩm là thực hiện một phép thử, lấy lần lượt 100 sản phẩm ra để kiểm tra, ta xem như thực hiện 100 phép thử độc lập. Gọi A là biến cố sản phẩm lấy ra là sản phẩm bị lỗi P = P(A) = 3% Gọi X là số sản phẩm bị lỗi có trong 100 sản phẩm lấy ra, X  B(100; 0.03) a) P(X = 3) = 3 3 97 100 C (0.03) (0.97) b) P(0  X  3) =   3 k 0 P X k    = 0 0 100 1 1 99 2 2 98 3 3 97 100 100 100 100 C (0.03) (0.97) C (0.03) (0.97) C (0.03) (0.97) C (0.03) (0.97)    = 0,647 Phân phối nhị thức: n = 100; p = 0.03 Nhận xét: Trong phân phối nhị thức, nếu n khá lớn và xác suất p không quá gần 0 và 1 thì ta có công thức xấp xỉ sau: i) x x n x n P(X x) C p q     1 x np f npq npq          ; f(u) = 2 u 2 1 e 2  (gọi là công thức địa phương Laplace)
  • 28. dẫn môn Lý thuyết Xác suất và Thống kê 28 ii) P( a  X  b) = b np a np npq npq                      ; 2 u t 2 0 1 (u) e dt 2      (gọi là công thức tích phân Laplace) Chú ý: Hàm f(u) là hàm chẵn, hàm (u) là hàm lẻ. Các giá trị của hàm f(u) và hàm (u) tra bảng Các tham số đặc trưng: Nếu X  B(n,p) thì  E(X) = np  Var(X) = npq  np - q  mod(X)  np + p Ví dụ 2.20: Một máy sản xuất được 200 sản phẩm trong một ngày. Xác suất để sản phẩm bị lỗi là 0.05. Tìm số sản phẩm bị lỗi trung bình và số sản phẩm bị lỗi có khả năng tin chắc của máy đó trong một ngày. Giải: Gọi X là số sản phẩm bị lỗi của máy trong một ngày thì X  B(200; 0.05) Số sản phẩm bị lỗi trung bình của máy trong một ngày là: E(X) = np = 2000.05 = 10 Số sản phẩm bị lỗi tin chắc trong một ngày là mod(X). Ta có: np – q = 2000.05 – 0.95 = 9.05 np + p = 2000.05 + 0.05 = 10.05  9.05  mod(X)  10.05 Vì X  B(200; 0.05) nên mod(X)  Z. Do đó mod(X) = 10 Phân phối nhị thức : n = 200 ; 0.05 Ví dụ 2.21: Một nhà máy sản xuất sản phẩm với tỷ lệ sản phẩm loại A là 20%. Nếu lấy ngẫu nhiên 400 sản phẩm, tính xác suất để: a. Được 80 sản phẩm loại A. b. Được từ 60 đến 80 sản phẩm loại A. c. Tính xem trung bình có bao nhiêu sản phẩm loại A. Giải : Gọi Y là số sản phẩm loại A có trong 400 sản phẩm chọn ra, Y  B(400 ;0,2)
  • 29. dẫn môn Lý thuyết Xác suất và Thống kê 29 Do n = 400, 0 << p = 0,2 << 1 nên ta có thể áp dụng công thức xấp xỉ: a.     80 320 80 400 P(Y 80) C 0.2 0.8     1 80 400 0.2 1 1 0 0.3989 0.0499 8 8 400 0.2 0.8 400 0.2 0.8                  f f b. 80 400 0.2 60 400 0.2 P(60 Y 80) 400 0.2 0.8 400 0.2 0.8                                   0 2.5 0 2.5 0 0.4938 0.4938             c. E(Y) = n.p = 4000.2 = 80 Vậy trung bình có 80 phế phẩm trong 400 sản phẩm chọn ra. Phân phối nhị thức: n = 400; p = 0.2 2.3.2 Phân phối Poison, X  P( ) Giả sử X là BNN có phân phối nhị thức với tham số n và p. Khi n khá lớn và np =  (hằng số), ta có: x x n x n P(X x) C p q     x e x!    ( gọi là công thức Poison) Định nghĩa: BNN X có luật Poison là BNN rời rạc nhận các giá trị 0,1,2,.., n với các xác suất tương ứng được tính theo công thức Poison. Ví dụ 2.22: Một nhà máy dệt có 1000 ống sợi. Xác suất để trong 1 giờ máy hoạt động có 1 ống sợi bị đứt là 0.002. Tính xác suất để trong 1 giờ máy hoạt động có không quá 2 ống sợi bị đứt. Giải: Vì n khá lớn, n =1000; p = 0.002  np = 2 Việc quan sát ống sợi xem như là một phép thử, ta có 1000 phép thử độc lập. Gọi A là biến cố ống sợi bị đứt và X là số ống sợi bị đứt trong 1 giờ máy hoạt động. P = P(A) = 0.002  X  B(1000; 0.002) Nhưng vì n khá lớn và np = 2 (hằng số)  X  P(2)
  • 30. dẫn môn Lý thuyết Xác suất và Thống kê 30 Ta có: P(0  X  2) = P(X=0) + P(X=1) + P(X=2) = 0 2 2 e 0!  + 1 2 2 e 1!  + 2 2 2 e 2!  = 0.6808 Phân phối possion : λ = 2 Các tham số đặc trưng: Nếu X  P( ) thì E(X) = Var(X) =  và  – 1  mod(X)   Nhận xét: Số lỗi in sai trong một trang (hoặc một số trang) của một cuốn sách, số người trong một cộng đồng sống cho tới 100 tuổi, số cuộc điện thoại gọi sai trong một ngày, số transitor hư trong ngày đầu tiên sử dụng, số khách hàng vào bưu điện trong một ngày, số hạt  phát ra từ các hạt phóng xạ trong một chu kỳ,.. có luật Poison. 2.3.3 Phân phối siêu bội, X  H(N, M, n) Cho tập hợp có N phần tử trong đó có M phần tử có tính chất A. Lấy ngẫu nhiên ra n phần tử. Gọi X là số phần tử có tính chất A có trong n phần tử lấy ra. Khi đó, X là BNN rời rạc có thể nhận các giá trị 0,1,2,.. ,n với các xác suất tương ứng là: x n x M N M n N C C P(X x) C     (gọi là công thức siêu bội) Định nghĩa: BNN X có luật siêu bội là BNN rời rạc nhận các giá trị 0, 1, 2,.. ,n với các xác suất tương ứng được tính theo công thức siêu bội. Ví dụ 2.23: Một lô hàng gồm có 10 sản phẩm, trong đó có 4 loại A. Lấy ngẫu nhiên 4 sản phẩm từ lô hàng, tính xác suất để có 2 sản phẩm loại A Giải: Gọi X là số sản phẩm loại A trong 4 sản phẩm lấy ra. X là BNN có phân phối siêu bội với tham số N = 10, M = 4 và n = 4 2 2 4 6 4 10 C C P(X 2) 0.4286 C   
  • 31. dẫn môn Lý thuyết Xác suất và Thống kê 31 Phân phối siêu bội: N = 10; M = 4; n = 4 Chú ý: Nếu n << N thì x n x M N M n N C .C C    x x n x n C p (1 p)   với p = N M , như vậy: Khi n << N, ta có thể xem như X B(n;p) và p = N M Phân phối nhị thức: n = 3; p = 0.6 Phân phối siêu bội: N = 100; M = 60; n = 3 Các tham số đặc trưng: Nếu X  H(N;M;n) thì E(X) = np và 1 ) (    N n N npq X Var với M p N        Ví dụ 2.24: Gọi X là số cây bài 2 nút trong 3 cây bài lấy ra từ bộ bài 52 cây. Hãy tính: E(X), Var(X) Giải: Ta có: X  H(52, 4, 3) p = 13 1 25 4   N M  q = 1 – p = 1 - 13 12 13 1  Ta được: E(X) = np = 3 1 0.231 13  . Var(X) = npq N n 1 12 52 3 3 0.051 N 1 13 13 52 1         .
  • 32. dẫn môn Lý thuyết Xác suất và Thống kê 32 Ví dụ 2.25: Một trường gồm có 10000 sinh viên, trong đó có 1000 học kém. Một Đoàn thanh tra đến trường, chọn ngẫu nhiên 100 sinh viên để kiểm tra. Tính xác suất để có 20 sinh viên học kém. Gọi X là số sinh viên học kém trong 100 sinh viên được chọn ra. Ta có: X  H(10000; 1000; 100) 100 10000 80 9000 20 1000 ) 20 ( C C C X P   Vì N = 10000 rất lớn, n = 100 << 10000 = N nên X xấp xỉ phân phối nhị thức: X  B(100; 0.1) với M 1000 p 0.1 N 10000    . Mặt khác, do n = 100 và 0 << p = 0.1 << 1 nên ta có thể áp dụng công thức xấp xỉ sau:     20 80 20 100 ( 20) 0.1 0.9 1 20 100 0.1 100 0.1 0.9 100 0.1 0.9                P X C f   1 10 1 1 f f 3.33 0.0017 0.00057 3 3 3 3            . 2.3.4 Phân phối chuẩn, X  N(μ; 2  ) Định nghĩa: BNN X có luật chuẩn là BNN liên tục nhận giá trị từ - đến + với hàm mật độ xác suất: 2 2 (x ) 2 1 f(x) e 2        với a là hằng số, 0 < : hằng số, - < x < + . Nếu μ = 0 và  = 1 thì BNN liên tục X được gọi là có phân phối chuẩn tắc. Biểu đồ phân phối chuẩn và phân phối chuẩn tắc Các tham số đặc trưng: Nếu X  N(a;2 ) thì E(X) = Mod(X) = a và Var(X) = 2  . Nhận xét: Phân phối chuẩn có ý nghĩa rất lớn trong thực tế. Rất nhiều BNN có luật phân phối chuẩn. Những BNN có liên quan đến số lượng lớn, chịu ảnh hưởng của các yếu tố cân bằng nhau thường có luật phân phối chuẩn. Chẳng hạn:  Các chỉ số sinh học (cân bằng, chiều cao,...) của người cùng giới tính và cùng độ tuổi.
  • 33. dẫn môn Lý thuyết Xác suất và Thống kê 33  Các chỉ số sinh học của các loài cây, loài vật cùng độ tuổi.  Khối lượng, kích thước của các sản phẩm do cùng 1 hệ thống máy sản xuất ra. Định lý: Nếu X  N(μ, 2  ) thì Z = X     N(0,1). Hệ quả: Cho X  N(μ , 2  ), ta có: a. 2 1 1 2 x x P(x X x )                         . b.   P X 2               Suy ra:       P X 68%; P X 2 95%; P X 3 99.99%                c. x P(X x) 0.5              Ví dụ 2.26: Lãi suất đầu tư vào Công ty B là biến ngẫu nhiên có phân phối chuẩn 2 N( , )   , biết xác suất để đạt được lãi suất trên 20%/ 1 năm là 0.2 và dưới 10%/ 1 năm là 0.1. a) Tìm kỳ vọng μ và phương sai 2  . b) Tính xác suất để khi đầu tư vào công ty B đó được lãi suất ít nhất 14%/ 1 năm. Giải: a) Ta có:   10 P Y 10 0.5 0.1               1.28 10      (1)     20 P Y 20 1 P Y 20 0.5 0.2                  0.84 20      (2) Giải hệ (1) và (2): 16; 4.7     b)     14 16 P Y 14 1 P Y 14 0.5 0.67 4.7                Phân phối chuẩn: μ = 16; σ = 4.7 2.3.5 Phân phối mũ, XExp( ) Định nghĩa: BNN X có luật mũ là BNN liên tục có hàm mật độ xác suất:
  • 34. dẫn môn Lý thuyết Xác suất và Thống kê 34   f (x) exp x     ; ( x 0, 0    ) Các tham số đặc trưng: Nếu XExp( ) thì E(X) = 1  và Var(X) = 2 1  . Ví dụ 2.27: Giả sử tuổi thọ (năm) của 1 mạch điện tử trong máy tính là BNN có luật phân phối mũ với tuổi thọ trung bình là 6.25 ( 1 6.25   ). Thời gian bảo hành của mạch điện tử này là 5 năm. Tính xác suất để mạch điện tử bán ra phải thay thế trong thời gian bảo hành? Giải: Gọi X là tuổi thọ của mạch điện tử .  P(X  5) = 5 1 x 6.25 0 1 e dx 6.25   = 5 1 x 6.25 0 e   = 1 5 6.25 (e 1) 50.07%      Vậy có khoảng 55.1% mạch điện tử bán ra phải thay thế trong thời gian bảo hành. Phân phối mũ: λ = 0.16 Nhận xét: Khoảng thời gian giữa hai lần xuất hiện của một biến có luật phân phối mũ. Chẳng hạn khoảng thời gian giữa hai ca cấp cứu ở một bệnh viện, giữa hai lần hỏng hóc của một cái máy, giữa hai trận lụt hay động đất là những BNN có luật phân phối mũ. 2.3.6 Phân phối, 2  ~ ) ( 2 n  Định nghĩa: Cho các BNN i X , i = n , 1 độc lập, cùng có luật phân phối chuẩn tắc. Khi đó BNN    n i i X 1 2 2  được gọi là có luật phân phối khi bình phương, bậc tự do n. Hàm mật độ xác suất:   x n 2 2 n 2 1 n 2 e x f(x) , x 0 2      ) 30 ( 2  ) 10 ( 2  ) 50 ( 2  x O f(x)
  • 35. dẫn môn Lý thuyết Xác suất và Thống kê 35 Trong đó hàm       0 1 . ) ( dt e t u t u , có tên gọi là hàm Gamma, (1) = 1,  (u+1) = u. (u) Các tham số đặc trưng: Nếu 2   ) ( 2 n  thì n E  ) ( 2  và n Var 2 ) ( 2   . 2.3.7 Phân phối Student, T  T(n) Định nghĩa: Cho BNN U  N(0,1), 2   ) ( 2 n  , trong đó U và 2  độc lập nhau. Khi đó biến ngẫu nhiên: 2 2 . X U n n X U T   được gọi là có luật phân phối Student bậc tự do n. Các đặc trưng số: Nếu T  T(n) thì E(T) = 0 và 2 ) (   n n T Var . Phân phối student: df = 5 Phân phối student: df = 29 BÀI TẬP CHƯƠNG 2 Bài 1: Một xạ thủ có 3 viên đạn. Xác suất bắn trúng mục tiêu là 0,6. Anh ta bắn đến khi hoặc hết đạn hoặc trúng mục tiêu thì thôi. Tìm luật phân phối xác suất của số viên đạn đã bắn. Bài 2: Ba xạ thủ độc lập bắn vào bia. Xác suất để các xạ thủ bắn trúng bia lần lượt là: 0,8; 0,7 ; 0,6 (mỗi xạ thủ bắn 1 viên). Gọi X là số viên đạn trúng bia. a/ Lập luật phân phối xác suất của X. b/ Tính   2 7 P X   . c/ Tính xác suất có ít nhất 1 xạ thủ bắn trúng bia. Bài 3: Trong 1 phòng có 12 người, trong đó có 4 người không thích xem bóng đá. Chọn ngẫu nhiên 5 người. Gọi X là số người không thích xem bóng đá trong 5 người chọn ra. Lập bảng phân phối xác suất của X. Bài 4: Có 2 hộp: Hộp I có 3 bi đỏ và 7 bi trắng Hộp II có 6 bi đỏ và 4 bi trắng. a/ Lấy mỗi hộp 1 viên bi. Gọi X là số bi trắng trong 2 bi lấy ra. Lập bảng phân phối xác suất của X; tìm E(X), Var(X), Mod(X); viết biểu thức hàm phân phối F(X). b/ Lấy mỗi hộp 2 viên bi. Gọi Y là số bi trắng trong 4 bi lấy ra. Lập bảng phân phối xác suất của Y; tìm E(Y), Var(Y), Mod(Y); viết biểu thức hàm phân phối F(Y). c/ Chọn ngẫu nhiên 1 hộp, rồi từ hộp đó lấy ngẫu nhiên 3 bi. Gọi Z là số bi trắng trong 3 bi lấy ra. Lập bảng phân phối xác suất của Z; tìm E(Z), Var(Z), Mod(Z); viết biểu thức hàm phân phối F(Z).
  • 36. dẫn môn Lý thuyết Xác suất và Thống kê 36 Bài 5: Xâu chìa khóa có 6 chìa, trong đó có 2 chìa mở được cửa. Thử từng chìa (thử xong bỏ ra ngoài) cho đến khi mở được cửa. Tìm số lần thử trung bình mở được cửa. Bài 6: Có 2 kiện hàng: Kiện I có 3 sản phẩm tốt, 2 sản phẩm xấu; Kiện II có 2 sản phẩm tốt, 3 sản phẩm xấu. Lấy ngẫu nhiên từ kiện I ra 2 sản phẩm và từ kiện II ra 1 sản phẩm. Gọi X là số sản phẩm tốt trong 3 sản phẩm lấy ra. Lập luật phân phối xác suất của X. Bài 7: Có 3 hộp, trong mỗi hộp đều có 9 lá thăm ghi 3 triệu đồng và 1 lá thăm ghi 30 triệu đồng. Một người rút ngẫu nhiên mỗi hộp 1 lá thăm. Gọi X là tổng số tiền ghi trên 3 lá thăm rút được. a/ Lập bảng phân phối xác suất của X. b/ Tính P(X > 30). Bài 8: Cho BNN X có hàm mật độ xác suất       4 1;2 0 1;2 c x x f x x         a/ Tính c, E(X), Var(X). b/ Tìm F(X). c/ Tính 3 2 2 P X         . Bài 9: Cho BNN X có hàm mật độ xác suất         2 . 1 0;1 0 0;1 c x x x f x x          a/ Tính c, E(X), Var(X). b/ Tìm F(X). c/ Tính 1 0 2 P X         . Bài 10: Tuổi thọ của một loại côn trùng là một BNN X (đơn vị là tháng) với hàm mật độ xác suất như sau         2 4 0;4 0 0;4 kx x x f x x          a/ Tính k. b/ Tìm tuổi thọ trung bình của côn trùng. c/ Tính xác suất để côn trùng chết trước khi nó được một tháng tuổi. Bài 11: Hàng hóa được đóng thành kiện, mỗi kiện 10 sản phẩm, trong đó có 3 phế phẩm. Khách hàng chấp nhận kiện hàng hóa nếu lấy ngẫu nhiên ra 2 sản phẩm thì cả 2 sản phẩm đều tốt. Khách hàng kiểm tra 100 kiện hàng. Gọi X là số kiện hàng được khách hàng chấp nhận. Tính E(X), Var(X), Mod(X). Bài 12: Một xạ thủ có xác suất bắn trúng của mỗi phát là 0,8. Xạ thủ này bắn 64 phát vào bia. Tính xác suất: a/ Có 50 phát trúng bia. b/ Có từ 45 đến 52 phát trúng bia. c/ Không dưới 51 phát trúng bia. Bài 13: Sản phẩm được đóng thành hộp. Mỗi hộp có 10 sản phẩm, trong đó có 7 sản phẩm loại A. Người mua hàng quy định cách kiểm tra như sau: Từ hộp lấy ngẫu nhiên 3 sản phẩm nếu thấy cả 3 sản phẩm đều loại A thì nhận hộp đó. Nếu ngược lại thì loại hộp. Giả sử kiểm tra 100 hộp (trong rất nhiều hộp). Tính xác suất để: a/ Có 25 hộp được nhận. b/ Có không quá 30 hộp được nhận.
  • 37. dẫn môn Lý thuyết Xác suất và Thống kê 37 c/ Phải kiểm tra ít nhất bao nhiêu hộp để xác suất có ít nhất một hộp được nhận không nhỏ hơn 0,95? Bài 14: Một mạch điện gồm 1000 bóng đèn mắc song song. Xác suất để mỗi bóng đèn bị hư tại mỗi thời điểm là 0,2%. Tính xác suất để tại một thời điểm: a/ Không có bóng đèn nào bị hư. b/ Có nhiều hơn 3 bóng đèn bị hư. c/ Hãy cho biết số bóng đèn bị hư trung bình tại một thời điểm. Bài 15: Một trường có 730 học sinh và xác suất để ngày sinh của một học sinh chọn ngẫu nhiên trùng với một ngày xác định là 1/365. Tính xác suất để có 3 học sinh cùng sinh vào ngày một tháng giêng. Bài 16: Để tiêu diệt một xe tăng phải có ít nhất 2 viên đạn trúng xe. Bắn 10 viên (xác suất mỗi viên trúng là 0,8). Tính xác suất để xe bị diệt. Bài 17: BNN X có luật phân phối xác suất như sau: Tìm kỳ vọng và phương sai của BNN Y = 5X + Var(X) Bài 18: Ba phân xưởng cùng sản xuất một loại sản phẩm. Tỷ lệ sản phẩm loại A của các phân xưởng tương ứng là: 10% ; 20% ; 30%. Từ lô hang gồm 10.000 sản phẩm (trong đó có 3.000 sản phẩm của phân xưởng I; 4.000 sản phẩm của phân xưởng II và 3.000 sản phẩm của phân xưởng III). Người ta lấy ngẫu nhiên ra 100 sản phẩm để kiểm tra. Nếu thấy có không quá 24 sản phẩm loại A thì nhận lô hàng. Tìm xác suất để nhận lô hàng đó. Bài 19: Một cái máy gồm 5.000 bộ phận. Xác suất để mỗi bộ phận bị hỏng tại một thời điểm là 0,1%. Biết rằng nếu có từ 2 bộ phận trở lên bị hỏng thì máy không hoạt động. Nếu có 1 bộ phận bị hỏng thì máy sẽ không hoạt động với xác suất là 0,5. Tính xác suất để máy không hoạt động. Bài 20: Độ dài của một chi tiết máy là một BNN có phân phối chuẩn với trung bình là 20cm và phương sai là 0,04 2 cm . a/ Tính xác suất để lấy được một chi tiết máy thì độ dài chi tiết máy nằm trong khoảng   19,8 ; 20,1 cm cm . b/ Những chi tiết sai lệch so với trung bình nhỏ hơn 0,3cm được coi là loại tốt. Tính tỷ lệ chi tiết loại tốt của máy đó. c/ Nếu muốn tỷ lệ chi tiết loại tốt là 90% thì độ dài chi tiết sai lệch so với trung bình là bao nhiêu? Bài 21: Trọng lượng trẻ sơ sinh là BNN X có phân phối chuẩn với trọng lượng trung bình là 3kg và độ lệch chuẩn là 0,2kg. a/ Tính tỷ lệ trẻ sơ sinh cân nặng từ 3kg đến 3,4kg. b/ Trẻ sơ sinh thiếu cân nếu có trọng lượng nhỏ hơn 2,5kg. Tính tỷ lệ trẻ thiếu cân. X 0 1 4 6 P 1/8 4/8 1/8 2/8
  • 38. dẫn môn Lý thuyết Xác suất và Thống kê 38 CHƯƠNG 3: ƯỚC LƯỢNG THAM SỐ THỐNG KÊ 3.1 MỘT SỐ KHÁI NIỆM 3.1.1 Tổng thể Tập hợp tất cả các phần tử mang những dấu hiệu cần khảo sát trong một nghiên cứu được gọi là tổng thể. Ví dụ 3.1: Khi nghiên cứu về trọng lượng của gà trong một trại chăn nuôi thì tổng thể là tập hợp gà của trại. Khi nghiên cứu về chất lượng học tập của sinh viên của một trường thì tổng thể là tập hợp sinh viên của trường đó. Khi nghiên cứu độ dài đường kính của trục máy do một máy tự động tiện ra thì tổng thể là tập hợp các trục máy do máy đó tiện ra. 3.1.2 Mẫu Từ tổng thể, ta lấy ra n phần tử và đo lường dấu hiệu X của chúng. Khi đó tập hợp n phần tử này được gọi là một mẫu và số phần tử của mẫu được gọi là kích thước của mẫu. Vì từ mẫu, ta kết luận cho tổng thể nên mẫu phải được chọn một cách ngẫu nhiên để đại diện cho tổng thể. 3.1.3 Mô hình xác suất của tổng thể và mẫu Từ tổng thể, ta lấy ra một phần tử. Đo lường dấu hiệu X đo được trên phần tử lấy ra. Khi đó, X là BNN có bảng phân phối xác suất như sau: X x1 x2 . . . . xn P P1 P2 . . . . Pn Ta thấy, dấu hiệu X được mô hình hóa bởi BNN X nên X được gọi là BNN gốc và phân phối xác suất của X được gọi là phân phối gốc.  Mẫu ngẫu nhiên: Lấy n phần tử của tổng thể theo phương pháp có hoàn lại để quan sát. Gọi Xi là giá trị của dấu hiệu X đo được trên phần tử thứ i (i= 1,..,n), thì X1, X2, .., Xn cũng là các BNN có cùng phân phối xác suất như BNN gốc X. Khi đó, bộ (X1, X2, .. , Xn) được gọi là mẫu ngẫu nhiên hay mẫu lý thuyết kích thước n được tạo nên từ BNN gốc X và kí hiệu: WX = (X1, X2, .. , Xn). Nếu giả sử Xi nhận giá trị xi thì (x1, x2, .. , xn) được gọi là một mẫu cụ thể hay mẫu thực nghiệm của mẫu ngẫu nhiên WX , kí hiệu: wx = (x1, x2, .. , xn) Ví dụ 3.2: Kết quả điểm môn Xác suất thống kê của một lớp gồm 100 sinh viên cho bởi bảng sau: Điểm 3 4 5 6 7 Số sinh viên có điểm tương ứng 25 20 40 10 5 Gọi X là điểm môn Xác suất thống kê của một sinh viên được chọn ngẫu nhiên trong danh sách lớp thì X là BNN có phân phối:
  • 39. dẫn môn Lý thuyết Xác suất và Thống kê 39 X 3 4 5 6 7 P 0.25 0.2 0.4 0.1 0.05 Chọn ngẫu nhiên 5 sinh viên trong danh sách lớp để xem điểm. Gọi Xi là điểm của sinh viên thứ i(i = 1,2,3,4,5). Ta có mẫu ngẫu nhiên kích thước n = 5 được xây dựng từ BNN X là WX = (X1, X2, .. , X5) và các BNN Xi có cùng phân phối xác suất với BNN X. Giả sử sinh viên thứ nhất được 4 điểm, thứ hai được 3 điểm, thứ ba được 6 điểm, thứ tư được 7 điểm và thứ năm được 5 điểm thì ta được mẫu cụ thể: wx = (4, 3, 6, 7, 5) 3.1.4 Một số tham số thống kê của mẫu Giả sử ta có mẫu thực nghiệm WX = (x1, x2, .. , xn), khi đó các tham số thống kê được tính toán theo các công thức sau: - 1 1 n i i i x x n n    -   n 2 2 2 i i i 1 1 s x n x n      - 2 2 n s s n 1    Ví dụ 3.3: Số xe hơi bán được trong một tuần của 45 công ty như sau: Số xe hơi được bán 1 2 3 4 5 6 Số công ty 15 12 9 5 3 1 Ta có: Trung bình mẫu: k i i i 1 1 107 x n x 2.38 n 45      Phương sai mẫu:     k 2 2 2 2 i i i 1 1 335 s n x x 2.38 7.444 5.664 1.78 n 45           Phương sai mẫu có điều chỉnh: 2 2 n s s 1.82 n 1     Độ lệch chuẩn mẫu: 2 s s 1.78 1.338      Độ lệch chuẩn mẫu có điều chỉnh: s 1.82 1.353   Ví dụ 3.4: Chiều cao của 50 cây lim được cho bởi bảng sau: Chiều cao (m) 6.75 – 7.25 7.25 – 7.75 7.75 – 8.25 8.25 – 8.75 8.75 – 9.25 9.25 – 9.75 Số cây 4 5 11 18 9 3 Ta có: Trung bình mẫu: k i i i 1 1 416 x n x 8.32 n 50     
  • 40. dẫn môn Lý thuyết Xác suất và Thống kê 40 Phương sai mẫu:     k 2 2 2 2 i i i 1 1 3481.5 s n x x 8.32 0.408 n 50         Phương sai mẫu có điều chỉnh: 2 2 n s s 0.416 n 1     Độ lệch chuẩn mẫu: 2 s s 0.408 0.638      Độ lệch chuẩn mẫu có điều chỉnh: s 0.416 0.645   3.2 PHƯƠNG PHÁP ƯỚC LƯỢNG THAM SỐ THỐNG KÊ 3.2.1 Phương pháp ước lượng điểm: Giả sử BNN X có tham số đặc trưng  chưa biết. Thông thường ta dùng giá trị 0  tham số thống kê của mẫu dùng để ước lượng cho tham số  của tổng thể. Ví dụ 3.5: với số liệu ví dụ 3.3: a) Hãy chỉ ra ước lượng điểm cho số xe bán được trung bình một công ty. b) Hãy chỉ ra ước lượng điểm cho tỷ lệ những công ty có số xe bán được từ 5 chiếc/tuần trở lên. Giải: a. Số xe bán được trung bình được ước lượng là 2.38 chiếc. b. Trong 45 công ty đã khảo sát có 4 công ty có số xe bán được từ 5 chiếc/tuần trở lên. Vậy ước lượng điểm cho p là * 4 p 8.9% 45   . 3.2.2 Phương pháp ước lượng khoảng Giả sử BNN X có tham số đặc trưng  chưa biết. Phương pháp ước lượng khoảng là chỉ ra khoảng (1, 2) chứa  sao cho P(1< <2) = 1 -  (với  là mức ý nghĩa cho trước). Phương pháp này được trình bày chi tiết cho các tham số thống kê. 3.3 ƯỚC LƯỢNG TRUNG BÌNH: Giả sử a là trung bình của tổng thể (chưa biết), ước lượng trung bình là ta chỉ ra khoảng (a1 , a2) chứa a sao cho xác suất P(μ1< μ < μ 2) = 1 -  Ta xét 2 trường hợp: i) Phương sai của tổng thể 2  đã biết Ta có khoảng ước lượng của trung bình μ là: x     với 1 2 Z n      và 1 2 Z   là phân vị chuẩn (tra bảng phụ lục 3) ii) Phương sai của tổng thể 2  chưa biết; Cỡ mẫu n  30 Ta có khoảng ước lượng của trung bình μ là: x     , với 1 2 s Z n     iii) Phương sai của tổng thể 2  chưa biết; Cỡ mẫu n < 30 (tổng thể có phân phối chuẩn) Ta có khoảng ước lượng trung bình tổng thể: x     , với n 1;1 2 s t n     
  • 41. dẫn môn Lý thuyết Xác suất và Thống kê 41 và n 1;1 2 t    là phân vị student (tra bảng phụ lục 4) * Một số khái niệm:  Khoảng   1 2 ,   được gọi là khoảng ước lượng.  Số  được gọi là mức ý nghĩa.  1 -  được gọi là độ tin cậy.  1 2    được gọi là độ dài của khoảng ước lượng.   được gọi là bán kính ước lượng, hay độ chính xác hay sai số Ví dụ 3.6: Khối lượng sản phẩm là BNN X có luật phân phối chuẩn, biết rằng phương sai 2  = 4g2 . Kiểm tra 25 sản phẩm, tính được trung bình mẫu x = 20g. a) Ước lượng trung bình của khối lượng sản phẩm với độ tin cậy 95%. b) Nếu cho bán kính của ước lượng g 4 , 0   thì độ tin cậy của ước lượng là bao nhiêu? c) Với bán kính ước lượng 0,4g   , muốn có độ tin cậy % 95 1   thì phải kiểm tra ít nhất bao nhiêu sản phẩm? Giải: a. Gọi μ khối lượng sản phẩm trung bình của tổng thể. Ta có: x     , 1 2 n Z      Với g 2   , n = 25 , g x 20  . Độ tin cậy 1 -  = 95% = 0.95   = 0.05 0.025 1 0.975 2 2        Do đó:   0.975 1 2 2 2 Z Z 1.96 0.78 5 n 25         Suy ra:   20 0.78 19.22 ; 20.78     Vậy khoảng ước lượng trung bình khối lượng sản phẩm với độ tin cậy 95% là (19.22g ; 20.78g). b. Với  = 0.4g, sử dụng công thức: 1 2 Z n      0.84 1 2 n (0.4) 25 Z 1 0.994 Z 2           1 0.84 0.16 0.32 2 2            1 -  = 0.68 Vậy: độ tin cậy là 68%. c. Với  = 0.4g, 1 -  = 95% = 0.95 1 0.975 2     .
  • 42. dẫn môn Lý thuyết Xác suất và Thống kê 42 Từ công thức trên, suy ra: 2 2 2 2 2 0,975 0.975 2 2 2 2 4 n Z Z (1.96) 96.04 (0.4) (0.4)       Vì n là số nguyên n 96   . Vậy phải kiểm tra ít nhất 96 sản phẩm. Nhận xét: Công thức độ chính xác cho thấy độ tin cậy (1 - ) càng lớn thì bán kính  càng lớn, do đó khoảng ước lượng ( x - ; x + ) cho giá trị thông tin thấp. Kết quả câu b cho thấy nếu giảm bán kính  thì khoảng ước lượng ( x - ; x + ) có giá trị thông tin cao nhưng độ tin cậy của ước lượng giảm xuống. Như vậy, muốn có bán kính  nhỏ và độ tin cậy (1 - ) lớn thì tăng kích thước mẫu (kết quả câu c). Ví dụ 3.7: Khảo sát chiều cao của cây cùng độ tuổi thu được kết quả như sau : Chiều cao (cm) < 180 180 – 190 190 – 200 200 – 210 210 – 220 220 – 230 > 230 Số cây 3 12 35 70 62 32 6 Ước lượng chiều cao trung bình của cây với độ tin cậy 99%. Giải: Khoảng ước lượng chiều cao trung bình của cây : x     với 1 2 s Z n     Với mẫu cho ta tính được x = 208.455cm, s =12.233. Với độ tin cậy: 1 -  = 99%   = 0.01 2   = 0.005 1 0.995 2     Do đó: 0.995 s 12.233 Z (2.576) 2.125 n 220     (cm) Suy ra:   208.455 2.125 206.33 ; 210.58     (cm) Vậy khoảng ước lượng trung bình chiều cao của cây với độ tin cậy 99% là (206.33 cm ; 210.58 cm). Ví dụ 3.8: Trọng lượng của sản phẩm là BNN X có luật phân phối chuẩn. khảo sát 25 sản phẩm tính được trung bình mẫu x = 50g, độ lệch tiêu chuẩn điều chỉnh s = 8.25g. Hãy ước lượng trọng lượng trung bình với độ tin cậy 95%. Giải: Khoảng ước lượng trọng lượng trung bình μ: x     với n 1;1 2 s t n      Với mẫu có n = 25, x = 50g, s = 8.25g và 1 -  = 95% 1 0.975 2     24; 0.975 8.25 8.25 t (2.064) 3.406 5 25      (g) Suy ra:   50 3.406 46.594 ; 53.406     (g)
  • 43. dẫn môn Lý thuyết Xác suất và Thống kê 43 Vậy khoảng ước lượng trọng lượng trung bình với độ tin cậy 95% là (46.594g ; 53.406g). 3.4 ƯỚC LƯỢNG TỈ LỆ: Giả sử p là tỷ lệ của tổng thể, ta cần tìm khoảng (p1, p2) chứa p sao cho P(p1< p < p2) = 1 -  Ta có khoảng ước lượng cho tỷ lệ của tổng thể: p f    với 1 2 f(1 f) Z n      Từ công thức trên ta có: 1 2 n Z f(1 f)      2 1 2 Z n f (1 f)                Ví dụ 3.9: Kiểm tra 100 sản phẩm từ lô hàng thì thấy có 20 sản phẩm loại I. a) Ước lượng tỷ lệ sản phẩm loại I của lô hàng với độ tin cậy 99% b) Nếu muốn độ chính xác khi ước lượng  = 0.04 thì độ tin cậy của ước lượng là bao nhiêu? c) Nếu muốn độ tin cậy là 99% và độ chính xác là 0.04 thì cần điều tra bao nhiêu sản phẩm? Giải: Gọi p tỷ lệ sản phẩm loại I của lô hàng Ta có: p f    với 1 2 f(1 f) Z n      Với n = 100, f = 100 20 = 0.2 1 - = 0.99   = 0.011 - 2  = 0.995 0.995 Z = 2.576. 0.2 0.8 2.576 0.1 100      p= f   = 0.2  0.1 = (0.1 ; 0.3) = (10% ; 30%). Vậy khoảng tin cậy tỷ lệ sản phẩm loại I của lô hàng là: (10% ; 30%) b) Ta có: 1 2 n 100 Z 0.04 1 f (1 f ) 0.2 0.8         Ta tìm được: 1 - 2  = 0.84  1 -  = 0.68. Vậy độ tin cậy là 68%. c) Ta có: 1 -  = 0.99   = 0.01 1 - 2  = 0.995 1 2 Z   = 2.576.
  • 44. dẫn môn Lý thuyết Xác suất và Thống kê 44 Do đó: 2 1 2 Z n f (1 f)                = 2 2 (2.576) 0.2 0.8 664 (0.04)    n = 664 3.5 ƯỚC LƯỢNG PHƯƠNG SAI: Giả sử phương sai 2  của tổng thể (chưa biết). Ta tìm khoảng ( 2 2 1 2 ,   ) sao cho: 2 2 2 1 2 P( ) 1         . Khoảng ước lượng   2 2 2 1 ,  của phương sai 2  :   2 2 1 2 n 1;1 2 n 1 s        ;   2 2 2 2 n 1; 2 n 1 s       Ví dụ 3.10: Với giả thuyết đã cho trong ví dụ 3.8, hãy ước lượng phương sai trọng lượng của sản phẩm 2 ) (   X Var với độ tin cậy 95%. Giải: Ta có:   2 2 2 n 1;1 2 n 1 s        <   2 2 n 1; 2 n 1 s     Ta có: n = 25, s = 8.25g, 1 -  = 95% 1 0.975 2     Suy ra 2 1  =   2 2 n 1;1 2 n 1 s      2 24; 0.795 24 6.92 24 6.92 4.22 39.364       2 2  =   2 2 n 1; 2 n 1 s     = 2 24; 0.025 24 6.92 24 6.92 13.39 12.401      Vậy khoảng ước lượng phương sai với độ tin cậy 95% là (4.22g2 ;13.39g2 ). BÀI TẬP CHƯƠNG 3 Bài 1: Người ta tiến hành điều tra thị trường về một loại sản phẩm mới, phỏng vấn ngẫu nhiên 300 khách hàng thì thấy có 90 người thích sản phẩm này. a/ Hãy ước lượng tỷ lệ khách hàng thích sản phẩm này với độ tin cậy 95%. b/ Với mẫu điều tra trên và muốn độ chính xác của ước lượng tỷ lệ khách hàng thích sản phẩm là 0,0436 thì đảm bảo độ tin cậy là bao nhiêu? Bài 2: Lãi suất cổ phiếu của một công ty trong 5 năm qua là: 15% ; 10% ; 20% ; 7% ; 14%. Với độ tin cậy 90% hãy ước lượng độ phân tán về lãi suất của cổ phiếu. (Biết lãi suất cổ phiếu là BNN có phân phối chuẩn). Bài 3: Để ước lượng tổng doanh thu (triệu đồng/tháng) của một công ty gồm 380 cửa hàng trên toàn quốc trong một tháng, người ta lấy ngẫu nhiên 10% số cửa hàng và có được doanh thu trong một tháng là: