Ước lượng khoảng tin cậy cho giá trị trung bình năm 2024

  • 1. tin cậy trung bình và tỷ lệ Xác suất thống kê
  • 2. cung cấp: • Tính và diễn giải khoảng tin cậy của trung bình và tỷ lệ • Xác định cỡ mẫu cần thiết cho khoảng tin cậy • Sử dụng khoảng tin cậy
  • 3. và khoảng • Ước lượng điểm là phỏng đoán một trị số, • Khoảng tin cậy cho thêm thông tin về tính biến động của ước lượng Điểm ước lượng Giới hạn tin cậy dưới Giới hạn tin cậy trên Độ rộng khoảng tin cậy Đ-4T
  • 4. số tổng thể Ước lượng điểm Bằng một thống kê mẫu Trung bình Tỷ lệ p π X μ Đ-4T
  • 5. Một ước lượng điểm của một tham số chính xác đến đâu và chắc chắn đến đâu? • Một ước lượng khoảng cho biết thêm thông tin về tham số ngoài ước lượng điểm. • Ước lượng khoảng đó là khoảng tin cậy. Đ-4T
  • 6. tin cậy Là một khoảng gồm các trị số: • Nói lên sự biến thiên của thống kê từ mẫu này qua mẫu khác • Dựa vào quan sát trên 1 mẫu • Cho biết kết quả ước lượng gần tham số đến đâu • Là phỏng đoán có mức độ tin cậy - Ví dụ: 95% tin cậy, 99% tin cậy - Không bao giờ đạt 100% tin cậy
  • 7. thể có µ = 360 và σ = 25. • Lấy mẫu có n = 36 Khoảng 360 ± 1,96*25 /6 = [351,83; 368,17] chứa 95% các trị số X. Khi không biết µ, dùng X để ước lượng µ • Nếu X = 360,5 thì KTC95% là 360,5 ± 1,96*25 /6 = [352,33; 368,67] • Vì 352,33 ≤ µ ≤ 368,67, KTC95% dựa trên mẫu cho ước lượng đúng của µ. CÂU HỎI: Kết quả dựa trên các MẪU cùng cỡ KHÁC sẽ như thế nào?
  • 8. hạn tin cậy dưới Giới hạn tin cậy trên Khoảng có chứa µ 1 362,30 356,13 370,47 2 369,50 363,33 375,37 KHÔNG 3 360,00 354,33 368,17 4 362,12 353,95 370,20 5 373,88 365,71 382,05 KHÔNG
  • 9. lý thuyết, có tất cả kết quả với cỡ mẫu n • Trên thực nghiệm, chỉ có 1 kết quả với cỡ mẫu n • Trên thực nghiệm, không có sẵn µ nên không thể biết KTC nào chứa µ • Chỉ biết rằng nếu thực hiện theo cách này, có 95% các KTC sẽ chứa µ • Vì vậy, dựa vào 1 mẫu quan sát được, có thể tin cậy ở mức độ 95% KTC sẽ chứa µ. Do đó gọi là KTC95%.
  • 10. μ không biết rõ) Tổng thể Mẫu ngẫu nhiên Trung bình X = 50 Mẫu Tin cậy 95% rằng μ trong khoảng giữa 40 và 60. Đ-4T
  • 11. lượng điểm ± (Trị số ngưỡng)(Sai số chuẩn) •Ước lượng điểm là thống kê của tham số được quan tâm •Trị ngưỡng là trị số được lập bảng, phụ thuộc vào phân phối mẫu của ước lượng điểm và độ tin cậy •Sai số chuẩn là độ lệch chuẩn của ước lượng điểm
  • 12. Tin cậy rằng ước lượng khoảng sẽ chứa trị tham số tổng thể • Là một trị số phần trăm nhỏ hơn 100%
  • 13. (1-) • Giả sử độ tin cậy = 95% • Ký hiệu γ = (1 - ) = 0,95, với  = 0,05 • Quan niệm “tần suất”: • 95% tất cả các KTC có thể được lập ra sẽ chứa trị số đúng của tham số cần ước lượng • Một ước lượng khoảng cụ thể nào đó có thể chứa hoặc không chứa trị tham số • Không có xác suất đánh giá một ước lượng khoảng cụ thể
  • 14. bình tổng thể Không biết σ Khoảng tin cậy Tỷ lệ tổng thể Biết σ
  • 15. của μ: Biết σ • Giả thiết • Biết trước độ lệch chuẩn tổng thể σ • Tổng thể có phân phối chuẩn • Nếu tổng thể không có phân phối chuẩn, lấy mẫu cỡ lớn Công thức khoảng tin cậy: là ước lượng điểm Zα/2 là trị số ngưỡng, tra bảng phân phối chuẩn, xác suất mỗi đuôi là /2 là sai số chuẩn n σ /2 Z X α  X n σ/
  • 16. Zα/2 • Đối với KTC 95%: Zα/2 = -1.96 Zα/2 = 1.96 0,05 0,95 1 = = −   0,025 2 = α 0,025 2 = α Ước lượng điểm Giới hạn tin cậy dưới Giới hạn tin cậy trên Z: X: 0 1.96 /2 Z  = α
  • 17. thường gặp 90%, 95% và 99% Độ tin cậy Hệ số tin cậy, Zα/2 1,28 1,65 1,96 2,33 2,58 3,08 3,27 0,80 0,90 0,95 0,98 0,99 0,998 0,999 80% 90% 95% 98% 99% 99.8% 99.9%  − 1
  • 18. và Độ tin cậy μ μ x = Khoảng tin cậy (1-)x100% các KTC chứa μ ()x100% các KTC không chứa μ Phân phối của trung bình mẫu n σ 2 / α Z X − n σ 2 / α Z X + x x1 x2 /2  /2   − 1
  • 19. mẫu ngẫu nhiên n = 16, trung bình 1,50. Theo các kết quả khảo sát về độ chính xác đã thực hiện trước, độ lệch chuẩn tổng thể là 0,25. 1,6225 3775 , 1 0,1225 1,50 ) 16 (0,25/ 1,96 1,50 n σ Z X /2    =  =   
  • 20. quả về KTC Tin cậy ở mức độ 95% rằng trung bình tổng thể là trị số nằm đâu đó giữa 1,3775 và 1,6225 • KTC được tính ra có chứa trị trung bình tổng thể hay không, đó là điều không thể biết. • Chỉ có thể nói, 95% các KTC được tính theo cách này sẽ chứa trị trung bình tổng thể
  • 21. tin cậy Trung bình Tổng thể Không biết σ KHOẢNG Tin cậy Tỷ lệ Tổng thể Biết σ
  • 22. biết σ, có thể tính ra µ. • Mặt khác, để tính ra σ cần biết µ. • Trong thực tế, thường thì không biết cả σ và µ. • Vì vậy mới cần ước lượng.
  • 23. của μ: Không biết σ • Khi không biết σ, phải làm việc với đại diện của σ: độ lệch chuẩn S. • Vì S là biến ngẫu nhiên, mức độ bất định tăng lên. • Do đó, không thể dùng phân phối chuẩn • Phải dùng phân phối Student t
  • 24. của μ: Không biết σ • Giả thiết • Không biết độ lệch chuẩn tổng thể • Tổng thể có phân phối chuẩn • Nếu tổng thể không có phân phối chuẩn, lấy mẫu cỡ lớn • Làm việc với phân phối Student Công thức khoảng tin cậy: tα/2 là trị số ngưỡng của phân phối t độ tự do n -1, xác suất mỗi đuôi α/2 n S t X 2 / α 
  • 25. phối Student • Mỗi phân phối cụ thể có một độ tự do xác định • Trị số ngưỡng tα/2 phụ thuộc vào độ tự do • Độ tự do = Số các trị số có thể biến thiên tự do, sau khi tính trung bình mẫu = Số biến số - số phương trình dùng để tính trung bình mẫu • Độ tự do = n - 1
  • 26. sử trung bình của 3 trị số là 8,0. Nếu X1 = 7 và X2 = 8 thì X3 = ? Trị số X3 phải là 9 (được xác định duy nhất, không được tự do biến thiên) Số trị số ban đầu là n = 3, độ tự do là n – 1 = 3 – 1 = 2 Nên có thể có 2 trị số bất kỳ, còn trị số thứ 3 bị ràng buộc với trị số trung bình đã cho.
  • 27. chuông đối xứng, nhưng có “đuôi” dày hơn phân phối chuẩn Phân phối chuẩn t(∞) t Z khi n tăng
  • 28. Student Diện tích đuôi phải Đ. t.d .10 .05 .025 1 3.078 6.314 12.706 2 1.886 3 1.638 2.353 3.182 t 0 2,920 Đây không phải xác suất, mà là các trị số ngưỡng t n = 3 n - 1 = 2  = 0,10 /2 = 0,05 /2 = 0,05 4.303 2.920
  • 29. trị số ngưỡng Z Mức độ t t t t = Z tin cậy (10) (20) (30) (∞) 0.80 1.372 1.325 1.310 1.28 0.90 1.812 1.725 1.697 1.65 0.95 2.228 2.086 2.042 1.96 0.99 3.169 2.845 2.750 2.58 t Z khi n tăng
  • 30. nhiên có cỡ n = 25, trung bình X = 50, độ lệch chuẩn S = 8. KTC 95% của μ • Vì n – 1 = 24, 2,0639 ) 24 ( /2 =  t 25 8 (2,0639) 50 n S /2  =   t X 46,698 ≤ μ ≤ 53,302
  • 31. thiết quan trọng là tổng thể phải có phân phối chuẩn, hoặc xấp xỉ phân phối chuẩn. • Trường hợp cỡ mẫu nhỏ, n = 25, giả thiết càng quan trọng. Nếu không được thỏa, công thức áp dụng sai. • Kiểm tra điều kiện trên bằng: • Q-Q plot • Normal probability plot • Biểu đồ hộp
  • 32. tin cậy của tỷ lệ Trung bình tổng thể Không biết σ KHOẢNG Tin cậy Tỷ lệ tổng thể Biết σ
  • 33. của tỷ lệ tổng thể π • Là khoảng trị số ước lượng cho tỷ lệ π • Tạo nên từ • Ước lượng điểm = tỷ lệ mẫu p = X/n • Sai số chuẩn của ước lượng điểm • Độ tin cậy cho trước
  • 34. tin cậy cho tỷ lệ π • Khi cỡ mẫu lớn, phân phối của tỷ lệ mẫu xấp xỉ phân phối chuẩn, với độ lệch chuẩn Được ước lượng bằng n p) p(1 − n ) (1 σ p   − =
  • 35. của tỷ lệ Công thức Wald • Zα/2 là trị ngưỡng trong bảng phân phối chuẩn • p là tỷ lệ mẫu • n là cỡ mẫu • Chú ý: Phải có Min(X, n –X) > 5 n p) p(1 /2 Z p −  α
  • 36. ngẫu nhiên 100 người có 25 thuận tay trái. Tính KTC 95% của tủy lệ tổng thể nhưng người thuận tay trái. 0,25)/100 - 0,25(1 1,96 25/100 p)/n p(1 Z p /2  = −   0,3349 0,1651 (0,0433) 1,96 0,25    =  Min(np, n-np) = 100 * 0,25 = 25 > 5 Mẫu đủ lớn
  • 37. đoán ở mức tin cậy 95% rằng trị số đúng của tỷ lệ nằm trong khoảng từ 16,51% đến 33,49%. • KTC từ 0,1651 đến 0,3349 có khả năng chứa hoặc không chứa trị số tỷ lệ • 95% các KTC được tính theo cách đó từ các mẫu có cỡ 100 sẽ chứa trị số đúng của tỷ lệ.
  • 38. mẫu tối thiểu Ước lượng trung bình Tính cỡ mẫu Tối thiểu Ước lượng tỷ lệ
  • 39. lượng trung bình Ước lượng trung bình Tính cỡ mẫu Tối thiểu n σ 2 / α Z X  n σ 2 / α Z e = Sai số lớn nhất cho trước
  • 40. mẫu Ước lượng Trung bình Tính cỡ mẫu Tối thiểu n σ 2 /  Z e = 2 2 2 2 / σ e Z n  = Phương trình, tìm n
  • 41. mẫu • Để tính cỡ mẫu tối thiểu, cần biết: • Độ tin cậy (1 - ), trị ngưỡng tương ứng Zα/2 • Sai số lớn nhất cho phép, e • Độ lệch chuẩn, σ
  • 42.  = 45, mẫu phải lớn đến cỡ nào để ước lượng KTC 90% có sai số trong khoảng ± 5? (luôn làm tròn lên) 220,5225 5 (45) (1,65) σ 2 2 2 2 2 2 = = = e Z n Cỡ mẫu tối thiểu cần thiết là n = 221
  • 43. biết σ • Có thể ước lượng σ trước • Dùng trị số được kỳ vọng ít nhất cũng không nhỏ hơn trị số σ thực sự • Chọn 1 mẫu thăm dò, ước lượng σ xấp xỉ S
  • 44. mẫu tối thiểu Tính cỡ mẫu tối thiểu Cho ước lượng tỷ lệ 2 2 e ) (1 Z n π π − = Phương trình nghiệm n n ) (1 Z e π π − =
  • 45. mẫu tối thiểu • Để tính cỡ mẫu tối thiểu, cần biết: • Độ tin cậy (1 - ), trị số ngưỡng tương ứng Zα/2 • Sai số lớn nhất chấp nhận được, e • Tỷ lệ tổng thể, π • π có thể được ước lượng nhờ nghiên cứu thăm dò, nếu cần. • Hoặc dùng nguyên lý “lý do không đầy đủ”: π xấp xỉ 0,5
  • 46. cần phải lớn đến mức nào để ước lượng khoảng tin cậy 95% của tỷ lệ tổng thể trong một dân số tổng thể rất lớn, với sai số cho phép ±3%? Một nghiên cứu thăm dò cho biết p = 0,12
  • 47. cậy 95% cho tương ứng Zα/2 = 1,96 e = 0,03 p = 0,12 xấp xỉ π Cỡ Min(n) = 451 450.74 (0.03) 0.12) (0.12)(1 (1.96) e ) (1 Z n 2 2 2 2 /2 = − = − = π π 
  • 48. niệm ước lượng điểm, ước lượng khoảng, độ tin cậy, độ tự do • Khoảng tin cậy của trung bình, khi biết/không biết σ • Khoảng tin cậy của tỷ lệ • Xác định có mẫu tối thiểu với sai số ước lượng cho sẵn

Độ tin cậy 95% thì Z bằng bao nhiêu?

Khoảng tin cậy 95% = 0.95 = 1 - α ⇒ α = 0.05 ⇒ z0. 025 = 1.96.

Ước lượng khoảng tin cậy là gì?

Trong thống kê, khoảng tin cậy (tiếng Anh: confidence interval hay viết tắt: CI) là một loại ước lượng khoảng, được tính từ số liệu thống kê của dữ liệu quan sát được, có thể bao hàm giá trị thực của tham số quần thể chưa biết.

Thế nào là bài toán ước lượng?

Bài toán ước lượng tham số là bài toán từ mẫu đặc trưng X có thể ước lượng được tham số θ . Nếu bài toán yêu cầu một giá trị xấp xỉ cho tham số θ thì ta có bài toán ước lượng điểm. Còn nếu ta cần xấp xỉ tham số θ trong một khoảng nào đó được gọi là bài toán ước lượng khoảng. = có thể xấp xỉ cho θ .

Độ tin cậy 90% là gì?

Độ tin cậy 90% có nghĩa là chúng ta mong đợi 90% các khoảng ước tính có bao hàm tham số tổng thể. Tương tự, độ tin cậy 99% có nghĩa là 95% các khoảng sẽ bao gồm tham số.