Cách tính trung bình và độ lệch chuẩn trong stata năm 2024

Để xem xét phân phối chuẩn của một biến ta có rất nhiều cách như vẽ biểu đồ, sử dụng kiểm đinh phân phối chuẩn… Sau đây là một số cách thông thường.

Ví dụ: Ta muốn kiểm tra 2 biến liên tục là thời gian bà mẹ nghỉ sinh [a120] và chiều cao của bà mẹ [m132a].

  1. Các phương pháp vẽ đồ thị.

histogram a120, normal

histogram m132a, normal

Nhìn và đồ thị histogram của 2 biến, ta có thể thấy rằng biến a120-Thời gian nghỉ sinh của bà mẹ là biến liên tục không có phân phối chuẩn. Biến 132a –Chiều cao của bà mẹ dường như có phân phối chuẩn [phân bố hình chuông]. Để kiểm tra phân phối này ta có thể xem xét trên các dạng đồ thị khác hoặc sử dụng kiểm định phân phối chuẩn sẽ được mô tả sau đây.

*Đồ thị dotplot

dotplot a120

dotplot m132a

*Graph box

graph box a120

graph box m132a

*Q-Q plot

qnorm a120

qnorm m132a

*P-P plot

pnorm a120

pnorm m132a

b.Phương pháp xem xét các giá trị Skewness và Kurtosis

Skewness [độ lệch] và kurtosis [đồ gù] là hai chỉ số chính chúng ta cần xem xét để quyết định biến định lượng có phân phối chuẩn hay không. Một biến có phân phối chuẩn khi giá trị của skweness và kutorsis tiến gần đến giá trị 0 và 3.

*Mô tả biến

summarize a120,d

summarize m132a,d

*Sử dụng kiểm định 2 giá trị

Ta dùng lệnh sktest [tên biến].

sktest a120

sktest m132a

Trong kiểm định phân phối chuẩn này. Giả thiết Ho của chúng ta là biến có phân phối chuẩn.Vì vậy dựa vào giá trị p ta có thể xác định được là sẽ bác bỏ hay chấp nhận Ho để biết phân phối có chuẩn hay không?

Nhận xét ví dụ:

Kết quả kiểm định biến a120-Thời gian nghỉ sinh của bà mẹ, chúng ta thấy giá trị p value của kiểm định của Skewness và Kurtosis đều có p0.05 và Kurtosis p

Chủ Đề