Bài tập lớn xác suất thống kê nguyễn bá thi nhóm 6

Academia.edu no longer supports Internet Explorer.

To browse Academia.edu and the wider internet faster and more securely, please take a few seconds to upgrade your browser.

  1. ĐẠI HỌC QUỐC GIA TP.HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA …………oOo………… BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: Nguyễn Bá Thi Sinh viên: Nguyễn Hoàng Minh MSSV: 51001955 Lớp: A09 Nhóm: 3 Thành phố Hồ Chí Minh, 05/2013
  2. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 2 NHÓM 3 Mục lục Mục lục............................................................................................................................................2 Câu 1................................................................................................................................................3 Câu 2................................................................................................................................................5 Câu 3................................................................................................................................................7 Câu 4..............................................................................................................................................14 Sinh viên: Nguyễn Hoàng Minh
  3. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 3 NHÓM 3 Câu 1. Một xí nghiệp may sản xuất áo khoác với 4 màu: đỏ, xanh, vàng và tím than. Số khách hàng nam và nữ mua áo khoác với các màu được ghi trong bảng sau: Đỏ Xanh Vàng Tím than Nữ 62 34 71 42 Nam 125 223 52 54 Với mức ý nghĩa 1% hãy so sánh tỉ lệ khách hàng nam và nữ ưa chuộng các màu sắc nói trên. Bài giải: Dạng bài: bài toán kiểm định giả thiết tỷ lệ. Giả thiết H0: Tỷ lệ khách hàng ưa chuộng các màu sắc nói trên là như nhau trong 2 nhóm. Thực hiện bài toán bằng Excel: 1. Nhập dữ liệu vào bảng tính: 2. Tính các tổng số:  Tổng hàng: chọn ô F2 và nhập biểu thức = SUM[B2:E2]  Dùng con trỏ kéo nút tự điền từ ô F2->F3  Tổng cột: chọn ô B4 và nhập biểu thức =SUM[B2:B3]  Dùng con trỏ kéo nút tự điền từ ô B4->E4  Tổng cộng: chọn ô F4 và nhập biểu thức = SUM[B4:E4] 3. Tính các tần số lý thuyết:  Nữ thích màu đỏ: chọn ô B7 và nhập biểu thức = B4*F2/F4. Sinh viên: Nguyễn Hoàng Minh
  4. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 4 NHÓM 3  Nữ thích màu xanh: chọn ô C7 và nhập biểu thức = C4*F2/F4.  Nữ thích màu vàng: chọn ô D7 và nhập biểu thức = D4*F2/F4.  Nữ thích màu tím than: chọn ô E7 và nhập biểu thức = E4*F2/F4.  Nam thích màu đỏ: chọn ô B8 và nhập biểu thức =B4*F3/F4.  Nam thích màu xanh: chọn ô C8 và nhập biểu thức =C4*F3/F4.  Nam thích màu vàng: chọn ô D8 và nhập biểu thức =D4*F3/F4.  Nam thích màu tím than: chọn ô E8 và nhập biểu thức =E4*F3/F4. 4. Áp dụng hàm số CHITEST: Chọn ô B10 và nhập vào =CHITEST[B2:E3,B7:E8] Ta sẽ có được kết quả của P[X>X²]: Biện luận: Giá trị P = 0.0000000000000000017151444 < α = 0.01 => bác bỏ giả thiết H0. Kết luận: Tỷ lệ khách hàng ưa chuộng các màu sắc nói trên là khác nhau trong 2 nhóm nam và nữ. Sinh viên: Nguyễn Hoàng Minh
  5. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 5 NHÓM 3 Câu 2. Lượng sữa vắt được bởi 16 con bò cái khi cho nghe các loại nhạc khác nhau [nhạc nhẹ, nhạc rốc, nhạc cổ điển, không có nhạc] được thống kê trong bảng sau đây: Nhạc nhẹ 15 18 22 17 Nhạc rốc 13 20 16 15 Nhạc cổ điển 15 19 24 28 Không có nhạc 14 23 17 14 Với mức ý nghĩa 5%, nhận định xem lượng sữa trung bình của mỗi nhóm trên như nhau hay khác nhau. Liệu âm nhạc có ảnh hưởng đến lượng sữa của các con bò hay không? Bài giải: Dạng bài: bài toán kiểm định giả thiết giá trị trung bình. Giả thiết H0: Lượng sữa trung bình khi cho các con bò nghe các loại nhạc nói trên là như nhau. Thực hiện bài toán bằng Excel: 1. Nhập dữ liệu vào bảng tính: Sinh viên: Nguyễn Hoàng Minh
  6. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 6 NHÓM 3 2. Mở Data Analysis chọn Anova Single Factor 3. Hộp thoại Anova Single Factor xuất hiện  Input Range: phạm vi đầu vào [ô D20  ô H23]  Grouped By: nhóm dữ liệu theo hàng hoặc cột [chọn hàng]  Labels in first column: nhãn ở cột đầu tiên [chọn]  Alpha: giá trị α [0,05]  Output Range: phạm vi dữ liệu xuất ra [ô C26] 4. Ta nhận được bảng kết quả: Sinh viên: Nguyễn Hoàng Minh
  7. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 7 NHÓM 3 Biện luận: F quan sát = 1,35468 < F ngưỡng = 3,490295 => chấp nhận giả thiết H0. Kết luận: Lượng sữa trung bình khi cho các con bò nghe các loại nhạc nói trên là như nhau. Câu 3. Từ 12 cặp quan sát [xi, yi] sau đây của cặp hai biến [X, Y], tính tỷ số tương quan, hệ số tương quan và hệ số xác định của Y đối với X. Với mức ý nghĩa α = 5%, có kết luận gì về mối tương quan giữa X và Y [Có phi tuyến không? Có tuyến tính không?]. Tìm đường hồi quy của Y đối với X. X 123 356 111 118 123 356 111 118 123 356 111 118 Y 4,2 4,1 3,7 3,9 4,5 4,1 3 3,8 2 3,1 3,4 3 Bài giải: Dạng bài: bài toán kiểm định tương quan và hồi quy. Thực hiện bài toán bằng Excel:  Phân tích tương quan tuyến tính Giả thiết H0: X và Y không có tương quan tuyến tính. 1. Nhập dữ liệu vào bảng tính: Sinh viên: Nguyễn Hoàng Minh
  8. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 8 NHÓM 3 2. Mở Data Analysis chọn Correlation 3. Hộp thoại Correlation xuất hiện  Input Range: phạm vi đầu vào [ô C15  ô O16]  Grouped By: nhóm dữ liệu theo hàng hoặc cột [chọn hàng]  Labels in first column: nhãn ở cột đầu tiên [chọn]  Output Range: phạm vi dữ liệu xuất ra [ô C19] 4. Ta nhận được bảng kết quả: Biện luận:  n = 12  Từ bảng kết quả, ta tìm được hệ số tương quan r = 0,177098  Hệ số xác định r² = 0,031364  Giá trị T = 0,569028  Phân phối Student mức α = 0,05 với bậc tự do n-2 = 10: c = T.INV.2T[0,05;10] = 2,228139 Sinh viên: Nguyễn Hoàng Minh
  9. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 9 NHÓM 3  |T| < c nên chưa bác bỏ giả thiết H0 [chấp nhận giả thiết H0] Kết luận: Vậy X và Y không có tương quan tuyến tính.  Phân tích tương quan phi tuyến Giả thiết H1: X và Y không có tương quan phi tuyến. 1. Nhập dữ liệu vào bảng tính sau khi đã sắp xếp lại: 2. Mở Data Analysis chọn Anova Single Factor 3. Hộp thoại Anova Single Factor xuất hiện  Input Range: phạm vi đầu vào [ô D27  ô G30]  Grouped By: nhóm dữ liệu theo hàng hoặc cột [chọn cột]  Labels in first row: nhãn ở cột đầu tiên [chọn]  Alpha: giá trị α [0,05]  Output Range: phạm vi dữ liệu xuất ra [ô C33] 4. Ta nhận được bảng kết quả: Sinh viên: Nguyễn Hoàng Minh
  10. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 10 NHÓM 3 Biện luận:  n = 12 , k = 4  Tổng bình phương giữa các nhóm SSF = 0,24  Tổng bình phương nhân tố SST = 5,366667  η2Y/X = SSF/SST = 0,04472  Tỷ số tương quan : ηY/X = 0,211472  Giá trị F = 0,055929  Phân bố Fisher mức α = 0,05 với bậc tự do [k-2, n-k] = [2, 8] c = F.INV.RT[0,05; 2; 8] = 4,45897  F < c chấp nhận giả thiết H1 Kết luận: X và Y không có tương quan phi tuyến. Sinh viên: Nguyễn Hoàng Minh
  11. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 11 NHÓM 3  Phân tích đường hồi quy Giả thiết H: Hệ số không thích hợp. 1. Nhập dữ liệu vào bảng tính theo cột dọc: 2. Mở Data Analysis chọn Regression 3. Hộp thoại Regression xuất hiện  Input Y Range: phạm vi đầu vào [ô D61  ô D73]  Input X Range: phạm vi đầu vào [ô C61  ô C73]  Labels: nhãn [chọn]  Line Fit Plots: vẽ đồ thị [chọn]  Output Range: phạm vi dữ liệu xuất ra [ô F61] Sinh viên: Nguyễn Hoàng Minh
  12. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 12 NHÓM 3 4. Ta nhận được bảng kết quả: Sinh viên: Nguyễn Hoàng Minh
  13. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 13 NHÓM 3 Biện luận:  Hệ số góc = 0,001145  Hệ số tự do = 3,363998  Giá trị P của hệ số tự do [P-value] = 9,95x10-6 < α = 0,05 => Bác bỏ giả thiết H  Hệ số tự do có ý nghĩa thống kê  Giá trị P của hệ số góc [P-value] = 0,581892 > α = 0,05 => Chấp nhận giả thiết H  Hệ số góc không có ý nghĩa thống kê  Giá trị F [Significance F] = 0,581892 > α = 0,05 => Chấp nhận giả thiết H  Phương trình đường hồi quy không thích hợp Kết luận phân tích đường hồi quy: Phương trình đường hồi quy không thích hợp. Kết luận: Tỷ số tương quan ηY/X = 0,211472 Hệ số tương quan r = 0,177098 Hệ số xác định r² = 0,031364 X và Y không có tương quan tuyến tính với mức ý nghĩa 5%. Sinh viên: Nguyễn Hoàng Minh
  14. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 14 NHÓM 3 X và Y không có tương quan phi tuyến với mức ý nghĩa 5%. Phương trình đường hồi quy của Y đối với X: Y = 0,001145X + 3,363998 là không thích hợp. Câu 4. Với mức ý nghĩa 0,05 , hãy phân tích sự biến động của thu nhập [$/tháng/người] trên cơ sở số liệu điều tra về thu nhập trung bình của 4 loại ngành nghề ở 4 khu vực khác nhau sau đây: Loại ngành Nơi làm việc nghề V1 V2 V3 V4 1 212 200 230 220 2 222 205 222 225 3 241 250 245 235 4 240 228 230 240 Bài giải: Dạng bài: bài toán phân tích phương sai hai yếu tố không lặp. Giả thiết H: Các giá trị trung bình bằng nhau. Thực hiện bài toán bằng Excel: 1. Nhập bảng dữ liệu 2. Áp dụng chương trình Anova : Two Factor Without Replication trong thẻ Data => Data Analysis Sinh viên: Nguyễn Hoàng Minh
  15. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 15 NHÓM 3 3. Nhấn OK ta được bản kết quả Biện luận: FR = 8.78 > F0.05 = 3.86 => Bác bỏ giả thiết H [ Ngành nghề ] FC = 1.23 < F0.05 = 3.86 => Chấp nhận giả thiết H [ Nơi làm việc ] Kết luận: Sinh viên: Nguyễn Hoàng Minh
  16. BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ – 16 NHÓM 3 Chỉ có Ngành nghề ảnh hưởng đến thu nhập trung bình. Sinh viên: Nguyễn Hoàng Minh

nguon tai.lieu . vn

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINHTRƯỜNG ĐẠI HỌC BÁCH KHOA TPHCMBÀI TẬP LỚN XÁC SUẤT THỐNG KÊGiáo viên hướng dẫn: Nguyễn Bá ThiSinh viên: Trần Đức ThắngMSSV: 1413677Nhóm: 6NHÓM 61CÂU 1I.ĐỀ BÀIBảng sau đây cho ta phân bố thu nhập của hai nhóm tuổi : Nhóm từ 40-50 tuổi vànhóm từ 50-60 tuổi trong số các công nhân lành nghề ở Thụy Điển năm 1930.NhómtuổiThu nhập0-11-22-33- 44-6>=640-507143010721609117815850-60543248941202903112Có sự khác nhau về tỷ lệ thu nhập giữa hai nhóm tuổi này trong số các công nhânlành nghề hay không?Mức ý nghĩa a = 5%.II.Dạng bài- So sánh tỷ số [ Kiểm định tỷ lệ ]III.Phương pháp giảiGiả thiếtH0 : P1 = P1,0 ,… ,Pk,0 ⇔" Các cặp Pi và Pi,0 giống nhau"H1:"Ít nhất có một cặp Pi và Pi,0 khác nhau"Giá trị thống kêOi - Các tần sô thực nghiệm [Observed Frequency]Ei - Các tần số lý thuyết [Expacted Frequency]Biện luậnNếu χ2> χα2 => Bác bỏ giả thiết H0 [DF = k-1]- Giá trị χ2 theo hàm CHITEST qua biểu thức :2Oij - tần số thực nghiệm của ô thuộc hàng i cột jEij - tần số lý thuyết của ô thuộc hàng i cột j ,r- số hàngc- số cột- Xác suất P [ X > χ2 ] với bậc tự do DF = [ r-1][c-1]*Trong đór - số hàng ,c - số cột trong bảng ngẫu nhiên[contingency table]Nếu P [ X > χ2 ] > α => chấp nhận giả thiết H0 và ngược lạiIV.CÔNG CỤ GIẢIÁp dụng MS -EXCEL+ sử dụng hàm tính tổng Sumvà CHITESTV.KẾT QUẢ VÀ CÁCH TÍNHGiả thiết tỉ lệ hai nhóm tuổi là như nhau a = 5%- Số liệu nhập vào Tính các tổng số:+ Tổng hàng : chọn H14 và nhập =SUM[B14:G14]Dùng con trỏ kéo nút tự điền từ H14 đến H15+ Tổng cột : chọn B16 và nhập =SUM[B14:B15]Dùng con trỏ keos nút tự điền từ B16 đến G16+ Tổng cộng : chọn H16 và nhập =SUM[H14:H15]Số liệu xuất ra :Ta có bảng tần số thực nghiệm3Tính các tần số lý thuyết:Tần số lý thuyết = [ tổng hàng*tổng cột ]/tổng cộngNhóm 40 – 50 : chọn B19 và nhập =H14*B16/H16Chọn C19 và nhập = H14*C16/H16Chọn D19 và nhập =H14*D16/H16Chọn E19 và nhập =H14*E16/H16Chọn F19 và nhập =H14*F16/H16Chọn G19 và nhập =H14*G16/H16Nhóm 50 – 60 : chọn B20 và nhập =H15*B16/H16Chọn C20 và nhập = H15*C16/H16Chọn D20 và nhập =H15*D16/H16Chọn E20 và nhập =H15*E16/H16Chọn F20 và nhập =H15*F16/H16Chọn G20 và nhập =H15*G16/H16Ta được bảng tần số lý thuyết:Áp dụng hàm số CHITESTChọn B22 và nhập = CHITEST[B14:G15,B19:G20]4Ta được kết quả P[X > X 2 ]Biện luận : P[X> X 2 ]= 0.511582 > 0.05 = a Chấp nhận H0VI.KẾT LUẬNKhông có sự khác nhau về tỷ lệ thu nhập giữa hai nhóm tuổi này trong số cáccông nhân lành nghề5CÂU 2I.ĐỀ BÀITrước một chiến dịch quảng cáo, tỷ lệ phòng có khách ở trong một khách sạnđược theo dõi ngẫu nhiên trong 15 ngày và thu được kết quả là 86 92 83 88 79 8190 76 80 91 85 89 77 91 và 83 phần trăm.Sau khi kết thúc chiến dịch quảng cáongười ta theo dõi tỷ lệ này trong 15 ngày và thu được kết quả là 88 94 97 99 89 9392 98 89 90 97 91 87 80 và 96 phần trăm. Giả sử tỷ lệ phòng có khách là phân phốichuẩn. Hãy ước lượng với độ tin cậy 95% tỷ lệ phòng có khách trước và sau chiếndịch quảng cáo. Với mức ý nghĩa 5% hãy cho ý kiến là chiến dịch quảng cáo cóthành công hay không ?II.DẠNG BÀI+ Ước lượng trung bình+ So sánh trung bình với từng cặp dữ liệuIII.PHƯƠNG PHÁP GIẢI Ước lượng trung bình:Giá trị trung bình: x̅=∑ni=1 xinGiới hạn tin cậy: 𝑡𝛼 . 𝑆𝑥̅ So sánh trung bình với dữ liệu từng cặp:Trong trường hợp hai mẫu nhỏ [ N < 30 ] phụ thuộc [ ví dụ : kết quả của mộtnhóm chuột được xét nghiệm máu hai lần – trước và sau khi uống thuốc – haymột nhóm bệnh nhân trải qua hai thí nghiệm – được thử thuốc trên tay này vàđược thử thuốc trên tay kia ] và không giả định rằng phương sai của hai mẫu bằngnhau, bạn có thể áp dụng trắc nghiệm t để so sánh giá trị trung bình của hai mẫudữ liệu tương ứng từng cặp.Giả thiếtTương tự trường hợp “hai mẫu với phương sai biết trước”Giá trị thống kêDi = Xi − Yi [ i = 1,2, … N ]6̅=D∑Ni=1 DiN̅ ]2∑N[Di − DSD = √ i=1[N − 1]t=̅ − μDDSD /√N=̅DSD /√Ncó phân phối student với γ = N − 1Biện luậnNếu |t| < t α hay t α [ γ = N − 1] ⇒ Chấp nhận giả thiết H02IV.CÔNG CỤ GIẢI.Sử dụng MS-EXCEL+ Ước lượng trung bình: Dùng chương trình Descriptive Statistics để tìm trungbình [mean] và giới hạn tin cậy [Confidence Level]+ So sánh trung bình với dữ liệu từng cặp: Dùng chương trình “t-TEST: PAIREDTWO SAMPLE FOR MEANS” để tìm tiêu chuẩn kiểm định [t Stat] và phân vị haiphía [t Critical two-tail]VI.KẾT QUẢ VÀ CÁCH TÍNH1.Ước lượng trung bình:Nhập vào bảng số liệu :7Thiết lập bảng Descriptive Statistics+ Data Data Analysis  Descriptive Statistics+ Input range [ phạm vi đầu vào ] :$A$9:$B$24+ Grouped By : columns+ Confidence Level for Mean : 95%8Ta có bảng số liệu xuất ra:9Khoảng ước lượng:Trước QCCáchtínhKết quảSau QCE11E11+E26 G11-G26 G11+G26E2681.7698 87.69687 89.17626 94.823742. So sánh trung bình với dữ liệu từng cặpThiết lập bảng t-Test:Paired Two Sample for Means+ Data Data Analysis  t-Test:Paired Two Sample for MeansTa nhập dữ liệu đầu vào như bảng với α = 0.0510Ta có bảng số liệu xuất raGiả thiết :H0 : μ1 = μ2 Chiến dịch quảng cáo không thành côngVì |t|=3,5399 > tα/2=2,1448 nên bác bỏ giả thiết H0VI.KẾT QUẢChiến dịch quảng cáo thành công11CÂU 3I.ĐỀ BÀITuổi X và huyết áp Y của bệnh nhân trẻ em [dưới 14 tuổi], chọn ngẫu nhiên được chotrong bảng sau đây:X 14 1 97912 1 3 14 1 97912 1 3Y 100 83 112 152 104 90 92 85 110 73 132 122 134 98 82 65Tính tỷ số tương quan,hệ số tương quan và hệ số xác định của Y đối với X. Với mứcý nghĩa α =5%, có kết luận gì về mối tương quan giữa X và Y [Có phi tuyến không ?Có tuyến tính không ?]? Tìm đường hồi quy tuyến tính của Y đối với X.Tính sai số tiêu chuẩn của đường hồi quy.II.DẠNG BÀIPhân tích tương quanHồi quy tuyến tínhIII.PHƯƠNG PHÁP GIẢIPhân tích tương quanHệ số tương quan dùng để đo mức độ phụ thuộc tuyến tính giữa hai ĐLNN , tuynhiên chưa có một chỉ tiêu để đo mức độ phụ thuộc nói chungHệ số tương quan giữa X và Y rất bé thậm chí bằng không thì giữa X và Y vẫn cómột mối quan hệ phi tuyến tính rất chặt chẽVậy để đo mức độ phụ thuộc của đại lượng ngẫu nhiên Y và đại lương ngẫunhiên X người ta đưa ra khái niệm tỷ số tương quanHệ số tương quan : R =SXY√SXX SYY=̅̅∑ni=1[Xi −X][Yi −Y]̅ ]2 ∑n [Y −Y̅ ]2√∑n [Xi −Xi=1i=1 i12Hệ số tương quan dùng trong việc đánh giá mức độ liên quan+Nếu R < 0.7 thì mức độ liên quan nghèo nàn+Nếu |R|nằm trong khoảng 0.7 – 0.8 thì mức độ liên quan khá+Nếu |R| nằm trong khoảng 0.8 – 0.9 thì mức độ liên quan tốt+Nếu |R|< 0.9 thì mức độ liên quan xuất sắcHệ số xác định : R2Tỷ số tương quan được lý giải như là tỷ lệ biến động của Y do có sự phụ thuộc củaY và XHồi quy đơn tuyến tínĥX = B0 + BXPhương trình tổng quát: Y𝐵0 = 𝑌̅ − 𝐵𝑋̅𝐵=∑ 𝑋𝑖 𝑌𝑖 − ∑ 𝑋𝑖 𝑌𝑖 /𝑁∑ 𝑋𝑖2 − 𝑁[𝑋̅]2Với Y- Biến số phụ thuộc [ dependent/reponse variable ]X-biến cố độc lập [ independent/ predictor variable ]𝐵0 và B – các hệ số hồi quy [ regression coeficents ]Độ lệch chuẩn [ Standard Error ]:1𝑆=√∑[𝑌𝑖 − 𝑌′𝑖 ]2𝑁−2Kiểm định hệ số phương trình hồi quy tuyến tính:Giả thiết: H0 : βi = 0 hệ số hồi quy không có ý nghĩaH1 : βi ≠ 0 hệ số hồi quy có ý nghĩa+ Sử dụng kiểm định t [ phân phối Student]ti =|Bi −βi |√S2nS2với Sn2 = ∑[X̅]i −X213Phân phối Student : γ = N − 2Nếu ti < tα [N-2] thì chấp nhận H0 và ngược lại+ Sử dụng kiểm định F [ phân phối Fischer]Giả thiết: H0 : βi=0 phương trình hồi quy không thích hợpH1 : βi ≠ 0 phương trình hồi quy thích hợp̅ ]2∑[Y′i − Y′F=∑[Yi − Y′i ]2 ⁄[N − 2]Phân phối fischer : v1=1 và v2 = N-2Nếu F < Fα[1,N-2] thì chấp nhận H0 và ngược lạiIV.CÔNG CỤ GIẢI+ Phân tích tương quan : sử dụng chương trình Correlation để tìm hệ số tươngquan+ Hồi quy đơn tuyến tính : sử dụng chương trình RegressionV.KẾT QUẢ VÀ CÁCH TÍNH1.PHÂN TÍCH TƯƠNG QUAN TUYẾN TÍNHSố liệu nhập vào :14Thiết lập bảng CorrelationData  Analysis CorrelationInput range: phạm vi đầu vào [$A$9:$B$25]Grouped by: nhóm dữ liệu theo hàng hoặc cột [ chọn Column – cột ]Labels in Firt Row : gắn nhãn ở hàng đầu tiên [ chọn ]Chọn New worksheet Ply [ hiện trong bảng tính mới ]15Dữ liệu đầu raHệ số tương quan R=0,466627Hệ số xác định R2 = 0.218Giả thiết : X và Y không tương quan tuyến tínhTính toán:n =16T=R√n − 2√1 − R2Suy ra T = 1.973631647Phân phối Student với α =0.05 và bạc tự do n-2=14Tra bảng ta có c=2.145 [=TINV[0.05,14] ]|𝑇| < c nên chưa có cơ sở để bác bỏ H0 -> chấp nhận H0Vậy X Y không có tương quan tuyến tính2.PHÂN TÍCH TƯƠNG QUAN PHI TUYẾNSắp xếp lại bảng số liệuXY173828392365857122152910411213213412909814100110Mở data analysis -> Anova :single Facter16+ Input Range [ Phạm vi đầu vào ] : $K$34$F$54+ Grouped by [ Nhóm dữ liệu theo hàng hoặc cột ] : Column+ Labels in Firt Row [ gắn nhãn ở hàng đầu tiên ] : chọnOuput Range [ phạm vi đầu ra ] : $B$44Ta có bảng đầu ra :17Biện luậnn =16 , k = 6Tổng bình phương các nhóm SSF = 6943.75Tổng bình phương nhân tố SST = 8515.75SSF6943.75η2Y/X = SST = 8515.75 = 0.815401= > Tỷ số tương quan 𝜂𝑌/𝑋 = 0.903η2Y/X − r 2 = 0.685[η2Y −r2 ][n−k]=>F=X[1−η2Y ][k−2]=8.094031X18Ta có : phân bố Fischer với 𝛼 = 0.05 và [k-2,n-k] = [ 4,10 ]Tra bảng c =FINV[𝜶,k-2,n-k] =FINV[0.05,4,10] = 3.47805Giả thiết : H1 : X Y không có tương quan phi tuyếnTa có : F = 8.094031 > c = 3.47805  Bác bỏ giả thiết H1Vậy X với Y có tương quan phi tuyến3.TÌM ĐƯỜNG HỒI QUY CỦA Y ĐỐI VỚI XNhập lại bảng tínhThiết lập bảng Regression :+ Data Data Analysis  regression+ Input Y Range [ phạm vi đầu vào Y ] : $B$70:$B$85+ Input X Range [ phạm vi đầu vào X ] : $A$70:$A$85+ Labels [thêm nhãn dữ liệu ]19+Output Range [ Phạm vi đầu ra ] : $A$87+ Line Fit Plots [Vẽ đồ thị ]Dữ liệu xuất ra :20+ Hệ số góc : 2.335294+ Hệ số tự do : 85.77794 Vậy Y = 2.335294.X + 85.77794Độ lệch chuẩn [ Standard Error ] : S = 21.81337478Sai số tiểu chuẩn của đường hồi quy tuyến tính : S 2 = 475.82332Giả thiết : Ho : Hệ số hồi quy không có ý nghĩa+ t o = 8.6510546 > t 0.05 [14] = 2.145Hay : giá trị P của hệ số tự do [p-value] : 5.45E-7 <  = 0.05  bác bỏ giả thiết Ho Hệ số tự do có ý nghĩa thống kê+ t1 = 1.9740502 < t 0.05 [14] = 2.145Hay Giá trị P của hệ số góc [p-value]: 0.068444 >  = 0.05  chấp nhận giả thiết Ho hệ số góc không có ý nghĩa thống kê21Giả thiết : H1 : phương trình hồi quy không thích hợpSignificance F = 0.068444 >  = 0.05⟹ Chấp nhận giả thiết H1Vậy hệ số góc 2.335294 của phương trình hồi quy Y = 2.335294.X + 85.77794không có ý nghĩa thống kê ,nói cách khác phương trình này không thích hợpVI.KẾT QUẢ+ Tỷ số tương quan : Y / X = 0.903+ Hệ số tương quan : r = 0,466627+ Hệ số xác định : r2 = 0,217741+ X và Y không có tương quan tuyến tính với mức ý nghĩa 5%+ Phương trình đường hồi quy tuyến tính Y = 2.335294X + 85.77794 là không thíchhợp.22CÂU 4I.ĐỀ BÀIHãy phân tích tình hình kinh doanh của một số ngành nghề ở 4 quận nội thànhtrên cơ sở số liệu vè doanh thu trung bình như sau :Ngành nghề kinh doanhKhu vực kinh doanhQ1Q2Q3Q4Điện lạnh5.73.14.45.0Vật liệu xây dựng5.015.09.517.5Dịch vụ tin học3.81.81.34.8Mức ý nghĩa 10%II.DẠNG BÀIPhân tích phương sai hai nhân tố [ không lặp ]III.PHƯƠNG PHÁP GIẢISự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quansát Yij [ i =1.2…r : yếu tố A ; j = 1.2…c : yếu tố B ]Mô hìnhYếu tố ATổng cộngtrung bìnhYếu tố B1Y11Y21…Yr12Y12Y22…Yr2……………cY1cY2c…YrTổngcộngY1Y2…YrT.1̅Y̅̅.1̅T.2̅Y̅̅.2̅……T.c̅̅̅Y.cT...Y̅..TrungbìnhY̅1̅̅̅Y2…Y̅r23Bảng ANOVANguồn sai sốBậc tự doYếu tố A [ hàng ][r-1]Tổng số bình phươngrTi 2 T 2SSB = ∑−crcBình phương Giá trị thống kêtrung bìnhSSBMSBMSB=FR =[r−1]MSEi=1Yếu tố B [ cột ]Sai số[c-1][r-1] [c-1]rTj 2 T 2SSB = ∑−rrcj=1SSFMSF =MSB=[c−1]SSBFC =[r−1]SSE = SST-[SSF+SSB]Tổng cộng[rc-1]rcSST = ∑ ∑ Yiji=1 j=12T. .2−rTrắc nghiệmGiả thiết :H0 : μ1 = μ2 =… μk  “các giá trị trung bình bằng nhau”H1 : μ1 ≠ μ2  “ Ít nhất hai giá trị trung bình khác nhau” Giá trị thống kê :FR =MSBMSEvàMSFMSE Biện luận :FC =24MSFMSE+ Nếu FR < Fa [r-1,[r-1][c-1]]  chấp nhận giả thiết H0 [ yếu tố A ]+ Nếu FC < Fa [c-1,[r-1][c-1]]  chấp nhận giả thiết H0 [ yếu tố B ]IV.CÔNG CỤ GIẢI.Sử dụng MS-EXCELDùng lệnh ‘’Anova : Two-Factor Whithout Replication ‘’VI.KẾT QUẢ VÀ CÁCH TÍNHGiả thiết Ho : Các giá trị doanh thu trung bình bằng nhauNhập vào bảng số liệu :Thiết lập bảng : Anova Two Factor Without ReplicationDataData Analysis Anova Two Factor Without Replication+ phạm vi đầu vào [ Input Range] : $A$9:$E$12+ nhãn dữ liệu [ Labels in First Row/Column]+ Alpha:0.1+ phạm vi đầu ra [ Ouput range ] : $A$1425

Video liên quan

Chủ Đề