Hướng dẫn giải thống kê cho khoa học xã hội năm 2024

Download Free DOCX

Free DOCX

Download Free PDF

BÀI TẬP THỐNG KÊ CHO KHOA HỌC XÃ HỘI

BÀI TẬP THỐNG KÊ CHO KHOA HỌC XÃ HỘI

BÀI TẬP THỐNG KÊ CHO KHOA HỌC XÃ HỘI

BÀI TẬP THỐNG KÊ CHO KHOA HỌC XÃ HỘI

BÀI TẬP THỐNG KÊ CHO KHOA HỌC XÃ HỘI

Linh Nguyễn Duy

Bạn đang ở:Trang chủ / Lưu trữ choThống kê cho khoa học xã hội ULIS

Đề thi Thống kê cho khoa học xã hội đề số 1 kỳ 1 năm học 2020-2021 – ULIS TẢI TÀI LIỆU XUỐNG

Đề thi Thống kê cho khoa học xã hội kỳ 2 năm học 2019-2020 – ULIS TẢI TÀI LIỆU XUỐNG

Đề thi Thống kê cho khoa học xã hội đề số 1 kỳ 2 năm học 2018-2019 – ULIS TẢI TÀI LIỆU XUỐNG

Đề thi Thống kê cho khoa học xã hội năm học 2016-2017 – ULIS TẢI TÀI LIỆU XUỐNG

Đề thi Thống kê cho khoa học xã hội đề số 2 kỳ 2 năm học 2015-2016 – ULIS TẢI TÀI LIỆU XUỐNG

Đề thi Thống kê cho khoa học xã hội kỳ 2 năm học 2014-2015 – ULIS TẢI TÀI LIỆU XUỐNG

Ví dụ: dân số VN, tổng thể sinh viên của trường ĐH KHXH và NV hay tổng số sinh viên của một khoa Ví dụ: Chủ đề về thực trạng bỏ học của sinh viên trường Nhân văn TP HCM

  • Đối tượng nghiên cứu: thực trạng bỏ học
  • Khách thể nghiên cứu: học sinh, học sinh bỏ học

● MẪU[ SAMPLE]: là tập hợp con của tổng thể được chọn ra để tiến hành thu thập dữ liệu nghiên cứu. Khi mẫu được chọn đảm bảo tính đại diện, sẽ có thể sử dụng để suy rộng ra các đặc trưng của tổng thể=> nghiên cứu dân số thì dựa trên nghiên cứu tổng thể. Ví dụ: 1 công ty nghiên cứu thị trường tiến hành khảo sát 650 người tiêu dùng để thu thập thông tin về thị hiếu dùng sữa của người dân thành phố HCM ● BIẾN[ VARIABLE]: là tập hợp các đặc trưng và giá trị được dùng để chỉ một khái niệm Ví dụ: Biến giới tính[ có 2 giá trị nam, nữ] Biến tôn giáo[ bao gồm Phật giáo, Thiên chúa giáo, Tin lành, Hòa Hảo, khác và không tôn giáo] Biến nghề nghiệp[ làm nông, kinh doanh buôn bán, nghề nghiệp chuyên môn, nghề nghiệp hành chính văn phòng, nghề khác] ● ĐỊNH ĐỀ[ PROPOSITION]: là một phát biểu về mối liên hệ giữa một khái niệm Ví dụ: hút thuốc lá dẫn đến ung thư phổi, hay quan hệ tình dục không an toàn dẫn đến nguy cơ nhiễm HIV/ AIDs Ví dụ: Uống rượu bia tham gia giao thông gây tai nạn giao thông, xả rác bừa bãi gây ô nhiễm môi trường Mì gói-> mua sắm nhiều Black Friday-> hết tiền

● BIẾN ĐỘC LẬP[ INDEPENDENT VARIABLE]: là biến được dùng để giải

★ 7/12/

1. KHÁI NIỆM :

  • Khái niệm chọn mẫu[ sample sampling]: Là quá trình chọn một số lượng nhỏ những đơn vị nghiên cứu từ một quần thể[ dân số] nghiên cứu xác định
  • Dung lượng mẫu/ quy mô mẫu: là tập hợp các đơn vị mẫu được chọn. Phương pháp chọn mẫu sẽ quyết định cách NNC kết luận các kết quả nghiên cứu[ có đại diện cho tổng thể được không, đại diện mức độ nào]
  • Tuy nhiên thông tin cá nhân có thể không được cung cấp=> phải chấp nhận.

Mẫu nằm trong tổng thể, là 1 phần tổng thể, mẫu được chọn ra có khả năng đại diện cho tổng thể có mang đặc điểm đặc trưng đại diện cho tổng thể.

Mẫu nằm trong tổng thể, là 1 phần tổng thể, được chọn ra từ tổng thể, nhưng không rõ được chọn ra như thế nào, nên không đại diện cho tổng thể.

Mỗi đơn vị được chọn ra phải là một cá nhân. Cá nhân chính là đối tượng/ người trả lời. Tập hợp mẫu là “cá nhân” khác gì với con số?? Số thì có thể có số nguyên và thập phân, người thì chỉ có số nguyên

  • Nguyên tắc thống kê đòi hỏi một mẫu có giá trị khi mẫu đó có kích thước đủ lớn[ đủ cỡ mẫu] và mẫu đại diện cho dân số[ n>=30]
  • Mục tiêu chọn mẫu: phản ánh chính xác đặc điểm của tổng thể
  • Không khẳng định, kết luận cho tổng thể nếu chọn mẫu không đúng, mẫu không mang tính đại diện cho tổng thể[ phi xác suất] mà chỉ đúng với nhóm khách thể đã khảo sát.
  • Tổng thể[ population]: là tập hợp các đối tượng có chung đặc điểm mà chúng ta muốn áp dụng kết quả nghiên cứu.
  • Mẫu[ sample]: Tập hợp những đối tượng được khảo sát có hệ thống nhằm ước lượng đặc trưng của dân số đích

-

  • Khối dân cư mục tiêu: trong nghiên cứu cần có cùng một vấn đề

nhưng có nhiều nhóm khác nhau có thể cung cấp cho mình thông tin.

  • Khối dân cư lấy mẫu: là khối dân cư từ đó một nhóm mẫu cụ thể được chọn dựa trên khung mẫu. Về mặt thực nghiệm, khung mẫu chính là đại diện tổng thể. VD: danh sách sinh viên của các trường thành viên ĐHQG. Danh sách sinh viên lớp TKCKHXH 04
  • Khung mẫu[ sampling frame]: tập hợp của những đơn vị nghiên cứu hơn . dân số
  • Ví dụ: Nghiên cứu về thực trạng về tình dục trước hôn nhân của sinh viên đại học quốc gia
  • Khối dân cư mục tiêu: Chọn những nhóm có liên quan đến thực trạng trên:
  • SV[ chủ thể]
  • Phụ huynh[ thái độ của PH giả sử nếu có chuyện đó, cách xử lý, cách giáo dục của PH về TD, cách chia sẻ của PH với SV với các vấn đề trong cuộc sống]
  • QLSV/ GVCN/ CVHT[ thực trạng, tư vấn cho các bạn về tâm tư tình cảm]
  • Chủ nhà nghỉ theo giờ/ khách sạn
  • Bác sĩ phụ sản/ nhân viên y tế=> nơi nào, ai có thể hỗ trợ giải quyết
  • Khối dân cư lấy mẫu: Sinh viên của các trường thành viên ĐHGQ
  • Tổng thể: Toàn bộ 100 sinh viên đại học quốc gia
  • Mẫu: sinh viên
  • Chọn mẫu: mẫu xác suất, phương pháp chọn mẫu ngẫu nhiên
  • Dung lượng/ quy mô mẫu: 1000 sinh viên

QUÁ TRÌNH CHỌN MẪU

-

-

3. PHƯƠNG PHÁP CHỌN MẪU :

Chọn mẫu xác suất Chọn mẫu phi xác suất Ngẫu nhiên đơn giản[ simple random]

Lấy mẫu thuận tiện[ convenience] Hệ thống[ systematic] Lấy mẫu phán đoán[ judgment] Phân tầng[ stratified random] Lấy mẫu tăng nhanh[ viên tuyết lăn] Theo nhóm/ cụm[ cluster] Lấy mẫu chi tiêu

  1. Chọn mẫu xác suất: 3.1. Ngẫu nhiên đơn giản:
  2. Ưu điểm:
  3. Biết trước xác suất xuất hiện của các phần tử vào trong mẫu
  4. Quá trình chọn mẫu tuân theo quy luật toán, không thể tự ý thay đổi
  5. Các thông số của mẫu có thể dùng để ước lượng/ kiểm nghiệm các thông số của tổng thể
  6. Nhược điểm:
  7. Trong nhiều trường hợp không mang tính khả thi vì không thể có được danh sách tất cả các đối tượng liên hệ, hoặc nhà nghiên cứu không đủ thời gian để tiếp cận các đối tượng khi họ phân tán ở nhiều địa bàn cách xa nhau. 12 cung hoàng đạo. Mỗi dấu chấm đánh dấu sự bắt đầu cách nhau 30 độ. Giao điểm của đường xích đạo và hoàng đạo xác định các phân điểm. VD Bạch Dương và Thiên Bình.
  8. Phương pháp lấy mẫu mà mọi đơn vị lấy mẫu đều được chọn vào mẫu nghiên cứu với xác xuất bằng nhau và độc lập với việc chọn đơn vị lấy mẫu khác.
  9. Ví dụ: Rút thăm, lô tô, bảng số ngẫu nhiên, tờ tiền, vé số, phần mềm,... 3.1. Mẫu ngẫu nhiên hệ thống:
  10. Cứ phần tử thứ k tiếp sau phần tử đầu tiên được chọn ngẫu nhiên từ danh sách
  11. [ bước nhảy] k= N/n 3.1. Mẫu phân tầng:
  12. Mẫu phân tầng: phải biết thông tin về tổng thể, phân biệt theo đặc tính, xếp vào từng tầng khác nhau
  13. Ví dụ: chọn khảo sát Nhân văn, phân tầng theo giới tính[ ¾ nữ và ¼ nam], diện cư trú[ ⅓ thường trú, ⅔tạm trú]
  14. Các cá thể trong mỗi tầng đều đồng nhất

3.1. Mẫu cụm/ Nhiều giai đoạn:

  • Gần giống với mẫu phân tầng khác với phân tầng ở chỗ không có khung mẫu cụ thể. “Cụm” là những khối dân cư không đồng nhất
  • Việc chọn những nhóm các đơn vị nghiên cứu[ các cụm] thay cho việc chọn các nhân những đơn vị nghiên cứu được gọi là mẫu cụm. Các cụm thường là những đơn vị địa lý[ như, các huyện, các làng] hoặc những đơn vị tổ chức[ như, các phòng khám, những nhóm đào tạo].
  • Chọn mẫu cụm theo 2 bước:
  • Chọn cụm/ chọn cá thể trong cụm
  • Chọn mẫu cụm nhiều bước[ giai đoạn]
  • Ví dụ: Để lấy danh sách 15000 SV thì khó và số lượng nhiều quá, NNC tiến hành chọn mẫu cụm: liệt kê danh sách 30 khoa bộ môn[ có thể lấy thông tin trên website], chọn ngẫu nhiên đơn giản/ hệ thống mấy khoa/ bộ môn, từ đó chọn tiếp lớp đại diện của mỗi khoa. Sau đó xin danh sách cụ thể của lớp đó[ khung mẫu cụ thể]. Cách này thường được sử dụng nhất.
  • Ưu điểm:
  • Chi phí thấp
  • Không yêu cầu danh sách của cả tổng thể, chỉ cần danh sách cụm, tiểu cụm
  • Sử dụng khi tổng thể quá lớn
  • Hạn chế:
  • Sai số lớn hơn
  • Chọn mẫu phi xác suất:
  • Nhà nghiên cứu chọn các phần tử vào mẫu không theo quy luật ngẫu nhiên, các phần tử không có cơ hội ngang nhau trong việc được lựa chọn
  • Không biết xác xuất hiện của các phần tử
  • Chọn mẫu tùy thuộc vào nhà nghiên cứu
  • Mẫu phi xác suất[ mang tính chủ quan của nhà nghiên cứu] dùng nhiều trong nghiên cứu định tính, phản ánh chiều sâu của vấn đề[ vấn đề NC nhạy cảm, riêng tư], thường là khởi điểm cho 1 nghiên cứu khác[ khai phá]
  • Ví dụ đến siêu thị phỏng vấn các bà nội trợ về chi tiêu hàng ngày cho lương thực
  • Nhược điểm: Việc chọn mẫu phải dựa vào kỹ năng của nhà nghiên cứu hay của nhân viên chọn mẫu.
  • Mẫu thuận tiện: Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ

lấy thông tin. VD: phỏng vấn các bà nội trợ tại các siêu thị để tìm hiểu về hành vi tiêu dùng của người nội trợ

  • Mẫu phán đoán: Nhà nghiên cứu tự phán đoán sự thích hợp của các phần tử để mời họ tham gia vào mẫu. Đặc điểm giống như chọn mẫu thuận tiện, nếu khả năng/ kinh nghiệm phán đoán tốt sẽ cho mẫu tốt hơn thuận tiện.
  • Mẫu chỉ tiêu: ấn định số lượng, tiêu chí chọn mẫu
  • Mẫu tăng nhanh/ viên tuyết lăn: người trả lời đồng thời là người tìm người trả lời tiếp theo, nghiên cứu nhạy cảm, khó tiếp cận mẫu.

5ừ 3 triệu trở lên 5ệ hơn nhiều

  • Thang đo thứ bậc[ ordinal scale] đo lường những dữ liệu được sắp xếp theo thứ tự, chẳng hạn như thứ bậc của sinh viên trong lớp học là thứ nhất, thứ hai, thứ ba và thứ tư tùy thuộc vào điểm trung bình học tập của họ. Tuy nhiên, giá trị thực tế hoặc giá trị tương đối của các thành phần hay sự khác biệt trong giá trị của các thành phần không thể được đánh giá. Ví dụ, thứ hạng của các học sinh trong lớp không nói lên điểm trung bình cụ thể của họ. Thang đo khoảng cách[ interval scale]
  • Là thang đo có đầy đủ tính chất của một thang đo danh nghĩa và thứ bậc, nhưng khoảng cách giữa các chỉ số được xác định một cách cụ thể và đều nhau
  • Đối với loại thang đo này ta có thể sử dụng một số các phép tính toán học như tính trung bình hay tính toán tỉ lệ chênh lệch giữa các chỉ số
  • Điểm “không” của thang đo này là tùy ý
  • Phát biểu “Những người có học vấn cao sẽ có thu nhập cao” 1 2 3 4 5 6 7 Rất không rất đồng ý đồng ý
  • Thang đo này thường được sử dụng nhiều cho các phân tích chuyên sâu về định lượng như: Phân tích nhân tố[ EFA] hoặc Hồi quy tuyến tính.

Thang đo tỉ lệ[ ratio scale] - Một thang đo tỉ lệ có tất cả những phẩm chất của những loại thang đo

trước. Ngoài ra thang đo này có một giá trị 0 “thực”. Số 0 có thực.

  • Thu nhập trung bình hàng tháng: 5.
  • Năm sinh:...
  • Nơi đi:...
  • Điểm đến:...
  • Đây là thang đo dùng để khai thác dữ liệu theo cách cụ thể nhất
  • Đối với các nghiên cứu KHXH, thang đo này thường được xử lý câu trả lời trước khi tiến hành phân tích dữ liệu

Đo lường trong thống kê mô tả

  • Biến Định lượng:
    • Đo lường độ tập trung: Trung bình[ Mean], trung vị[ medium] và yếu vị[ mode].
    • Đo lường độ phân tán: Khoảng[ Range], phương sai[ Variance] và độ lệch chuẩn[ Standard devitation].
  • Biến Định tính:
    • Tần số[ frequency]
    • Tỷ lệ[ proportion/ percentage]
    • Đo lường độ phân tản: Giá trị IQV
  • Dữ liệu thô:
  • PHƯƠNG PHÁP THỐNG KÊ MÔ TẢ DƯỚI DẠNG BẢNG :
  • Bảng Phân phối tần suất liên hệ:
  • 1 bảng trình số lần xuất hiện của một hay nhiều giá trị được quan sát trong mẫu hoặc tổng thể
  • Các kiểu phân phối tần suất
    • Thô[ raw]
    • Liên hệ[relative]: tỉ lệ[ proportion] và phần trăm[ percent]
    • Lũy tiền[ cumulative]
  • Một số ký hiệu sử dụng trong tính toán phân phối tần suất
    • n= tổng số mẫu quan sát
    • X= biến
    • i= giá trị[ thành phần] của biến X
    • fi= tần suất quan sát của giá trị i
  • Bảng phân phối tần suất thô
  • Bảng phân phối tần suất liên hệ
  • Bảng phân phối tần suất lũy tiền

★ 21/12/

  1. Bảng phân phối tần suất thô
  2. Bảng phân phối tần suất liên hệ
  3. Bảng phân phối tần suất lũy tiền

5. PHƯƠNG PHÁP PHÂN TỔ DỮ LIỆU

  • Khi phân tổ dữ liệu, tùy theo mục đích thể hiện dữ liệu cũng như phân bố đều đặn hay không đều đặn của dữ liệu mà có thể tiến hành phân tổ đều hoặc phân tổ không đều.
  • Khái niệm đều hoặc không đều liên quan đến khái niệm khoảng cách của tổ
  • Chênh lệch giữa giới hạn dưới và giới hạn trên là trị số khoảng cách tổ
  • Các bước phân tổ
  • Xác định số tổ cần chia: k Không có một con số quy định chính xác con số cần chia[ k] là bao nhiêu, nhưng theo kinh nghiệm người ta thấy nên chia trong khoảng từ 5 đến dưới 15 tổ Với n là số quan sát của tập dữ liệu, ta có công thức:

Xác định trị số khoảng cách tổ: h Căn cứ trên số tổ định chia, người ta xác định trị số khoảng cách tổ

Chủ Đề