Bộ số 1

Câu 1

Một nhà xã hội học muốn nghiên cứu mối quan hệ giữa mức độ giáo dục (ví dụ: tiểu học, trung học, đại học) và mức độ hài lòng với công việc. Dữ liệu về mức độ giáo dục thuộc loại nào?

Câu 2

Trong thống kê mô tả, 'range' (biên độ) của một tập dữ liệu được tính như thế nào?

Câu 3

Một nhà kinh tế đang nghiên cứu mối quan hệ giữa thu nhập và chi tiêu. Ông thu thập dữ liệu về thu nhập và chi tiêu của 50 hộ gia đình. Ông quyết định sử dụng hồi quy tuyến tính để mô hình hóa mối quan hệ này. Biến nào trong trường hợp này thường được coi là biến phụ thuộc?

Câu 4

Trong thống kê mô tả, 'mode' (yếu vị) của một tập dữ liệu là gì?

Câu 5

Giả sử bạn đang thực hiện một cuộc khảo sát và nhận được phản hồi từ 80% số người được hỏi. Tỷ lệ 80% này được gọi là gì trong thống kê?

Câu 6

Khi phân tích dữ liệu từ một cuộc khảo sát, bạn nhận thấy rằng phần lớn người trả lời nghiêng về một phía của thang đo Likert (ví dụ: đa số chọn 'hoàn toàn đồng ý'). Điều này có thể dẫn đến hiện tượng gì trong phân phối dữ liệu?

Câu 7

Một nhà nghiên cứu muốn đánh giá hiệu quả của một chương trình đào tạo mới bằng cách so sánh điểm kiểm tra của nhân viên trước và sau khi tham gia chương trình. Phương pháp thống kê nào phù hợp nhất cho tình huống này?

Câu 8

Trong thống kê mô tả, khi nào chúng ta sử dụng trung vị thay vì trung bình cộng để đo lường xu hướng trung tâm?

Câu 9

Một nhà nghiên cứu muốn kiểm tra xem liệu có sự khác biệt có ý nghĩa thống kê về điểm thi trung bình giữa hai nhóm sinh viên học theo phương pháp A và phương pháp B hay không. Phương pháp thống kê nào phù hợp nhất để phân tích dữ liệu này?

Câu 10

Khi nào chúng ta nên sử dụng 'IQR' (Interquartile Range - Khoảng tứ phân vị) thay vì 'standard deviation' (độ lệch chuẩn) để mô tả sự phân tán của dữ liệu?

Câu 11

Trong kiểm định giả thuyết, mức ý nghĩa (significance level), ký hiệu là α, đại diện cho điều gì?

Câu 12

Khi nào chúng ta nên sử dụng biểu đồ tần suất (histogram) để biểu diễn dữ liệu?

Câu 13

Nếu bạn thực hiện một kiểm định giả thuyết và nhận được giá trị p bằng 0.03, với mức ý nghĩa α = 0.05, bạn sẽ kết luận như thế nào?

Câu 14

Một nhà nghiên cứu muốn so sánh tỷ lệ thành công của hai phương pháp điều trị bệnh A. Phương pháp điều trị thứ nhất có tỷ lệ thành công là 70% trên 100 bệnh nhân, phương pháp thứ hai có tỷ lệ thành công là 60% trên 150 bệnh nhân. Phương pháp thống kê nào phù hợp để so sánh hai tỷ lệ này?

Câu 15

Trong thống kê suy luận, mục tiêu chính của việc lấy mẫu là gì?

Câu 16

Khi nào một nhà thống kê sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?

Câu 17

Một nhà quảng cáo muốn biết liệu có sự khác biệt có ý nghĩa thống kê về số lần nhấp chuột (click-through rate) giữa hai phiên bản quảng cáo khác nhau hay không. Cỡ mẫu cho mỗi phiên bản là 500 người dùng. Phương pháp nào là phù hợp nhất?

Câu 18

Một nhà khoa học thu thập dữ liệu về chiều cao của 1000 người trưởng thành ở một quốc gia. Dữ liệu này thuộc loại nào trong thống kê?

Câu 19

Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong phạm vi cộng trừ một độ lệch chuẩn (±1 SD) so với trung bình?

Câu 20

Trong thống kê suy luận, một 'ước lượng điểm' (point estimate) cho một tham số tổng thể là gì?

Câu 21

Khái niệm 'sai lầm loại II' (Type II error) trong kiểm định giả thuyết đề cập đến tình huống nào?

Câu 22

Khi tính toán khoảng tin cậy cho trung bình tổng thể, nếu chúng ta tăng kích thước mẫu, điều gì có khả năng xảy ra với chiều rộng của khoảng tin cậy?

Câu 23

Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong phạm vi cộng trừ hai độ lệch chuẩn (±2 SD) so với trung bình?

Câu 24

Một nhà sinh vật học muốn xác định liệu có mối liên hệ giữa lượng mưa hàng năm và năng suất của một loại cây trồng cụ thể hay không. Ông thu thập dữ liệu trong 10 năm. Phương pháp thống kê nào phù hợp nhất để phân tích mối quan hệ này?

Câu 25

Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán giá nhà dựa trên diện tích, số phòng ngủ và vị trí. Nếu mô hình có hệ số xác định (R-squared) là 0.75, điều này có nghĩa là gì?

Câu 26

Khi nào chúng ta có thể sử dụng phân tích phương sai (ANOVA) để so sánh nhiều hơn hai nhóm?

Câu 27

Độ lệch chuẩn (standard deviation) của một tập dữ liệu cho biết điều gì?

Câu 28

Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?

Câu 29

Khi nào chúng ta có thể sử dụng 'median' (trung vị) như một thước đo xu hướng trung tâm tốt hơn 'mean' (trung bình cộng)?

Câu 30

Một nhà thống kê đang phân tích mối quan hệ giữa số giờ học và điểm thi của sinh viên. Nếu hệ số tương quan Pearson (r) có giá trị là -0.85, điều này cho thấy mối quan hệ gì giữa hai biến?