150+ câu hỏi trắc nghiệm nguyên lý thống kê online có đáp án
⚠️ Đọc lưu ý và miễn trừ trách nhiệm trước khi bắt đầu: Các câu hỏi và đáp án trong bộ trắc nghiệm này chỉ mang tính chất tham khảo, hỗ trợ học tập và ôn luyện. Đây KHÔNG PHẢI là đề thi chính thức, không đại diện cho bất kỳ tài liệu chuẩn hóa hay kiểm tra chứng chỉ nào từ các cơ quan giáo dục hay tổ chức cấp chứng chỉ chuyên môn. Website không chịu bất kỳ trách nhiệm nào liên quan đến độ chính xác của nội dung hoặc các quyết định được đưa ra dựa trên kết quả làm bài trắc nghiệm.
Hãy cùng nhau khám phá bộ 150+ câu hỏi trắc nghiệm nguyên lý thống kê online có đáp án. Đây là một công cụ hữu ích để bạn kiểm tra mức độ hiểu biết và ghi nhớ nội dung. Bạn hãy chọn một bộ đề phía dưới và khám phá ngay nội dung thú vị bên trong. Chúc bạn có trải nghiệm trắc nghiệm tuyệt vời và học thêm được nhiều điều mới mẻ!
1. Một nhà xã hội học muốn nghiên cứu mối quan hệ giữa mức độ giáo dục (ví dụ: tiểu học, trung học, đại học) và mức độ hài lòng với công việc. Dữ liệu về mức độ giáo dục thuộc loại nào?
2. Trong thống kê mô tả, ‘range’ (biên độ) của một tập dữ liệu được tính như thế nào?
3. Một nhà kinh tế đang nghiên cứu mối quan hệ giữa thu nhập và chi tiêu. Ông thu thập dữ liệu về thu nhập và chi tiêu của 50 hộ gia đình. Ông quyết định sử dụng hồi quy tuyến tính để mô hình hóa mối quan hệ này. Biến nào trong trường hợp này thường được coi là biến phụ thuộc?
4. Trong thống kê mô tả, ‘mode’ (yếu vị) của một tập dữ liệu là gì?
5. Giả sử bạn đang thực hiện một cuộc khảo sát và nhận được phản hồi từ 80% số người được hỏi. Tỷ lệ 80% này được gọi là gì trong thống kê?
6. Khi phân tích dữ liệu từ một cuộc khảo sát, bạn nhận thấy rằng phần lớn người trả lời nghiêng về một phía của thang đo Likert (ví dụ: đa số chọn ‘hoàn toàn đồng ý’). Điều này có thể dẫn đến hiện tượng gì trong phân phối dữ liệu?
7. Một nhà nghiên cứu muốn đánh giá hiệu quả của một chương trình đào tạo mới bằng cách so sánh điểm kiểm tra của nhân viên trước và sau khi tham gia chương trình. Phương pháp thống kê nào phù hợp nhất cho tình huống này?
8. Trong thống kê mô tả, khi nào chúng ta sử dụng trung vị thay vì trung bình cộng để đo lường xu hướng trung tâm?
9. Một nhà nghiên cứu muốn kiểm tra xem liệu có sự khác biệt có ý nghĩa thống kê về điểm thi trung bình giữa hai nhóm sinh viên học theo phương pháp A và phương pháp B hay không. Phương pháp thống kê nào phù hợp nhất để phân tích dữ liệu này?
10. Khi nào chúng ta nên sử dụng ‘IQR’ (Interquartile Range – Khoảng tứ phân vị) thay vì ‘standard deviation’ (độ lệch chuẩn) để mô tả sự phân tán của dữ liệu?
11. Trong kiểm định giả thuyết, mức ý nghĩa (significance level), ký hiệu là α, đại diện cho điều gì?
12. Khi nào chúng ta nên sử dụng biểu đồ tần suất (histogram) để biểu diễn dữ liệu?
13. Nếu bạn thực hiện một kiểm định giả thuyết và nhận được giá trị p bằng 0.03, với mức ý nghĩa α = 0.05, bạn sẽ kết luận như thế nào?
14. Một nhà nghiên cứu muốn so sánh tỷ lệ thành công của hai phương pháp điều trị bệnh A. Phương pháp điều trị thứ nhất có tỷ lệ thành công là 70% trên 100 bệnh nhân, phương pháp thứ hai có tỷ lệ thành công là 60% trên 150 bệnh nhân. Phương pháp thống kê nào phù hợp để so sánh hai tỷ lệ này?
15. Trong thống kê suy luận, mục tiêu chính của việc lấy mẫu là gì?
16. Khi nào một nhà thống kê sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
17. Một nhà quảng cáo muốn biết liệu có sự khác biệt có ý nghĩa thống kê về số lần nhấp chuột (click-through rate) giữa hai phiên bản quảng cáo khác nhau hay không. Cỡ mẫu cho mỗi phiên bản là 500 người dùng. Phương pháp nào là phù hợp nhất?
18. Một nhà khoa học thu thập dữ liệu về chiều cao của 1000 người trưởng thành ở một quốc gia. Dữ liệu này thuộc loại nào trong thống kê?
19. Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong phạm vi cộng trừ một độ lệch chuẩn (±1 SD) so với trung bình?
20. Trong thống kê suy luận, một ‘ước lượng điểm’ (point estimate) cho một tham số tổng thể là gì?
21. Khái niệm ‘sai lầm loại II’ (Type II error) trong kiểm định giả thuyết đề cập đến tình huống nào?
22. Khi tính toán khoảng tin cậy cho trung bình tổng thể, nếu chúng ta tăng kích thước mẫu, điều gì có khả năng xảy ra với chiều rộng của khoảng tin cậy?
23. Trong một phân phối chuẩn, khoảng bao nhiêu phần trăm dữ liệu nằm trong phạm vi cộng trừ hai độ lệch chuẩn (±2 SD) so với trung bình?
24. Một nhà sinh vật học muốn xác định liệu có mối liên hệ giữa lượng mưa hàng năm và năng suất của một loại cây trồng cụ thể hay không. Ông thu thập dữ liệu trong 10 năm. Phương pháp thống kê nào phù hợp nhất để phân tích mối quan hệ này?
25. Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán giá nhà dựa trên diện tích, số phòng ngủ và vị trí. Nếu mô hình có hệ số xác định (R-squared) là 0.75, điều này có nghĩa là gì?
26. Khi nào chúng ta có thể sử dụng phân tích phương sai (ANOVA) để so sánh nhiều hơn hai nhóm?
27. Độ lệch chuẩn (standard deviation) của một tập dữ liệu cho biết điều gì?
28. Trong phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
29. Khi nào chúng ta có thể sử dụng ‘median’ (trung vị) như một thước đo xu hướng trung tâm tốt hơn ‘mean’ (trung bình cộng)?
30. Một nhà thống kê đang phân tích mối quan hệ giữa số giờ học và điểm thi của sinh viên. Nếu hệ số tương quan Pearson (r) có giá trị là -0.85, điều này cho thấy mối quan hệ gì giữa hai biến?
31. Nếu một nghiên cứu sử dụng dữ liệu từ tất cả các thành viên của một quần thể, đó được gọi là gì?
32. Tương quan Pearson (Pearson correlation coefficient) đo lường điều gì giữa hai biến định lượng?
33. Khi hệ số tương quan Pearson bằng 1, điều đó có nghĩa là gì?
34. Trong thống kê suy luận, mục tiêu chính là gì?
35. Sai số lấy mẫu (sampling error) là gì?
36. Trong một nghiên cứu về hiệu quả của một loại thuốc mới, nhóm nào sẽ không nhận thuốc hoặc nhận giả dược?
37. Một khoảng tin cậy 95% cho chiều cao trung bình của nam giới là [170 cm, 175 cm]. Điều này có nghĩa là gì?
38. Trong mô hình hồi quy tuyến tính y = a + bx, biến ‘x’ được gọi là gì?
39. Xác suất của một sự kiện là bao nhiêu nếu sự kiện đó không thể xảy ra?
40. Lấy mẫu ngẫu nhiên đơn giản (simple random sampling) đảm bảo điều gì?
41. Giả thuyết không (null hypothesis – H0) trong kiểm định giả thuyết thường phát biểu điều gì?
42. Phân phối chuẩn (normal distribution) có đặc điểm nào sau đây?
43. Kiểm định Chi-square (Chi-squared test) thường được sử dụng để phân tích loại dữ liệu nào?
44. Khi nào chúng ta sử dụng kiểm định t cho hai mẫu độc lập (independent samples t-test)?
45. Trong một nghiên cứu, nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa (alpha), chúng ta thường làm gì với giả thuyết không?
46. Biến ngoại lai (outlier) là gì trong một tập dữ liệu?
47. Một nhà nghiên cứu thu thập dữ liệu về chiều cao của 100 sinh viên. Dữ liệu này thuộc loại nào?
48. Nếu tung một đồng xu công bằng hai lần, xác suất để cả hai lần đều là mặt ngửa là bao nhiêu?
49. Khi nào một nhà thống kê có thể sử dụng kiểm định phi tham số (non-parametric test)?
50. Khi phân tích phương sai (ANOVA), mục đích chính là gì?
51. Độ tin cậy (confidence level) trong khoảng tin cậy cho biết điều gì?
52. Độ lệch chuẩn (standard deviation) cho biết điều gì về tập dữ liệu?
53. Hồi quy tuyến tính đơn (simple linear regression) được sử dụng để làm gì?
54. Trong thống kê mô tả, đại lượng nào sau đây được coi là thước đo độ phân tán của dữ liệu?
55. Trong phân tích hồi quy bội (multiple linear regression), hệ số hồi quy cho một biến độc lập đại diện cho điều gì?
56. Lấy mẫu phân tầng (stratified sampling) bao gồm các bước nào sau đây?
57. Một nhà khoa học muốn so sánh hiệu quả của ba loại phân bón khác nhau đối với sự phát triển của cây trồng. Phương pháp thống kê nào phù hợp nhất?
58. Đâu là thước đo độ xiên (skewness) của phân phối?
59. Khi nào chúng ta sử dụng trung vị thay vì trung bình cộng để mô tả xu hướng trung tâm của tập dữ liệu?
60. Khi nào thì dữ liệu được coi là có phân phối lệch phải (positively skewed)?
61. Một nhà thống kê muốn ước tính tỷ lệ người dân sử dụng mạng xã hội tại một quốc gia. Ông ấy đã thực hiện một cuộc khảo sát với kích thước mẫu là 1000 người. Nếu sai số chuẩn của ước lượng tỷ lệ là 0.02, và ông ấy muốn có khoảng tin cậy 95%, thì bán kính của khoảng tin cậy này là bao nhiêu?
62. Trong một nghiên cứu về mối quan hệ giữa chiều cao và cân nặng của sinh viên, nhà nghiên cứu đã thu thập dữ liệu từ 100 sinh viên. Các biến số được đo lường là chiều cao (cm) và cân nặng (kg). Loại dữ liệu nào sau đây phù hợp nhất để mô tả các biến số này?
63. Một nhà tiếp thị muốn biết liệu chiến dịch quảng cáo mới có làm tăng doanh số bán hàng hay không. Họ theo dõi doanh số bán hàng trước và sau khi triển khai chiến dịch. Loại kiểm định giả thuyết nào phù hợp nhất cho trường hợp này?
64. Sai số chuẩn của trung bình (standard error of the mean) đo lường điều gì?
65. Giá trị p (p-value) trong kiểm định giả thuyết cho biết điều gì?
66. Trong phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope coefficient) của biến độc lập đại diện cho điều gì?
67. Khi tính toán giá trị trung bình cộng của một tập dữ liệu, nếu có một giá trị ngoại lệ (outlier) rất lớn so với các giá trị còn lại, thì giá trị trung bình cộng có xu hướng:
68. Hệ số xác định (R-squared) trong mô hình hồi quy cho biết điều gì?
69. Trong thống kê suy luận, mục tiêu chính là gì?
70. Một nhà tuyển dụng sử dụng bài kiểm tra kỹ năng để đánh giá ứng viên cho một vị trí. Bài kiểm tra này cần có tính nhất quán trong các lần đo lường khác nhau để được coi là đáng tin cậy. Khái niệm này liên quan đến:
71. Một nhà khoa học muốn kiểm tra xem một loại thuốc mới có hiệu quả hơn thuốc cũ trong việc giảm huyết áp hay không. Ông ta chia ngẫu nhiên 200 bệnh nhân cao huyết áp thành hai nhóm: nhóm dùng thuốc mới và nhóm dùng thuốc cũ. Sau một tháng, ông ta so sánh sự thay đổi huyết áp trung bình của hai nhóm. Đây là ví dụ về loại nghiên cứu nào?
72. Khi thực hiện phân tích hồi quy đa biến, việc sử dụng nhiều biến độc lập có thể dẫn đến vấn đề gì nếu các biến độc lập đó có mối tương quan mạnh với nhau?
73. Hệ số tương quan Pearson (r) đo lường điều gì giữa hai biến định lượng?
74. Khi nào thì phân phối mẫu của trung bình có xu hướng tiến gần đến phân phối chuẩn, bất kể hình dạng của phân phối tổng thể ban đầu?
75. Khi so sánh hai trung bình mẫu độc lập, nếu giá trị p nhỏ hơn mức ý nghĩa alpha (ví dụ: 0.05), chúng ta sẽ:
76. Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán giá nhà. Ông ấy xem xét các yếu tố như diện tích, số phòng ngủ, vị trí, tuổi của ngôi nhà. Đây là một ví dụ về việc sử dụng phương pháp thống kê nào?
77. Độ lệch chuẩn (standard deviation) là một thước đo về:
78. Khi nào thì việc sử dụng trung vị (median) làm thước đo xu hướng trung tâm phù hợp hơn trung bình cộng (mean)?
79. Một kỹ sư muốn kiểm tra xem liệu một vật liệu mới có độ bền kéo trung bình lớn hơn 100 MPa hay không. Giả thuyết không (H0) và giả thuyết đối (H1) cho kiểm định này là gì?
80. Trong một phân phối chuẩn (normal distribution), khoảng 95% dữ liệu sẽ nằm trong bao nhiêu độ lệch chuẩn so với giá trị trung bình?
81. Giả thuyết không (null hypothesis, H0) thường đại diện cho điều gì?
82. Trong kiểm định Chi-bình phương (Chi-squared test) cho tính độc lập, giả thuyết không (H0) phát biểu rằng:
83. Trong thống kê mô tả, tần suất tích lũy (cumulative frequency) của một giá trị là gì?
84. Khi một phân phối có đuôi dài về phía bên phải (phân phối lệch phải), mối quan hệ giữa trung bình, trung vị và mốt thường là:
85. Trong lấy mẫu phi xác suất, phương pháp nào mô tả việc chọn các đối tượng dựa trên sự tiện lợi hoặc sẵn có?
86. Một nhà nghiên cứu muốn so sánh tỷ lệ thành công của hai phương pháp điều trị khác nhau. Ông ấy thu thập dữ liệu về số lượng bệnh nhân thành công và thất bại cho mỗi phương pháp. Phương pháp thống kê nào là phù hợp nhất?
87. Một nhà nghiên cứu muốn ước tính chiều cao trung bình của tất cả học sinh trung học ở một thành phố. Ông ấy chọn ngẫu nhiên 200 học sinh từ các trường khác nhau. Khoảng tin cậy 95% cho chiều cao trung bình là (165 cm, 175 cm). Điều này có nghĩa là gì?
88. Một nhà nghiên cứu kinh tế muốn xem xét mối quan hệ giữa chi tiêu quảng cáo và doanh thu. Ông thu thập dữ liệu trong 12 tháng. Phương pháp nào sau đây phù hợp để phân tích xu hướng và mối quan hệ giữa hai biến số này theo thời gian?
89. Một nhà thống kê đang phân tích tỷ lệ cử tri ủng hộ một ứng cử viên trong một cuộc bầu cử sắp tới. Ông ấy đã khảo sát ngẫu nhiên 500 cử tri. Biến số ‘sự ủng hộ ứng cử viên’ (có/không) là ví dụ cho loại biến số nào?
90. Một nhà nghiên cứu muốn xác định xem có sự khác biệt có ý nghĩa thống kê về điểm thi giữa ba phương pháp giảng dạy khác nhau hay không. Phương pháp thống kê nào phù hợp nhất để phân tích dữ liệu này?
91. Một nhà nghiên cứu muốn so sánh hiệu quả của hai phương pháp giảng dạy khác nhau. Ông ta chia lớp học thành hai nhóm, mỗi nhóm được áp dụng một phương pháp. Sau đó, ông ta so sánh điểm trung bình của hai nhóm. Phương pháp thống kê phù hợp nhất để phân tích sự khác biệt này là gì?
92. Một công ty khảo sát ý kiến khách hàng về mức độ hài lòng với sản phẩm mới. Khách hàng có thể chọn ‘Rất không hài lòng’, ‘Không hài lòng’, ‘Bình thường’, ‘Hài lòng’, ‘Rất hài lòng’. Loại dữ liệu này được phân loại là gì?
93. Trong phân tích dữ liệu định tính, phương pháp nào thường được sử dụng để xác định các chủ đề, mẫu hình hoặc ý nghĩa chung trong một lượng lớn văn bản hoặc ghi chép phỏng vấn?
94. Trong một mẫu ngẫu nhiên đơn giản, tại sao việc không sử dụng tất cả các đơn vị trong tổng thể lại là một đặc điểm chính?
95. Một nhà sinh vật học muốn nghiên cứu chiều dài trung bình của một loài cá ở một hồ. Ông ta bắt và đo 50 con cá. Giá trị trung bình ông ta tính được từ 50 con cá này được gọi là gì?
96. Một nhà khoa học đang phân tích kết quả của một thí nghiệm và nhận thấy rằng đường cong phân phối của dữ liệu có hình dạng chuông cân đối. Điều này cho thấy điều gì?
97. Một nhà nghiên cứu muốn ước lượng tỷ lệ người dân sử dụng mạng xã hội ở một thành phố. Ông ta chọn ngẫu nhiên 200 người từ danh sách cử tri. Nếu 70% trong số này cho biết họ sử dụng mạng xã hội, thì 70% này là gì?
98. Trong thống kê, ‘sai số lấy mẫu’ (sampling error) là gì?
99. Khi nào thì trung vị (median) là một thước đo tốt hơn trung bình cộng (mean) cho xu hướng trung tâm?
100. Trong phân tích dữ liệu, khái niệm ‘phân phối tần suất’ (frequency distribution) đề cập đến điều gì?
101. Khi nào thì phương pháp lấy mẫu phân tầng là phù hợp nhất để áp dụng?
102. Khi nào thì mốt (mode) là một thước đo tốt cho xu hướng trung tâm của dữ liệu?
103. Trong thống kê mô tả, đại lượng nào được sử dụng để đo lường mức độ biến thiên hoặc phân tán của dữ liệu xung quanh giá trị trung bình?
104. Khi nào thì ‘sai số phi lấy mẫu’ (non-sampling error) có thể trở nên nghiêm trọng hơn ‘sai số lấy mẫu’?
105. Một nhà khoa học xã hội đang nghiên cứu thái độ của công chúng đối với một chính sách mới. Ông ta chia dân số thành các nhóm tuổi (18-25, 26-40, 41-60, trên 60) và lấy mẫu ngẫu nhiên từ mỗi nhóm. Đây là loại hình lấy mẫu nào?
106. Yếu tố nào sau đây có thể gây ra sai lệch trong kết quả thống kê nếu không được xử lý cẩn thận?
107. Trong phân tích thống kê, khái niệm ‘độ xiên’ (skewness) dùng để mô tả đặc điểm nào của phân phối dữ liệu?
108. Khi nào thì việc sử dụng ‘biến giả’ (dummy variable) là cần thiết trong phân tích hồi quy?
109. Giả sử bạn thực hiện kiểm định giả thuyết và nhận được giá trị p (p-value) rất nhỏ (ví dụ: 0.01). Điều này có ý nghĩa gì?
110. Một nhà kinh tế muốn phân tích mối quan hệ giữa lạm phát và tỷ lệ thất nghiệp. Ông ta thu thập dữ liệu lịch sử và sử dụng phương pháp hồi quy tuyến tính. Biến nào có khả năng là biến phụ thuộc (dependent variable)?
111. Trong phân tích thống kê, khi nói đến ‘độ tin cậy’ của một ước lượng, điều này thường đề cập đến khía cạnh nào?
112. Trong thống kê suy luận, một khoảng tin cậy (confidence interval) cung cấp thông tin gì về tham số của tổng thể?
113. Nếu một nghiên cứu sử dụng tất cả các đơn vị trong tổng thể để thu thập dữ liệu, phương pháp này được gọi là gì?
114. Giả sử bạn có một tập dữ liệu về chiều cao của 1000 người. Bạn tính được trung bình cộng là 165 cm và độ lệch chuẩn là 5 cm. Nếu bạn chọn ngẫu nhiên một người, khả năng cao nhất chiều cao của người đó sẽ nằm trong khoảng nào?
115. Một nhà nghiên cứu muốn ước lượng tuổi trung bình của sinh viên tại một trường đại học lớn. Ông ta quyết định lấy mẫu ngẫu nhiên 100 sinh viên từ danh sách tất cả sinh viên. Phương pháp lấy mẫu này được gọi là gì?
116. Một nhà thống kê đang xem xét dữ liệu về doanh thu bán hàng và chi phí quảng cáo của một công ty. Ông ta nhận thấy khi chi phí quảng cáo tăng thì doanh thu cũng có xu hướng tăng. Điều này cho thấy mối quan hệ gì?
117. Khi tiến hành một nghiên cứu, nếu mục tiêu là để suy luận về đặc điểm của một tổng thể lớn dựa trên thông tin từ một phần nhỏ của nó, chúng ta đang sử dụng lĩnh vực nào của thống kê?
118. Khi thực hiện kiểm định giả thuyết, nếu chúng ta bác bỏ giả thuyết không (null hypothesis) một cách không chính xác, chúng ta đã mắc lỗi gì?
119. Trong phân tích hồi quy, hệ số tương quan (correlation coefficient) ‘r’ có giá trị bằng 1, điều này cho thấy điều gì về mối quan hệ giữa hai biến?
120. Khi nào thì việc sử dụng sai số chuẩn của trung bình (standard error of the mean) là phù hợp?
121. Một nhà tiếp thị muốn biết liệu chiến dịch quảng cáo mới có làm tăng doanh số bán hàng so với chiến dịch cũ hay không. Ông thu thập dữ liệu doanh số bán hàng trước và sau khi áp dụng chiến dịch mới. Phương pháp thống kê nào phù hợp để so sánh hai bộ dữ liệu phụ thuộc này?
122. Một nhà nghiên cứu muốn ước lượng chiều cao trung bình của học sinh trung học phổ thông tại một thành phố. Ông ấy chọn ngẫu nhiên 200 học sinh từ danh sách toàn bộ học sinh. Tập hợp 200 học sinh này được gọi là gì trong nghiên cứu thống kê?
123. Trong thống kê, ‘p-value’ (giá trị p) thường được sử dụng để đưa ra quyết định trong kiểm định giả thuyết. Nếu p-value nhỏ hơn mức ý nghĩa (alpha), kết luận thường là gì?
124. Độ lệch chuẩn (standard deviation) được dùng để đo lường điều gì trong một tập dữ liệu?
125. Trong một phân tích hồi quy, nếu hệ số chặn (intercept) là 10 và hệ số góc (slope) là 2, điều này có nghĩa là gì?
126. Trong một nghiên cứu về mối quan hệ giữa số giờ học và điểm thi, người ta tính được hệ số tương quan Pearson là -0.85. Điều này cho thấy mối quan hệ gì?
127. Trong một phân tích hồi quy tuyến tính đơn giản, hệ số góc (slope) của đường hồi quy đại diện cho điều gì?
128. Khi nào ta nên sử dụng trung vị (median) thay vì trung bình (mean) để mô tả xu hướng trung tâm của dữ liệu?
129. Khi một phân phối dữ liệu bị lệch phải (positively skewed), điều gì xảy ra với mối quan hệ giữa trung bình (mean), trung vị (median) và yếu vị (mode)?
130. Một nhà thống kê muốn kiểm định xem liệu có sự khác biệt có ý nghĩa thống kê về tỷ lệ người ủng hộ một ứng cử viên giữa hai thành phố khác nhau hay không. Ông thu thập dữ liệu về số người ủng hộ và không ủng hộ ở mỗi thành phố. Phương pháp kiểm định nào phù hợp nhất?
131. Khi phân tích dữ liệu về thu nhập hàng tháng của các hộ gia đình, người ta sử dụng giá trị trung bình (mean) để mô tả xu hướng trung tâm. Tuy nhiên, nếu có một vài hộ gia đình có thu nhập rất cao, giá trị trung bình có thể bị ‘kéo’ về phía giá trị cao đó. Trường hợp này, yếu tố nào ảnh hưởng đến giá trị trung bình?
132. Một nhà nghiên cứu muốn so sánh hiệu quả của ba loại phân bón khác nhau đối với sự tăng trưởng của cây trồng. Ông chia một mảnh đất thành 12 ô nhỏ, mỗi loại phân bón được áp dụng cho 4 ô. Sau một thời gian, ông đo lường chiều cao của cây trồng. Phương pháp thống kê nào phù hợp nhất để phân tích dữ liệu này?
133. Trong phân phối Poisson, tham số lambda (λ) đại diện cho điều gì?
134. Một nhà nghiên cứu xã hội muốn so sánh mức độ hài lòng với công việc giữa ba nhóm nghề nghiệp khác nhau (ví dụ: giáo viên, kỹ sư, nhân viên văn phòng). Ông thu thập dữ liệu về mức độ hài lòng (thang điểm từ 1 đến 5) của mỗi nhóm. Phương pháp thống kê nào phù hợp nhất để kiểm tra xem có sự khác biệt có ý nghĩa thống kê về mức độ hài lòng giữa ba nhóm này không?
135. Trong thống kê, ‘tổng thể’ (population) đề cập đến điều gì?
136. Một nhà thống kê muốn kiểm định giả thuyết rằng không có sự khác biệt về tỷ lệ cử tri ủng hộ ứng cử viên A giữa nam và nữ. Ông thu thập dữ liệu và tính toán giá trị p. Nếu giá trị p = 0.02 và mức ý nghĩa alpha là 0.05, kết luận nào là đúng?
137. Một nhà thống kê muốn ước lượng khoảng tin cậy cho chiều cao trung bình của nam giới trưởng thành ở một quốc gia. Ông lấy một mẫu ngẫu nhiên và tính toán được khoảng tin cậy 95%. Điều này có nghĩa là gì?
138. Trong một cuộc khảo sát về sở thích đọc sách, người ta thu thập được các dữ liệu về thể loại sách yêu thích của 1000 người. Dữ liệu này thuộc loại nào trong thống kê mô tả?
139. Một nhà sinh vật học muốn xem xét liệu có mối liên hệ giữa nhiệt độ môi trường và số lượng côn trùng hoạt động hay không. Ông thu thập dữ liệu về nhiệt độ và đếm số lượng côn trùng trong các khoảng thời gian khác nhau. Nếu ông phát hiện ra rằng khi nhiệt độ tăng, số lượng côn trùng cũng có xu hướng tăng, điều này cho thấy mối quan hệ gì?
140. Một nhà khoa học đang nghiên cứu mối quan hệ giữa liều lượng thuốc và hiệu quả giảm đau. Ông thu thập dữ liệu về liều lượng thuốc (biến độc lập) và mức độ giảm đau báo cáo bởi bệnh nhân (biến phụ thuộc). Ông muốn đo lường mức độ thay đổi trong hiệu quả giảm đau khi liều lượng thuốc thay đổi. Phương pháp thống kê nào phù hợp nhất cho việc này?
141. Khi tính toán hệ số tương quan Pearson (r) giữa hai biến định lượng, giá trị của ‘r’ nằm trong khoảng nào?
142. Trong một bài kiểm tra thống kê, nhà nghiên cứu muốn xác định xem có sự khác biệt có ý nghĩa thống kê về điểm trung bình giữa hai nhóm sinh viên (nhóm học thêm và nhóm không học thêm). Phương pháp kiểm định nào nên được sử dụng?
143. Khi phân tích dữ liệu định tính, ta thường sử dụng biểu đồ nào để biểu diễn tần suất xuất hiện của các danh mục khác nhau?
144. Một nhà tiếp thị muốn đánh giá hiệu quả của hai thông điệp quảng cáo khác nhau trên cùng một nhóm khách hàng. Ông cho mỗi khách hàng xem một thông điệp và ghi lại phản hồi. Đây là một ví dụ về thiết kế nghiên cứu nào?
145. Một nhà khoa học muốn kiểm định xem có sự khác biệt có ý nghĩa thống kê về hiệu quả của ba loại thuốc giảm đau khác nhau hay không. Ông chia bệnh nhân thành ba nhóm, mỗi nhóm nhận một loại thuốc. Sau đó, ông đo lường mức độ giảm đau của mỗi bệnh nhân. Phương pháp nào phù hợp nhất để phân tích dữ liệu này?
146. Một nhà kinh tế học muốn phân tích xem có mối liên hệ thống kê nào giữa tỷ lệ thất nghiệp và tỷ lệ lạm phát trong một quốc gia hay không. Dữ liệu được thu thập qua nhiều năm. Phương pháp thống kê nào có thể giúp xác định và đo lường mối liên hệ này?
147. Khi thực hiện kiểm định giả thuyết, ‘sai lầm loại I’ (Type I error) xảy ra khi nào?
148. Một nhà thống kê muốn ước lượng khoảng tin cậy cho tỷ lệ doanh số bán hàng thành công của một sản phẩm mới. Ông lấy một mẫu gồm 500 giao dịch và thu được tỷ lệ thành công là 0.6. Khoảng tin cậy 95% cho tỷ lệ này có ý nghĩa gì?
149. Trong một phân tích hồi quy, hệ số xác định (R-squared) cho biết điều gì?
150. Trong phân phối chuẩn (normal distribution), phần lớn dữ liệu tập trung ở đâu?