150+ câu hỏi bài tập tin 12 bài 13 trắc nghiệm online có đáp án

Câu 1

Trong Pandas, phương pháp nào được sử dụng để chuẩn hóa dữ liệu trong một cột về một khoảng giá trị nhất định, ví dụ [0, 1]?

A. standardize()
B. normalize()
C. scale()
D. Cần kết hợp các phép toán số học để thực hiện chuẩn hóa

Câu 2

Hàm nào trong Pandas được sử dụng để tính toán các thống kê mô tả (descriptive statistics) cho một DataFrame, chẳng hạn như trung bình, độ lệch chuẩn, giá trị lớn nhất, giá trị nhỏ nhất?

A. calculate()
B. describe()
C. statistics()
D. summary()

Câu 3

Trong Pandas, làm thế nào để tính tổng của tất cả các giá trị trong một cột của DataFrame?

A. Sử dụng hàm sum()
B. Sử dụng hàm total()
C. Sử dụng hàm add()
D. Sử dụng hàm calculate_sum()

Câu 4

Khi làm việc với dữ liệu dạng chuỗi trong Pandas Series, phương thức nào cho phép bạn trích xuất các phần của chuỗi dựa trên một mẫu regular expression?

A. extract()
B. match()
C. findall()
D. replace()

Câu 5

Trong Pandas, làm thế nào để đổi tên các cột của một DataFrame?

A. Sử dụng hàm rename()
B. Sử dụng hàm change_name()
C. Gán trực tiếp cho DataFrame.columns
D. Cả A và C

Câu 6

Phương pháp nào sau đây là phù hợp nhất để xử lý các giá trị bị thiếu (missing values) trong một tập dữ liệu Pandas?

A. Loại bỏ toàn bộ tập dữ liệu
B. Thay thế bằng một giá trị mặc định hoặc giá trị thống kê (ví dụ: trung bình, trung vị)
C. Giữ nguyên các giá trị bị thiếu
D. Chuyển đổi sang kiểu dữ liệu khác

Câu 7

Hàm nào trong Pandas được sử dụng để áp dụng một hàm (function) cho từng phần tử trong một Series hoặc DataFrame?

A. apply()
B. map()
C. transform()
D. iterate()

Câu 8

Trong Pandas, hàm nào được sử dụng để lọc các hàng trong DataFrame dựa trên một điều kiện cho trước?

A. sort()
B. filter()
C. query()
D. select()

Câu 9

Trong Pandas, làm thế nào để chuyển đổi một cột có kiểu dữ liệu không phù hợp (ví dụ: chuỗi) sang kiểu dữ liệu số (ví dụ: số nguyên hoặc số thực)?

A. Sử dụng hàm convert()
B. Sử dụng hàm astype()
C. Sử dụng hàm changeType()
D. Không thể chuyển đổi kiểu dữ liệu của cột

Câu 10

Phương pháp nào trong Pandas được sử dụng để loại bỏ các hàng hoặc cột bị trùng lặp trong DataFrame?

A. drop()
B. remove()
C. drop_duplicates()
D. delete()

Câu 11

Trong Pandas, thao tác nào được sử dụng để kết hợp hai DataFrame dựa trên một hoặc nhiều cột chung?

A. concat()
B. merge()
C. append()
D. join()

Câu 12

Trong Pandas, hàm nào được sử dụng để chuyển đổi một DataFrame từ định dạng 'wide' sang định dạng 'long'?

A. melt()
B. pivot()
C. stack()
D. unstack()

Câu 13

Trong Pandas, phương pháp nào cho phép bạn nhóm các hàng trong DataFrame dựa trên giá trị của một hoặc nhiều cột, sau đó thực hiện các phép tính trên mỗi nhóm?

A. group()
B. aggregate()
C. groupBy()
D. groupby()

Câu 14

Trong ngôn ngữ lập trình Python, thư viện nào thường được sử dụng để làm việc với dữ liệu dạng bảng, cung cấp cấu trúc dữ liệu DataFrame?

A. NumPy
B. SciPy
C. Pandas
D. Matplotlib

Câu 15

Khi đọc một file CSV vào Pandas DataFrame, tham số nào cho phép bạn chỉ định cột nào sẽ được sử dụng làm index?

A. header
B. index_col
C. usecols
D. dtype

Câu 16

Trong Pandas, thuộc tính nào trả về một tuple đại diện cho số lượng hàng và cột của DataFrame?

A. size
B. shape
C. length
D. dimension

Câu 17

Phương thức nào trong Pandas được sử dụng để tạo ra một Series mới từ việc áp dụng một hàm lên các hàng hoặc cột của DataFrame?

A. applymap()
B. map()
C. apply()
D. transform()

Câu 18

Trong Pandas, hàm nào được sử dụng để đọc dữ liệu từ một file Excel?

A. read_excel()
B. read_csv()
C. read_table()
D. read_html()

Câu 19

Trong Pandas, làm thế nào để sắp xếp một DataFrame theo một hoặc nhiều cột?

A. Sử dụng hàm sort()
B. Sử dụng hàm order()
C. Sử dụng hàm sort_values()
D. Sử dụng hàm arrange()

Câu 20

Trong Pandas, khi bạn muốn tạo một bản sao (copy) của DataFrame, sự khác biệt giữa shallow copy và deep copy là gì?

A. Shallow copy tạo ra một đối tượng mới nhưng vẫn tham chiếu đến dữ liệu gốc, deep copy tạo ra một đối tượng mới và sao chép toàn bộ dữ liệu
B. Shallow copy tạo ra một đối tượng mới và sao chép toàn bộ dữ liệu, deep copy tạo ra một đối tượng mới nhưng vẫn tham chiếu đến dữ liệu gốc
C. Không có sự khác biệt giữa shallow copy và deep copy
D. Shallow copy nhanh hơn deep copy

Câu 21

Khi làm việc với chuỗi thời gian (time series) trong Pandas, đối tượng nào được sử dụng để biểu diễn một điểm thời gian cụ thể?

A. Timestamp
B. TimeDelta
C. Period
D. Interval

Câu 22

Trong Pandas, làm thế nào để truy cập vào một phần tử cụ thể trong DataFrame bằng cách sử dụng nhãn hàng và tên cột?

A. Sử dụng phương thức .iloc[]
B. Sử dụng phương thức .loc[]
C. Sử dụng phương thức .ix[]
D. Truy cập trực tiếp bằng DataFrame[row, column]

Câu 23

Trong Pandas, hàm nào được sử dụng để tạo ra một Series chứa các số ngẫu nhiên theo một phân phối nhất định?

A. np.random.rand()
B. pd.Series.rand()
C. np.random.series()
D. pd.Series() kết hợp với hàm ngẫu nhiên từ NumPy

Câu 24

Trong Pandas, làm thế nào để tính khoảng thời gian giữa hai ngày (date) hoặc hai thời điểm (time)?

A. Sử dụng đối tượng Timestamp
B. Sử dụng đối tượng TimeDelta
C. Sử dụng đối tượng Period
D. Sử dụng đối tượng Interval

Câu 25

Khi làm việc với dữ liệu lớn trong Pandas, phương pháp nào giúp giảm thiểu việc sử dụng bộ nhớ bằng cách đọc dữ liệu theo từng phần?

A. Sử dụng toàn bộ dữ liệu cùng lúc
B. Chunking (đọc theo từng phần)
C. Nén dữ liệu
D. Xóa dữ liệu không cần thiết

Câu 26

Đâu là mục đích chính của việc sử dụng pivot table trong Pandas?

A. Để tạo ra các biểu đồ trực quan
B. Để thay đổi cấu trúc DataFrame, tổng hợp dữ liệu dựa trên các cột và hàng được chỉ định
C. Để lọc dữ liệu dựa trên điều kiện
D. Để nối hai DataFrame lại với nhau

Câu 27

Trong Pandas, khi muốn kiểm tra xem một DataFrame có chứa bất kỳ giá trị NaN (Not a Number) nào hay không, bạn sử dụng phương thức nào?

A. isnull()
B. isna()
C. notnull()
D. Cả A và B

Câu 28

Khi thực hiện phép nối (join) hai DataFrame trong Pandas, kiểu nối nào giữ lại tất cả các hàng từ cả hai DataFrame, điền NaN vào các giá trị bị thiếu?

A. Inner join
B. Left join
C. Right join
D. Outer join

Câu 29

Đâu là lợi ích chính của việc sử dụng Categorical data type trong Pandas?

A. Tiết kiệm bộ nhớ và tăng hiệu suất tính toán
B. Tăng độ chính xác của dữ liệu
C. Dễ dàng thực hiện các phép toán số học
D. Cải thiện khả năng đọc của dữ liệu

Câu 30

Trong Pandas, phương pháp nào được sử dụng để thay thế một giá trị cụ thể trong DataFrame bằng một giá trị khác?

A. change()
B. replace()
C. update()
D. modify()