Bộ số 1

Câu 1

Trong Pandas, phương pháp nào được sử dụng để chuẩn hóa dữ liệu trong một cột về một khoảng giá trị nhất định, ví dụ [0, 1]?

Câu 2

Hàm nào trong Pandas được sử dụng để tính toán các thống kê mô tả (descriptive statistics) cho một DataFrame, chẳng hạn như trung bình, độ lệch chuẩn, giá trị lớn nhất, giá trị nhỏ nhất?

Câu 3

Trong Pandas, làm thế nào để tính tổng của tất cả các giá trị trong một cột của DataFrame?

Câu 4

Khi làm việc với dữ liệu dạng chuỗi trong Pandas Series, phương thức nào cho phép bạn trích xuất các phần của chuỗi dựa trên một mẫu regular expression?

Câu 5

Trong Pandas, làm thế nào để đổi tên các cột của một DataFrame?

Câu 6

Phương pháp nào sau đây là phù hợp nhất để xử lý các giá trị bị thiếu (missing values) trong một tập dữ liệu Pandas?

Câu 7

Hàm nào trong Pandas được sử dụng để áp dụng một hàm (function) cho từng phần tử trong một Series hoặc DataFrame?

Câu 8

Trong Pandas, hàm nào được sử dụng để lọc các hàng trong DataFrame dựa trên một điều kiện cho trước?

Câu 9

Trong Pandas, làm thế nào để chuyển đổi một cột có kiểu dữ liệu không phù hợp (ví dụ: chuỗi) sang kiểu dữ liệu số (ví dụ: số nguyên hoặc số thực)?

Câu 10

Phương pháp nào trong Pandas được sử dụng để loại bỏ các hàng hoặc cột bị trùng lặp trong DataFrame?

Câu 11

Trong Pandas, thao tác nào được sử dụng để kết hợp hai DataFrame dựa trên một hoặc nhiều cột chung?

Câu 12

Trong Pandas, hàm nào được sử dụng để chuyển đổi một DataFrame từ định dạng 'wide' sang định dạng 'long'?

Câu 13

Trong Pandas, phương pháp nào cho phép bạn nhóm các hàng trong DataFrame dựa trên giá trị của một hoặc nhiều cột, sau đó thực hiện các phép tính trên mỗi nhóm?

Câu 14

Trong ngôn ngữ lập trình Python, thư viện nào thường được sử dụng để làm việc với dữ liệu dạng bảng, cung cấp cấu trúc dữ liệu DataFrame?

Câu 15

Khi đọc một file CSV vào Pandas DataFrame, tham số nào cho phép bạn chỉ định cột nào sẽ được sử dụng làm index?

Câu 16

Trong Pandas, thuộc tính nào trả về một tuple đại diện cho số lượng hàng và cột của DataFrame?

Câu 17

Phương thức nào trong Pandas được sử dụng để tạo ra một Series mới từ việc áp dụng một hàm lên các hàng hoặc cột của DataFrame?

Câu 18

Trong Pandas, hàm nào được sử dụng để đọc dữ liệu từ một file Excel?

Câu 19

Trong Pandas, làm thế nào để sắp xếp một DataFrame theo một hoặc nhiều cột?

Câu 20

Trong Pandas, khi bạn muốn tạo một bản sao (copy) của DataFrame, sự khác biệt giữa shallow copy và deep copy là gì?

Câu 21

Khi làm việc với chuỗi thời gian (time series) trong Pandas, đối tượng nào được sử dụng để biểu diễn một điểm thời gian cụ thể?

Câu 22

Trong Pandas, làm thế nào để truy cập vào một phần tử cụ thể trong DataFrame bằng cách sử dụng nhãn hàng và tên cột?

Câu 23

Trong Pandas, hàm nào được sử dụng để tạo ra một Series chứa các số ngẫu nhiên theo một phân phối nhất định?

Câu 24

Trong Pandas, làm thế nào để tính khoảng thời gian giữa hai ngày (date) hoặc hai thời điểm (time)?

Câu 25

Khi làm việc với dữ liệu lớn trong Pandas, phương pháp nào giúp giảm thiểu việc sử dụng bộ nhớ bằng cách đọc dữ liệu theo từng phần?

Câu 26

Đâu là mục đích chính của việc sử dụng pivot table trong Pandas?

Câu 27

Trong Pandas, khi muốn kiểm tra xem một DataFrame có chứa bất kỳ giá trị NaN (Not a Number) nào hay không, bạn sử dụng phương thức nào?

Câu 28

Khi thực hiện phép nối (join) hai DataFrame trong Pandas, kiểu nối nào giữ lại tất cả các hàng từ cả hai DataFrame, điền NaN vào các giá trị bị thiếu?

Câu 29

Đâu là lợi ích chính của việc sử dụng Categorical data type trong Pandas?

Câu 30

Trong Pandas, phương pháp nào được sử dụng để thay thế một giá trị cụ thể trong DataFrame bằng một giá trị khác?