Câu 1
Khoa học dữ liệu là gì?
- A) Chỉ là lập trình
- B) Quy trình thu thập và phân tích dữ liệu để rút ra thông tin
- C) Chỉ là về toán học
- D) Không liên quan đến công nghệ
Đáp án đúng: B
Câu 2
Ngôn ngữ lập trình phổ biến nhất trong khoa học dữ liệu là gì?
- A) C++
- B) Python
- C) Java
- D) HTML
Đáp án đúng: B
Câu 3
Phương pháp nào thường được sử dụng để xử lý dữ liệu thiếu?
- A) Tăng dữ liệu
- B) Xóa dữ liệu
- C) Thay thế dữ liệu thiếu bằng giá trị trung bình
- D) Không làm gì cả
Đáp án đúng: C
Câu 4
Dữ liệu lớn (Big Data) chủ yếu được đặc trưng bởi những gì?
- A) Kích thước nhỏ
- B) Tốc độ xử lý chậm
- C) Độ phức tạp và đa dạng
- D) Dữ liệu chỉ từ một nguồn
Đáp án đúng: C
Câu 5
Mô hình nào được sử dụng phổ biến trong học máy (Machine Learning)?
- A) Mô hình hồi quy
- B) Mô hình hóa thị trường
- C) Mô hình tài chính
- D) Mô hình mạng xã hội
Đáp án đúng: A
Câu 6
Kỹ thuật nào được sử dụng để giảm số lượng biến trong dữ liệu?
- A) Tăng cường dữ liệu
- B) Giảm chiều (Dimensionality Reduction)
- C) Phân loại
- D) Cụm (Clustering)
Đáp án đúng: B
Câu 7
Phần mềm nào thường được sử dụng để phân tích dữ liệu?
- A) Microsoft Word
- B) Excel
- C) Photoshop
- D) Notepad
Đáp án đúng: B
Câu 8
Kỹ thuật nào được sử dụng để phân nhóm dữ liệu không có nhãn?
- A) Hồi quy logistic
- B) K-means clustering
- C) Phân tích hồi quy
- D) Phân loại nhị phân
Đáp án đúng: B
Câu 9
Một trong những bước đầu tiên trong quy trình khoa học dữ liệu là gì?
- A) Triển khai mô hình
- B) Thu thập dữ liệu
- C) Trình bày dữ liệu
- D) Tối ưu hóa mô hình
Đáp án đúng: B
Câu 10
Hệ thống nào sử dụng học máy để cải thiện khả năng dự đoán?
- A) Hệ thống thông tin
- B) Hệ thống quản lý cơ sở dữ liệu
- C) Hệ thống gợi ý
- D) Hệ thống thanh toán
Đáp án đúng: C