Khoa học dữ liệu - Bảng cơ sở dữ liệu
Bảng cơ sở dữ liệu
Bảng cơ sở dữ liệu là một bảng có dữ liệu có cấu trúc.
Bảng sau đây hiển thị bảng cơ sở dữ liệu với dữ liệu sức khỏe được trích xuất từ đồng hồ thể thao:
Khoảng thời gian | Trung bình_Pulse | Max_Pulse | Calorie_Đốt cháy | Giờ_Làm việc | Giờ_Ngủ |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | số 8 | 7 |
45 | 95 | 130 | 270 | số 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | số 8 |
60 | 110 | 145 | 300 | 7 | số 8 |
60 | 115 | 145 | 310 | số 8 | số 8 |
75 | 120 | 150 | 320 | 0 | số 8 |
75 | 125 | 150 | 330 | số 8 | số 8 |
Tập dữ liệu này chứa thông tin về một buổi tập luyện điển hình như thời lượng, nhịp tim trung bình, lượng calo đốt cháy, v.v.
Cấu trúc bảng cơ sở dữ liệu
Một bảng cơ sở dữ liệu bao gồm (các) cột và (các) hàng:
Cột 1 | Cột 2 | Cột 3 | Cột 4 | Cột 5 | Cột 6 | |
Khoảng thời gian | Trung bình_Pulse | Max_Pulse | Calorie_Đốt cháy | Giờ_Làm việc | Giờ_Ngủ | |
---|---|---|---|---|---|---|
Hàng 1 | 30 | 80 | 120 | 240 | 10 | 7 |
Hàng 2 | 30 | 85 | 120 | 250 | 10 | 7 |
Hàng 3 | 45 | 90 | 130 | 260 | số 8 | 7 |
Hàng 4 | 45 | 95 | 130 | 270 | số 8 | 7 |
Hàng 5 | 45 | 100 | 140 | 280 | 0 | 7 |
Hàng 6 | 60 | 105 | 140 | 290 | 7 | số 8 |
Hàng 7 | 60 | 110 | 145 | 300 | 7 | số 8 |
Hàng 8 | 60 | 115 | 145 | 310 | số 8 | số 8 |
Hàng 9 | 75 | 120 | 150 | 320 | 0 | số 8 |
Hàng 10 | 75 | 125 | 150 | 330 | số 8 | số 8 |
Một hàng là sự thể hiện theo chiều ngang của dữ liệu.
Cột là sự biểu diễn dữ liệu theo chiều dọc.
Biến
Một biến được định nghĩa là một cái gì đó có thể đo lường được hoặc đếm được.
Ví dụ có thể là ký tự, số hoặc thời gian.
Trong ví dụ dưới đây, chúng ta có thể thấy rằng mỗi cột đại diện cho một biến.
Khoảng thời gian | Trung bình_Pulse | Max_Pulse | Calorie_Đốt cháy | Giờ_Làm việc | Giờ_Ngủ |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | số 8 | 7 |
45 | 95 | 130 | 270 | số 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | số 8 |
60 | 110 | 145 | 300 | 7 | số 8 |
60 | 115 | 145 | 310 | số 8 | số 8 |
75 | 120 | 150 | 320 | 0 | số 8 |
75 | 125 | 150 | 330 | số 8 | số 8 |
Có 6 cột, nghĩa là có 6 biến (Thời lượng, Average_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).
Có 11 hàng, nghĩa là mỗi biến có 10 quan sát.
Nhưng nếu có 11 hàng thì tại sao chỉ có 10 quan sát?
Bởi vì dòng đầu tiên là nhãn, nghĩa là tên của biến.