Chức năng khoa học dữ liệu
Chương này trình bày ba hàm thường được sử dụng khi làm việc với Khoa học dữ liệu: max(), min() và Mean().
Tập dữ liệu đồng hồ thể thao
Khoảng thời gian | Trung bình_Pulse | Max_Pulse | Calorie_Đốt cháy | Giờ_Làm việc | Giờ_Ngủ |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | số 8 | 7 |
45 | 95 | 130 | 270 | số 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | số 8 |
60 | 110 | 145 | 300 | 7 | số 8 |
60 | 115 | 145 | 310 | số 8 | số 8 |
75 | 120 | 150 | 320 | 0 | số 8 |
75 | 125 | 150 | 330 | số 8 | số 8 |
Bộ dữ liệu trên gồm 6 biến, mỗi biến có 10 quan sát:
- Thời lượng - Buổi tập kéo dài bao lâu tính bằng phút?
- Average_Pulse - Nhịp tim trung bình của buổi tập là bao nhiêu? Điều này được đo bằng nhịp mỗi phút
- Max_Pulse - Nhịp tim tối đa của buổi tập là bao nhiêu?
- Calorie_Burnage - Lượng calo được đốt cháy trong buổi tập là bao nhiêu?
- Giờ_Làm việc - Chúng tôi đã làm việc bao nhiêu giờ trước buổi đào tạo?
- Giờ_Ngủ - Chúng ta đã ngủ bao nhiêu vào đêm trước buổi tập?
Chúng tôi sử dụng dấu gạch dưới (_) để phân tách các chuỗi vì Python không thể đọc dấu cách dưới dạng dấu phân cách.
Hàm max()
Hàm max()
của Python được sử dụng để tìm giá trị cao nhất trong một mảng.
Ví dụ
Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_max)
Hãy tự mình thử »Hàm min()
Hàm min()
trong Python được sử dụng để tìm giá trị thấp nhất trong một mảng.
Ví dụ
Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)
print
(Average_pulse_min)
Hãy tự mình thử »Hàm trung bình()
Hàm NumPy mean()
được sử dụng để tìm giá trị trung bình của một mảng.
Ví dụ
import numpy as np
Calorie_burnage =
[240, 250, 260, 270, 280, 290, 300, 310, 320, 330]
Average_calorie_burnage =
np.mean(Calorie_burnage)
print(Average_calorie_burnage)
Hãy tự mình thử »Lưu ý: Chúng tôi viết np. đằng trước Mean để Python biết rằng chúng ta muốn kích hoạt hàm Mean từ thư viện Numpy .