Khoa học dữ liệu - Tỷ lệ phần trăm thống kê
25%, 50% và 75% - Phần trăm
Phần trăm được sử dụng trong thống kê để cung cấp cho bạn một con số mô tả giá trị mà một phần trăm giá trị nhất định thấp hơn.
Chúng ta hãy thử giải thích nó bằng một số ví dụ, sử dụng Average_Pulse.
- Tỷ lệ phần trăm 25% của Average_Pulse có nghĩa là 25% trong số tất cả các buổi tập luyện có nhịp tim trung bình là 100 nhịp mỗi phút hoặc thấp hơn. Nếu lật ngược câu nói thì có nghĩa là 75% tổng số buổi tập có nhịp tim trung bình từ 100 nhịp/phút trở lên.
- Phân vị 75% của Average_Pulse có nghĩa là 75% tổng số buổi tập có nhịp tim trung bình là 111 hoặc thấp hơn. Nếu lật ngược câu nói thì có nghĩa là 25% tổng số buổi tập có nhịp tim trung bình từ 111 nhịp/phút trở lên.
Nhiệm vụ: Tìm phân vị 10% cho Max_Pulse
Ví dụ sau đây cho thấy cách thực hiện điều đó bằng Python:
Ví dụ
import numpy as np
Max_Pulse= full_health_data["Max_Pulse"]
percentile10 = np.percentile(Max_Pulse, 10)
print(percentile10)
Hãy tự mình thử »- Max_Pulse = full_health_data["Max_Pulse"] - Cô lập biến Max_Pulse khỏi tập dữ liệu sức khỏe đầy đủ.
- np.percentile() được sử dụng để xác định rằng chúng tôi muốn phân vị 10% từ Max_Pulse.
Tỷ lệ phần trăm 10% của Max_Pulse là 120. Điều này có nghĩa là 10% trong số tất cả các buổi đào tạo có Max_Pulse là 120 hoặc thấp hơn.