Khoa học dữ liệu - Giới thiệu về thống kê
Công bố số liệu thống kê
Thống kê là khoa học phân tích dữ liệu.
Khi tạo ra một mô hình dự đoán, chúng ta phải đánh giá độ tin cậy của dự đoán.
Rốt cuộc, dự đoán có giá trị gì nếu chúng ta không thể dựa vào nó?
Thống kê mô tả
Trước tiên chúng tôi sẽ đề cập đến một số thống kê mô tả cơ bản.
Thống kê mô tả tóm tắt các tính năng quan trọng của tập dữ liệu như:
- Đếm
- Tổng
- Độ lệch chuẩn
- Phần trăm
- Trung bình
- Vân vân..
Đó là một điểm khởi đầu tốt để làm quen với dữ liệu.
Chúng ta có thể sử dụng hàm describe()
trong Python để tóm tắt dữ liệu:
Đầu ra:
Bạn có thấy điều gì thú vị ở đây không?