Thống kê học máy
Thống kê là công cụ để có được câu trả lời cho các câu hỏi về dữ liệu:
- Chung là gì?
- Những gì mong đợi?
- Điều gì là bình thường?
- Xác suất là gì?
Thống kê suy luận
Thống kê suy luận là phương pháp định lượng các thuộc tính của tổng thể từ một Mẫu nhỏ:
Bạn lấy dữ liệu từ một mẫu và đưa ra dự đoán về toàn bộ dân số.
Ví dụ: bạn có thể đứng trong một cửa hàng và hỏi mẫu 100 người xem họ có thích sô cô la không.
Từ nghiên cứu của bạn, sử dụng số liệu thống kê suy luận, bạn có thể dự đoán rằng 91% người mua hàng thích sô cô la.
Sự thật đáng kinh ngạc về sô cô la
Chín trong số mười người yêu thích sô cô la.
50% dân số Mỹ không thể sống thiếu sôcôla mỗi ngày.
Bạn sử dụng Thống kê suy luận để dự đoán toàn bộ miền từ các mẫu dữ liệu nhỏ.
Thống kê mô tả
Thống kê mô tả tóm tắt (mô tả) các quan sát từ một tập hợp dữ liệu.
Vì chúng tôi đăng ký cho mọi trẻ sơ sinh nên chúng tôi có thể biết rằng 51 trên 100 trẻ là bé trai.
Từ những con số thu thập được này, chúng ta có thể dự đoán 51% khả năng đứa trẻ mới chào đời sẽ là con trai.
Có một điều bí ẩn là tỷ lệ này không phải là 50% như dự đoán của sinh học cơ bản. Chúng ta chỉ biết rằng chúng ta đã có tỷ lệ giới tính nghiêng này từ thế kỷ 17.
Ghi chú
Quan sát thô chỉ là dữ liệu. Chúng không phải là kiến thức thực sự.
Bạn sử dụng Thống kê mô tả để chuyển đổi các quan sát thô thành dữ liệu mà bạn có thể hiểu được.
Các phép đo thống kê mô tả
Thống kê mô tả được chia thành các thước đo khác nhau:
Xu hướng (Thước đo của trung tâm)
- Giá trị trung bình (giá trị trung bình)
- Trung vị (giá trị điểm giữa)
- Chế độ (giá trị phổ biến nhất)
Spread (Thước đo sự biến đổi)
- Tối thiểu và Tối đa
- Độ lệch chuẩn
- Phương sai
- Độ lệch
- Kurtosis