Thống kê - Trung bình
Giá trị trung bình là thước đo vị trí của hầu hết các giá trị trong dữ liệu.
Trung tâm dữ liệu
Trung tâm của dữ liệu là nơi chứa hầu hết các giá trị trong dữ liệu. Trung bình là thước đo vị trí của trung tâm.
Có nhiều loại trung bình khác nhau. Được sử dụng phổ biến nhất là:
Lưu ý: Trong thống kê, giá trị trung bình thường được gọi là 'thước đo xu hướng trung tâm '.
Ví dụ: sử dụng các giá trị:
40, 21, 55, 21, 48, 13, 72
Nghĩa là
Giá trị trung bình thường được gọi là 'trung bình'.
Giá trị trung bình là tổng của tất cả các giá trị trong dữ liệu chia cho tổng số giá trị trong dữ liệu:
(40 + 21 + 55 + 31 + 48 + 13 + 72)/7 = 38.57
Lưu ý: Có nhiều loại giá trị trung bình. Loại trung bình phổ biến nhất là trung bình số học .
Trong hướng dẫn này, 'trung bình' đề cập đến trung bình số học.
Trung bình
Trung vị là 'giá trị trung bình' của dữ liệu.
Trung vị được tìm thấy bằng cách sắp xếp tất cả các giá trị trong dữ liệu và chọn giá trị ở giữa:
13, 21, 21, 40 , 48, 55, 72
Giá trị trung bình ít bị ảnh hưởng bởi các giá trị cực trị trong dữ liệu hơn giá trị trung bình.
Thay đổi giá trị cuối cùng thành 356 không làm thay đổi giá trị trung vị:
13, 21, 21, 40 , 48, 55, 356
Trung vị vẫn là 40.
Thay đổi giá trị cuối cùng thành 356 sẽ thay đổi giá trị trung bình rất nhiều:
(13 + 21 + 21 + 40 + 48 + 55 + 72)/7 = 38.57
(13 + 21 + 21 + 40 + 48 + 55 + 356 )/7 = 79.14
Lưu ý: Giá trị cực trị là các giá trị trong dữ liệu nhỏ hơn hoặc lớn hơn nhiều so với giá trị trung bình trong dữ liệu.
Cách thức
Chế độ là (các) giá trị xuất hiện thường xuyên nhất trong dữ liệu:
40, 21 , 55, 21 , 48, 13, 72
Ở đây, 21 xuất hiện hai lần và các giá trị khác chỉ xuất hiện một lần. Chế độ của dữ liệu này là 21.
Chế độ này cũng được sử dụng cho dữ liệu phân loại , không giống như giá trị trung bình và giá trị trung bình. Dữ liệu phân loại không thể được mô tả trực tiếp bằng các con số, như tên:
Alice, John , Bob, Maria, John , Julia, Carol
Ở đây, John xuất hiện hai lần và các giá trị khác chỉ một lần. Chế độ của dữ liệu này là John.
Lưu ý: Có thể có nhiều chế độ nếu nhiều giá trị xuất hiện cùng số lần trong dữ liệu.