Thống kê - Trung vị
Trung vị là một loại giá trị trung bình, mô tả vị trí trung tâm của dữ liệu.
Trung bình
Trung vị là giá trị ở giữa trong tập dữ liệu được sắp xếp từ thấp đến cao.
Tìm trung vị
Trung vị chỉ có thể được tính cho các biến số.
Công thức tìm giá trị trung bình là:
\( \displaystyle \frac{n + 1}{2} \)
Trong đó \(n\) là tổng số quan sát.
Nếu tổng số quan sát là số lẻ thì công thức sẽ cho một số nguyên và giá trị của quan sát này là trung vị.
13, 21, 21, 40 , 48, 55, 72
Ở đây có tổng cộng 7 quan sát nên giá trị trung vị là giá trị thứ 4:
\( \displaystyle \frac{7 + 1}{2} = \frac{8}{2} = 4 \)
Giá trị thứ 4 trong danh sách có thứ tự là 40 , đó là giá trị trung vị.
Nếu tổng số quan sát là số chẵn thì công thức sẽ cho số thập phân giữa hai quan sát.
13, 21, 21, 40, 42 , 48, 55, 72
Ở đây, có tổng cộng 8 quan sát, vì vậy giá trị trung bình nằm giữa giá trị thứ 4 và thứ 5:
\( \displaystyle \frac{8 + 1}{2} = \frac{9}{2} = 4.5 \)
Giá trị thứ 4 và thứ 5 trong danh sách có thứ tự là 40 và 42 , vì vậy trung vị là giá trị trung bình của hai giá trị này. Tức là tổng của hai giá trị đó chia cho 2:
\( \displaystyle \frac{40+42}{2} = \frac{82}{2} = \underline{41} \)
Lưu ý: Điều quan trọng là các số phải được sắp xếp trước khi bạn có thể tìm được số trung vị.
Tìm trung vị bằng lập trình
Trung vị có thể dễ dàng được tìm thấy với nhiều ngôn ngữ lập trình.
Việc sử dụng phần mềm và lập trình để tính toán số liệu thống kê phổ biến hơn đối với các tập dữ liệu lớn hơn vì việc tìm kiếm dữ liệu theo cách thủ công trở nên khó khăn.
Ví dụ
Với Python sử dụng phương thức median()
của thư viện NumPy để tìm trung vị của các giá trị 13, 21, 21, 40, 42, 48, 55, 72:
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.median(values)
print(x)
Hãy tự mình thử »Ví dụ
Sử dụng hàm Rmedia median()
để tìm trung vị của các giá trị 13, 21, 21, 40, 42, 48, 55, 72:
values <- c(13,21,21,40,42,48,55,72)
median(values)
Hãy tự mình thử »