Thống kê - Trung bình
Giá trị trung bình là một loại giá trị trung bình, mô tả vị trí trung tâm của dữ liệu.
Nghĩa là
Giá trị trung bình thường được gọi là 'trung bình'.
Giá trị trung bình là tổng của tất cả các giá trị trong dữ liệu chia cho tổng số giá trị trong dữ liệu.
Giá trị trung bình được tính cho các biến số. Biến là một cái gì đó trong dữ liệu có thể thay đổi, như:
- Tuổi
- Chiều cao
- Thu nhập
Lưu ý: Có nhiều loại giá trị trung bình. Loại trung bình phổ biến nhất là trung bình số học .
Trong hướng dẫn này 'trung bình' đề cập đến trung bình số học.
Tính giá trị trung bình
Bạn có thể tính giá trị trung bình cho cả tổng thể và mẫu .
Các công thức giống nhau và sử dụng các ký hiệu khác nhau để chỉ giá trị trung bình tổng thể (\(\mu\)) và giá trị trung bình mẫu (\(\bar{x}\)).
Tính trung bình dân số (\(\mu\)) được thực hiện với công thức sau:
\(\displaystyle \mu = \frac{\sum x_{i}}{n}\)
Việc tính giá trị trung bình mẫu (\(\bar{x}\)) được thực hiện theo công thức sau:
\(\displaystyle \bar{x} = \frac{\sum x_{i}}{n}\)
Phần dưới cùng của phân số (\(n\)) là tổng số quan sát.
\(\sum \) là ký hiệu để cộng một danh sách các số lại với nhau.
\(x_{i}\) là danh sách các giá trị trong dữ liệu: \(x_{1}, x_{2}, x_{3}, \ldots \)
Phần trên cùng của phân số (\(\sum x_{i}\)) là tổng của \(x_{1}, x_{2}, x_{3}, \ldots \) cộng lại.
Vì vậy, nếu một mẫu có 4 quan sát với các giá trị: 4, 11, 7, 14 thì phép tính là:
\(\displaystyle \bar{x} = \frac{4 + 11 + 7 + 14}{4} = \frac{36}{4} = \underline{9} \)
Tính toán bằng lập trình
Giá trị trung bình có thể dễ dàng được tính toán bằng nhiều ngôn ngữ lập trình.
Việc sử dụng phần mềm và lập trình để tính toán số liệu thống kê phổ biến hơn đối với các tập hợp dữ liệu lớn hơn vì việc tính toán bằng tay trở nên khó khăn.
Ví dụ
Với Python, hãy sử dụng phương thức mean()
của thư viện NumPy để tìm giá trị trung bình của các giá trị 4,11,7,14:
import numpy
values = [4,11,7,14]
x = numpy.mean(values)
print(x)
Hãy tự mình thử »Ví dụ
Sử dụng hàm R mean()
để tìm giá trị trung bình của các giá trị 4,11,7,14:
values <- c(4,7,11,14)
mean(values)
Hãy tự mình thử »Tham khảo ký hiệu thống kê
Symbol | Description |
---|---|
\( \mu \) | The population mean. Pronounced 'mu'. |
\( \bar{x} \) | The sample mean. Pronounced 'x-bar'. |
\( \sum \) | The summation operator, 'capital sigma'. |
\( x \) | The variable 'x' we are calculating the average for. |
\( i \) | The index 'i' of the variable 'x'. This identifies each observation for a variable. |
\( n \) | The number of observations. |