Thống kê - Phần tư và Phần trăm
Phần tư và phần trăm là thước đo độ biến thiên, mô tả mức độ phân tán của dữ liệu.
Phần tư và phần trăm đều là các loại lượng tử .
tứ phân vị
Phần tư là các giá trị tách dữ liệu thành bốn phần bằng nhau.
Dưới đây là biểu đồ về độ tuổi của tất cả 934 người đoạt giải Nobel tính đến năm 2020, hiển thị các phần tư :
Các tứ phân vị (Q 0 ,Q 1 ,Q 2 ,Q 3 ,Q 4 ) là các giá trị phân tách mỗi quý.
Giữa Q 0 và Q 1 là giá trị thấp nhất 25% trong dữ liệu. Giữa Q 1 và Q 2 là 25% tiếp theo. Và như thế.
- Q 0 là giá trị nhỏ nhất trong dữ liệu.
- Q 1 là giá trị ngăn cách quý 1 và quý 2 của dữ liệu.
- Q 2 là giá trị ở giữa (trung vị), ngăn cách nửa dưới với nửa trên.
- Q 3 là giá trị ngăn cách quý 3 với quý 4
- Q 4 là giá trị lớn nhất trong dữ liệu.
Tính toán tứ phân vị bằng lập trình
Tứ phân vị có thể dễ dàng được tìm thấy với nhiều ngôn ngữ lập trình.
Việc sử dụng phần mềm và lập trình để tính toán số liệu thống kê phổ biến hơn đối với các tập dữ liệu lớn hơn vì việc tìm kiếm dữ liệu theo cách thủ công trở nên khó khăn.
Ví dụ
Với Python, hãy sử dụng phương thức quantile()
của thư viện NumPy để tìm các phần tư của các giá trị 13, 21, 21, 40, 42, 48, 55, 72:
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.quantile(values, [0,0.25,0.5,0.75,1])
print(x)
Hãy tự mình thử »Ví dụ
Sử dụng hàm R quantile()
để tìm các lượng tử của các giá trị 13, 21, 21, 40, 42, 48, 55, 72:
values <- c(13,21,21,40,42,48,55,72)
quantile(values)
Hãy tự mình thử »Phần trăm
Phần trăm là các giá trị phân tách dữ liệu thành 100 phần bằng nhau.
Ví dụ: Phân vị thứ 95 phân tách 95% giá trị thấp nhất khỏi 5% giá trị cao nhất
Phân vị thứ 25 (P 25% ) giống với phân vị thứ nhất (Q 1 ).
Phân vị thứ 50 (P 50% ) giống với phân vị thứ hai (Q 2 ) và trung vị.
Phân vị thứ 75 (P 75% ) giống với phân vị thứ ba (Q 3 )
Tính phần trăm bằng lập trình
Phần trăm có thể dễ dàng được tìm thấy với nhiều ngôn ngữ lập trình.
Việc sử dụng phần mềm và lập trình để tính toán số liệu thống kê phổ biến hơn đối với các tập dữ liệu lớn hơn vì việc tìm kiếm dữ liệu theo cách thủ công trở nên khó khăn.
Ví dụ
Với Python, hãy sử dụng phương thức percentile()
thư viện NumPy để tìm phân vị thứ 65
của các giá trị 13, 21, 21, 40, 42, 48, 55, 72:
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.percentile(values, 65)
print(x)
Hãy tự mình thử »Ví dụ
Sử dụng hàm R quantile()
để tìm phân vị thứ 65 ( 0.65
) của các giá trị 13, 21, 21, 40, 42, 48, 55, 72:
values <- c(13,21,21,40,42,48,55,72)
quantile(values, 0.65)
Hãy tự mình thử »