Học máy - Chế độ trung bình trung bình
Giá trị trung bình, trung vị và chế độ
Chúng ta có thể học được gì khi nhìn vào một nhóm số?
Trong Machine Learning (và trong toán học) thường có ba giá trị mà chúng ta quan tâm:
- Mean - Giá trị trung bình
- Median - Giá trị điểm giữa
- Chế độ - Giá trị phổ biến nhất
Ví dụ: Ta đã đăng ký vận tốc của 13 ô tô:
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
Giá trị tốc độ trung bình, trung bình hoặc phổ biến nhất là gì?
Nghĩa là
Giá trị trung bình là giá trị trung bình.
Để tính giá trị trung bình, hãy tìm tổng của tất cả các giá trị và chia tổng cho số giá trị:
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77
Mô-đun NumPy có một phương pháp cho việc này. Tìm hiểu về mô-đun NumPy trong Hướng dẫn NumPy của chúng tôi.
Ví dụ
Sử dụng phương pháp NumPy mean()
để tìm tốc độ trung bình:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)
Chạy ví dụ » Trung bình
Giá trị trung vị là giá trị ở giữa, sau khi bạn đã sắp xếp tất cả các giá trị:
77, 78, 85, 86, 86, 86,
87
, 87, 88, 94, 99, 103, 111
Điều quan trọng là các số phải được sắp xếp trước khi bạn có thể tìm được số trung vị.
Mô-đun NumPy có một phương thức cho việc này:
Ví dụ
Sử dụng phương thức median()
để tìm giá trị ở giữa:
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Hãy tự mình thử »Nếu có hai số ở giữa thì chia tổng các số đó cho hai.
77, 78, 85, 86, 86,
86, 87
, 87, 94, 98, 99, 103
(86 + 87) / 2 =86.5
Ví dụ
Sử dụng mô-đun NumPy:
import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Hãy tự mình thử »Cách thức
Giá trị Mode là giá trị xuất hiện nhiều lần nhất:
99,
86
, 87, 88, 111,
86
, 103, 87, 94, 78, 77, 85,
86
= 86
Mô-đun SciPy có một phương pháp cho việc này. Tìm hiểu về mô-đun SciPy trong Hướng dẫn SciPy của chúng tôi.
Ví dụ
Sử dụng phương thức SciPy mode()
để tìm số xuất hiện nhiều nhất:
from scipy import stats
speed =
[99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)
Hãy tự mình thử »Tóm tắt chương
Giá trị trung bình, Trung vị và Chế độ là các kỹ thuật thường được sử dụng trong Machine Learning, vì vậy điều quan trọng là phải hiểu khái niệm đằng sau chúng.