Thống kê - Phân phối chuẩn
Phân phối chuẩn là phân phối xác suất quan trọng được sử dụng trong thống kê.
Nhiều ví dụ thực tế về dữ liệu được phân phối bình thường.
Phân phối bình thường
Phân phối chuẩn được mô tả bằng giá trị trung bình (\(\mu\)) và độ lệch chuẩn (\(\sigma\)).
Phân phối chuẩn thường được gọi là 'đường cong hình chuông' vì hình dạng của nó:
- Hầu hết các giá trị đều nằm ở trung tâm (\(\mu\))
- Trung vị và trung bình bằng nhau
- Nó chỉ có một chế độ
- Nó đối xứng, có nghĩa là nó giảm cùng một lượng ở bên trái và bên phải của trung tâm
Vùng bên dưới đường cong phân phối chuẩn biểu thị xác suất của dữ liệu.
Diện tích dưới toàn bộ đường cong bằng 1 hoặc 100%
Đây là biểu đồ phân phối chuẩn với xác suất giữa các độ lệch chuẩn (\(\sigma\)):
- Khoảng 68,3% dữ liệu nằm trong khoảng 1 độ lệch chuẩn so với mức trung bình (từ μ-1σ đến μ+1σ)
- Khoảng 95,5% dữ liệu nằm trong khoảng 2 độ lệch chuẩn so với mức trung bình (từ μ-2σ đến μ+2σ)
- Khoảng 99,7% dữ liệu nằm trong khoảng 3 độ lệch chuẩn so với mức trung bình (từ μ-3σ đến μ+3σ)
Lưu ý: Xác suất của phân phối chuẩn chỉ có thể được tính cho các khoảng (giữa hai giá trị).
Giá trị trung bình và độ lệch chuẩn khác nhau
Giá trị trung bình mô tả vị trí trung tâm của phân phối chuẩn.
Đây là biểu đồ hiển thị ba phân phối chuẩn khác nhau có cùng độ lệch chuẩn nhưng có giá trị trung bình khác nhau.
Độ lệch chuẩn mô tả mức độ phân bố của phân phối chuẩn.
Đây là biểu đồ hiển thị ba phân phối chuẩn khác nhau có cùng giá trị trung bình nhưng độ lệch chuẩn khác nhau.
Đường cong màu tím có độ lệch chuẩn lớn nhất và đường cong màu đen có độ lệch chuẩn nhỏ nhất.
Diện tích dưới mỗi đường cong vẫn là 1 hoặc 100%.
Một ví dụ về dữ liệu thực của dữ liệu được phân phối thông thường
Dữ liệu trong thế giới thực thường được phân phối bình thường.
Đây là biểu đồ về độ tuổi của những người đoạt giải Nobel khi họ đoạt giải:
Phân phối chuẩn được vẽ phía trên biểu đồ dựa trên giá trị trung bình tổng thể (\(\mu\)) và độ lệch chuẩn (\(\sigma\)) của dữ liệu thực.
Chúng ta có thể thấy rằng biểu đồ gần với phân phối chuẩn.
Ví dụ về các biến trong thế giới thực có thể được phân phối chuẩn:
- Điểm kiểm tra
- Chiều cao
- Cân nặng khi sinh
Phân bố xác suất
Phân phối xác suất là các hàm tính toán xác suất kết quả của các biến ngẫu nhiên.
Ví dụ điển hình của các biến ngẫu nhiên là tung đồng xu và tung xúc xắc.
Đây là biểu đồ hiển thị kết quả của số lần tung đồng xu ngày càng tăng và giá trị mong đợi của kết quả (ngửa hoặc sấp).
Giá trị kỳ vọng của việc tung đồng xu là phân bố xác suất của việc tung đồng xu.
Lưu ý rằng kết quả của các lần tung đồng xu ngẫu nhiên sẽ tiến gần hơn đến giá trị mong đợi (50%) khi số lần tung đồng xu tăng lên.
Tương tự, đây là biểu đồ hiển thị kết quả của số lần tung xúc xắc ngày càng tăng và giá trị mong đợi của kết quả (từ 1 đến 6).
Hãy chú ý lại kết quả của việc tung xúc xắc ngẫu nhiên sẽ tiến gần hơn đến giá trị mong đợi như thế nào (1/6 hoặc 16,666%) khi số lần tung xúc xắc tăng lên.
Khi biến ngẫu nhiên là tổng số xúc xắc, kết quả và giá trị mong đợi sẽ có hình dạng khác.
Hình dạng khác nhau xuất phát từ việc có nhiều cách để có được số tiền gần giữa hơn là số tiền nhỏ hoặc số tiền lớn.
Khi chúng ta tiếp tục tăng số lượng xúc xắc để có tổng, hình dạng của kết quả và giá trị kỳ vọng trông ngày càng giống một phân phối chuẩn.
Nhiều biến số trong thế giới thực tuân theo một mô hình tương tự và hình thành nên phân phối chuẩn một cách tự nhiên.
Các biến phân phối thông thường có thể được phân tích bằng các kỹ thuật nổi tiếng.
Bạn sẽ tìm hiểu về một số kỹ thuật phổ biến và hữu ích nhất trong các trang tiếp theo.