Thống kê - Kiểm định giả thuyết
Kiểm tra giả thuyết là một cách chính thức để kiểm tra xem một giả thuyết về dân số có đúng hay không.
Kiểm tra giả thuyết
Giả thuyết là một khẳng định về một tham số tổng thể.
Kiểm tra giả thuyết là một thủ tục chính thức để kiểm tra xem một giả thuyết có đúng hay không.
Ví dụ về các khiếu nại có thể được kiểm tra:
The average height of people in Denmark is more than 170 cm.
The share of left handed people in Australia is not 10%.
The average income of dentists is less the average income of lawyers.
Giả thuyết không có giá trị và thay thế
Kiểm tra giả thuyết dựa trên việc đưa ra hai tuyên bố khác nhau về một tham số dân số.
Giả thuyết không (\(H_{0} \)) và giả thuyết thay thế (\(H_{1}\)) là các khẳng định.
Hai tuyên bố cần phải loại trừ lẫn nhau , nghĩa là chỉ một trong số chúng có thể đúng.
Giả thuyết thay thế thường là những gì chúng tôi đang cố gắng chứng minh.
Ví dụ: chúng tôi muốn kiểm tra xác nhận quyền sở hữu sau:
"The average height of people in Denmark is more than 170 cm."
Trong trường hợp này, tham số là chiều cao trung bình của người dân ở Đan Mạch (\(\mu\)).
Giả thuyết không và giả thuyết thay thế sẽ là:
Null hypothesis : The average height of people in Denmark is 170 cm.
Alternative hypothesis : The average height of people in Denmark is more than 170 cm.
Các tuyên bố thường được thể hiện bằng các ký hiệu như thế này:
\(H_{0}\): \(\mu = 170 \: cm \)
\(H_{1}\): \(\mu > 170 \: cm \)
Nếu dữ liệu ủng hộ giả thuyết thay thế, chúng tôi bác bỏ giả thuyết khống và chấp nhận giả thuyết thay thế.
Nếu dữ liệu không ủng hộ giả thuyết thay thế, chúng tôi giữ giả thuyết khống.
Lưu ý: Giả thuyết thay thế còn được gọi là (\(H_{A} \)).
Mức ý nghĩa
Mức ý nghĩa (\(\alpha\)) là độ không chắc chắn mà chúng ta chấp nhận khi bác bỏ giả thuyết không trong kiểm định giả thuyết.
Mức ý nghĩa là xác suất phần trăm của việc vô tình đưa ra kết luận sai.
Mức ý nghĩa điển hình là:
- \(\alpha = 0,1\) (10%)
- \(\alpha = 0,05\) (5%)
- \(\alpha = 0,01\) (1%)
Mức ý nghĩa thấp hơn có nghĩa là bằng chứng trong dữ liệu cần phải mạnh mẽ hơn để bác bỏ giả thuyết không.
Không có mức ý nghĩa "chính xác" - nó chỉ nêu mức độ không chắc chắn của kết luận.
Lưu ý: Mức ý nghĩa 5% có nghĩa là khi chúng ta bác bỏ giả thuyết không:
Chúng tôi hy vọng sẽ bác bỏ giả thuyết không đúng 5 trên 100 lần.
Thống kê thử nghiệm
Thống kê kiểm tra được sử dụng để quyết định kết quả của việc kiểm tra giả thuyết.
Thống kê kiểm tra là một giá trị tiêu chuẩn được tính toán từ mẫu.
Tiêu chuẩn hóa có nghĩa là chuyển đổi một thống kê thành phân bố xác suất phổ biến.
Loại phân bố xác suất phụ thuộc vào loại thử nghiệm.
Các ví dụ phổ biến là:
- Phân phối chuẩn chuẩn (Z): được sử dụng để kiểm tra tỷ lệ dân số
- Phân phối T của Học sinh (T): được sử dụng để Kiểm tra Phương tiện Dân số
Lưu ý: Bạn sẽ học cách tính toán thống kê kiểm tra cho từng loại kiểm tra trong các chương sau.
Phương pháp tiếp cận giá trị tới hạn và giá trị P
Có hai phương pháp chính được sử dụng để kiểm tra giả thuyết:
- Phương pháp giá trị tới hạn so sánh thống kê kiểm định với giá trị tới hạn của mức ý nghĩa.
- Phương pháp giá trị p so sánh giá trị p của thống kê kiểm tra và với mức ý nghĩa.
Phương pháp tiếp cận giá trị quan trọng
Phương pháp tiếp cận giá trị tới hạn kiểm tra xem thống kê kiểm tra có nằm trong vùng bị từ chối hay không.
Vùng bác bỏ là vùng xác suất ở phần đuôi của phân phối.
Kích thước của vùng loại bỏ được quyết định bởi mức ý nghĩa (\(\alpha\)).
Giá trị tách vùng loại bỏ khỏi phần còn lại được gọi là giá trị tới hạn .
Đây là một minh họa đồ họa:
Nếu thống kê kiểm định nằm trong vùng bác bỏ này thì giả thuyết không bị bác bỏ .
Ví dụ: nếu thống kê kiểm tra là 2,3 và giá trị tới hạn là 2 đối với mức ý nghĩa (\(\alpha = 0,05\)):
We reject the null hypothesis (\(H_{0} \)) at 0.05 significance level (\(\alpha\))
Phương pháp tiếp cận giá trị P
Phương pháp giá trị p kiểm tra xem giá trị p của thống kê kiểm tra có nhỏ hơn mức ý nghĩa (\(\alpha\)) hay không.
Giá trị p của thống kê kiểm tra là vùng xác suất ở các đuôi của phân phối từ giá trị của thống kê kiểm tra.
Đây là một minh họa đồ họa:
Nếu giá trị p nhỏ hơn mức ý nghĩa thì giả thuyết không bị bác bỏ .
Giá trị p trực tiếp cho chúng ta biết mức ý nghĩa thấp nhất mà chúng ta có thể bác bỏ giả thuyết không.
Ví dụ: nếu giá trị p là 0,03:
We reject the null hypothesis (\(H_{0} \)) at a 0.05 significance level (\(\alpha\))
We keep the null hypothesis (\(H_{0}\)) at a 0.01 significance level (\(\alpha\))
Lưu ý: Hai cách tiếp cận này chỉ khác nhau ở cách trình bày kết luận.
Các bước để kiểm tra giả thuyết
Các bước sau đây được sử dụng để kiểm tra giả thuyết:
- Kiểm tra các điều kiện
- Xác định các yêu cầu bồi thường
- Xác định mức ý nghĩa
- Tính toán thống kê kiểm tra
- Phần kết luận
Một điều kiện là mẫu được chọn ngẫu nhiên từ tổng thể.
Các điều kiện khác phụ thuộc vào loại tham số mà bạn đang kiểm tra giả thuyết.
Các thông số chung để kiểm tra các giả thuyết là:
- Tỷ lệ (đối với dữ liệu định tính)
- Giá trị trung bình (đối với dữ liệu số)
Bạn sẽ tìm hiểu các bước cho cả hai loại trong các trang sau.