Giới thiệu thống kê
Thống kê cung cấp cho chúng ta phương pháp thu thập kiến thức từ dữ liệu.
Thống kê được sử dụng để làm gì?
Thống kê được sử dụng trong tất cả các loại ứng dụng khoa học và kinh doanh.
Thống kê cung cấp cho chúng ta kiến thức chính xác hơn, giúp chúng ta đưa ra quyết định tốt hơn.
Thống kê có thể tập trung vào việc đưa ra dự đoán về những gì sẽ xảy ra trong tương lai. Nó cũng có thể tập trung vào việc giải thích những thứ khác nhau được kết nối như thế nào.
Lưu ý: Giải thích thống kê tốt cũng hữu ích cho việc dự đoán.
Các bước điển hình của phương pháp thống kê
Các bước điển hình là:- Thu thập dữ liệu
- Mô tả và trực quan hóa dữ liệu
- Đưa ra kết luận
Điều quan trọng là phải ghi nhớ cả ba bước đối với bất kỳ câu hỏi nào mà chúng ta muốn biết thêm kiến thức.
Biết loại dữ liệu nào có sẵn có thể cho bạn biết loại câu hỏi nào bạn có thể trả lời bằng phương pháp thống kê.
Biết những câu hỏi bạn muốn trả lời có thể giúp hướng dẫn loại dữ liệu bạn cần. Rất nhiều dữ liệu có thể có sẵn và việc biết những gì cần tập trung vào là điều quan trọng.
Thống kê được sử dụng như thế nào?
Thống kê có thể được sử dụng để giải thích mọi thứ một cách chính xác. Bạn có thể sử dụng nó để hiểu và đưa ra kết luận về nhóm mà bạn muốn biết thêm. Nhóm này được gọi là dân số .
Một quần thể có thể có nhiều loại nhóm khác nhau. Nó có thể là:
- Tất cả mọi người trong một quốc gia
- Tất cả các doanh nghiệp trong một ngành
- Tất cả khách hàng của doanh nghiệp
- Tất cả những người chơi bóng đá trên 45 tuổi
v.v. - nó chỉ phụ thuộc vào những gì bạn muốn biết.
Thu thập dữ liệu về dân số sẽ cung cấp cho bạn một mẫu . Đây là một bộ phận của toàn bộ dân số. Phương pháp thống kê sau đó được sử dụng trên mẫu đó.
Kết quả của các phương pháp thống kê từ mẫu được sử dụng để đưa ra kết luận về tổng thể.
Lưu ý: Từ 'thống kê' cũng có thể đề cập đến những kiến thức cụ thể; như giá trị trung bình của một cái gì đó
Các khái niệm quan trọng trong thống kê
- Dự đoán và giải thích
- Quần thể và mẫu
- Các thông số và thống kê mẫu
- Phương pháp xét nghiệm
- Loại dữ liệu
- Mức đo lường
- Thống kê mô tả
- Biến ngẫu nhiên
- Thống kê đơn biến và đa biến
- Tính toán xác suất
- Phân bố xác suất
- suy luận thống kê
- Ước tính tham số
- Kiểm tra giả thuyết
- Tương quan
- Phân tích hồi quy
- Nguyên nhân diễn ra
Chúng tôi sẽ đề cập đến các chủ đề này từng bước trong hướng dẫn này.
Thống kê và lập trình
Phân tích thống kê thường được thực hiện bằng máy tính. Một lượng nhỏ dữ liệu có thể được phân tích tốt mà không cần máy tính.
Trong lịch sử, tất cả các phân tích dữ liệu được thực hiện thủ công. Việc này tốn thời gian và dễ xảy ra lỗi.
Ngày nay, lập trình và phần mềm thường được sử dụng để phân tích dữ liệu.
Trong khóa học này, chúng tôi sẽ trình bày các ví dụ về mã để thực hiện thống kê bằng ngôn ngữ lập trình Python và R.