Giới thiệu gấu trúc
Gấu trúc là gì?
Pandas là thư viện Python được sử dụng để làm việc với các tập dữ liệu.
Nó có chức năng phân tích, làm sạch, khám phá và thao tác dữ liệu.
Tên "Pandas" có liên quan đến cả "Dữ liệu bảng" và "Phân tích dữ liệu Python" và được tạo bởi Wes McKinney vào năm 2008.
Tại sao nên sử dụng Pandas?
Pandas cho phép chúng tôi phân tích dữ liệu lớn và đưa ra kết luận dựa trên lý thuyết thống kê.
Pandas có thể dọn dẹp các tập dữ liệu lộn xộn và làm cho chúng dễ đọc và phù hợp.
Dữ liệu liên quan là rất quan trọng trong khoa học dữ liệu.
Khoa học dữ liệu: là một nhánh của khoa học máy tính, nơi chúng tôi nghiên cứu cách lưu trữ, sử dụng và phân tích dữ liệu để lấy thông tin từ dữ liệu đó.
Gấu trúc có thể làm gì?
Pandas cung cấp cho bạn câu trả lời về dữ liệu. Giống:
- Có mối tương quan giữa hai hoặc nhiều cột không?
- Giá trị trung bình là gì?
- Giá trị tối đa?
- Giá trị tối thiểu?
Gấu trúc cũng có thể xóa các hàng không liên quan hoặc chứa các giá trị sai, như giá trị trống hoặc NULL. Điều này được gọi là làm sạch dữ liệu.
Cơ sở mã Pandas ở đâu?
Mã nguồn của Pandas được đặt tại kho github này https://github.com/pandas-dev/pandas
github: cho phép nhiều người làm việc trên cùng một cơ sở mã.
Được chứng nhận!
$10 ĐĂNG KÝ