Gấu trúc - Âm mưu
Vẽ đồ thị
Pandas sử dụng phương thức plot()
để tạo sơ đồ.
Chúng ta có thể sử dụng Pyplot, một mô-đun con của thư viện Matplotlib để hiển thị sơ đồ trên màn hình.
Đọc thêm về Matplotlib trong Hướng dẫn Matplotlib của chúng tôi.
Ví dụ
Nhập pyplot từ Matplotlib và trực quan hóa DataFrame của chúng tôi:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot()
plt.show()
Hãy tự mình thử »Các ví dụ trong trang này sử dụng tệp CSV có tên: 'data.csv'.
Tải xuống data.csv hoặc Mở data.csv
Biểu đồ phân tán
Chỉ định rằng bạn muốn một biểu đồ phân tán với đối số kind
:
kind = 'scatter'
Biểu đồ phân tán cần có trục x và trục y.
Trong ví dụ bên dưới, chúng tôi sẽ sử dụng "Thời lượng" cho trục x và "Calo" cho trục y.
Bao gồm các đối số x và y như thế này:
x = 'Duration', y = 'Calories'
Ví dụ
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Calories')
plt.show()
Kết quả
Hãy tự mình thử » Hãy nhớ: Trong ví dụ trước, chúng ta đã biết rằng mối tương quan giữa "Thời lượng" và "Calo" là 0.922721
và chúng ta đã kết luận với thực tế là thời lượng cao hơn có nghĩa là đốt cháy nhiều calo hơn.
Bằng cách nhìn vào biểu đồ phân tán, tôi sẽ đồng ý.
Hãy tạo một biểu đồ phân tán khác, trong đó có mối quan hệ không tốt giữa các cột, như "Duration" và "Maxpulse", với mối tương quan 0.009403
:
Ví dụ
Một biểu đồ phân tán trong đó không có mối quan hệ giữa các cột:
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('data.csv')
df.plot(kind = 'scatter', x = 'Duration', y = 'Maxpulse')
plt.show()
Kết quả
Hãy tự mình thử »Được chứng nhận!
$10 ĐĂNG KÝ
Biểu đồ
Sử dụng đối số kind
để xác định rằng bạn muốn có biểu đồ:
kind = 'hist'
Một biểu đồ chỉ cần một cột.
Biểu đồ cho chúng ta thấy tần suất của từng khoảng thời gian, ví dụ: có bao nhiêu bài tập kéo dài từ 50 đến 60 phút?
Trong ví dụ bên dưới, chúng tôi sẽ sử dụng cột "Thời lượng" để tạo biểu đồ:
Lưu ý: Biểu đồ cho chúng ta biết rằng có hơn 100 bài tập kéo dài từ 50 đến 60 phút.