Gấu trúc đọc CSV
Đọc tệp CSV
Một cách đơn giản để lưu trữ các tập dữ liệu lớn là sử dụng tệp CSV (tệp được phân tách bằng dấu phẩy).
Tệp CSV chứa văn bản thuần túy và là định dạng phổ biến mà mọi người kể cả Pandas đều có thể đọc được.
Trong ví dụ của chúng tôi, chúng tôi sẽ sử dụng tệp CSV có tên 'data.csv'.
Tải xuống data.csv . hoặc Mở data.csv
Ví dụ
Tải CSV vào DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df.to_string())
Hãy tự mình thử » Mẹo: sử dụng to_string()
để in toàn bộ DataFrame.
Nếu bạn có DataFrame lớn có nhiều hàng, Pandas sẽ chỉ trả về 5 hàng đầu tiên và 5 hàng cuối cùng:
Ví dụ
In DataFrame mà không cần phương thức to_string()
:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
Hãy tự mình thử »max_rows
Số lượng hàng trả về được xác định trong cài đặt tùy chọn Pandas.
Bạn có thể kiểm tra số hàng tối đa của hệ thống bằng câu lệnh pd.options.display.max_rows
.
Ví dụ
Kiểm tra số hàng trả về tối đa:
import pandas as pd
print(pd.options.display.max_rows)
Hãy tự mình thử » Trong hệ thống của tôi, số đó là 60, có nghĩa là nếu DataFrame chứa hơn 60 hàng, câu lệnh print(df)
sẽ chỉ trả về các tiêu đề cũng như 5 hàng đầu tiên và cuối cùng.
Bạn có thể thay đổi số hàng tối đa bằng cùng một câu lệnh.
Ví dụ
Tăng số lượng hàng tối đa để hiển thị toàn bộ DataFrame:
import pandas as pd
pd.options.display.max_rows = 9999
df = pd.read_csv('data.csv')
print(df)
Hãy tự mình thử » Được chứng nhận!
$10 ĐĂNG KÝ