Khung dữ liệu Pandas
DataFrame là gì?
Pandas DataFrame là cấu trúc dữ liệu 2 chiều, giống như mảng 2 chiều hoặc bảng có hàng và cột.
Ví dụ
Tạo một DataFrame Pandas đơn giản:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
#load data into a DataFrame object:
df = pd.DataFrame(data)
print(df)
Kết quả
thời lượng calo 0 420 50 1 380 40 2 390 45
Xác định vị trí hàng
Như bạn có thể thấy từ kết quả trên, DataFrame giống như một bảng có các hàng và cột.
Gấu trúc sử dụng thuộc tính loc
để trả về một hoặc nhiều hàng được chỉ định
Ví dụ
Trả về hàng 0:
#refer to the row index:
print(df.loc[0])
Kết quả
calo 420 thời lượng 50 Tên: 0, dtype: int64
Lưu ý: Ví dụ này trả về Pandas Series .
Ví dụ
Trả về hàng 0 và 1:
#use a list of indexes:
print(df.loc[[0, 1]])
Kết quả
thời lượng calo 0 420 50 1 380 40
Lưu ý: Khi sử dụng []
, kết quả là Pandas DataFrame .
Được chứng nhận!
$10 ĐĂNG KÝ
Chỉ mục được đặt tên
Với đối index
, bạn có thể đặt tên cho chỉ mục của riêng mình.
Ví dụ
Thêm danh sách tên để đặt tên cho mỗi hàng:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2",
"day3"])
print(df)
Kết quả
thời lượng calo ngày 1 420 50 ngày thứ 2 380 40 ngày thứ 3 390 45
Xác định vị trí các chỉ mục được đặt tên
Sử dụng chỉ mục được đặt tên trong thuộc tính loc
để trả về (các) hàng được chỉ định.
Ví dụ
Trả về "ngày2":
#refer to the named index:
print(df.loc["day2"])
Kết quả
calo 380 thời lượng 40 Tên: day2, dtype: int64
Tải tệp vào DataFrame
Nếu tập dữ liệu của bạn được lưu trữ trong một tệp, Pandas có thể tải chúng vào DataFrame.
Ví dụ
Tải tệp được phân tách bằng dấu phẩy (tệp CSV) vào DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
Hãy tự mình thử »Bạn sẽ tìm hiểu thêm về cách nhập tệp trong các chương tiếp theo.