Điểm phân tán
- Thu thập dữ liệu
- Điểm phân tán
- Đồ thị
Thu thập dữ liệu
Thu thập dữ liệu là phần quan trọng nhất của bất kỳ dự án Machine Intelligence nào.
Dữ liệu phổ biến nhất cần thu thập là các con số và phép đo.
Thông thường dữ liệu được lưu trữ trong mảng thể hiện mối quan hệ giữa các giá trị.
Bảng này chứa giá nhà so với kích thước:
Giá | 7 | số 8 | số 8 | 9 | 9 | 9 | 10 | 11 | 14 | 14 | 15 |
Kích cỡ | 50 | 60 | 70 | 80 | 90 | 100 | 110 | 120 | 130 | 140 | 150 |
Điểm phân tán
Biểu đồ phân tán có các điểm nằm rải rác trên một khu vực thể hiện mối quan hệ giữa hai giá trị.
Ví dụ
const xArray = [50,60,70,80,90,100,110,120,130,140,150];
const yArray = [7,8,8,9,9,9,10,11,14,14,15];
// Define Data
const data = [{
x: xArray,
y: yArray,
mode:"markers"
}];
// Define Layout
const layout = {
xaxis: {range: [40, 160], title: "Square Meters"},
yaxis: {range: [5, 16], title: "Price in Millions"},
title: "House Prices vs. Size"
};
// Display with Plotly
Plotly.newPlot("myPlot", data, layout);
Hãy tự mình thử » Đồ thị
Biểu đồ cũng có thể được sử dụng để hiển thị các giá trị tương tự:
Giá | 7 | số 8 | số 8 | 9 | 9 | 9 | 10 | 11 | 14 | 14 | 15 |
Kích cỡ | 50 | 60 | 70 | 80 | 90 | 100 | 110 | 120 | 130 | 140 | 150 |
Mã nguồn
const xArray = [50,60,70,80,90,100,110,120,130,140,150];
const yArray = [7,8,8,9,9,9,10,11,14,14,15];
// Define Data
const data = [{
x: xArray,
y:yArray,
mode:"lines"
}];
// Define Layout
const layout = {
xaxis: {range: [40, 160], title: "Square Meters"},
yaxis: {range: [5, 16], title: "Price in Millions"},
title: "House Prices vs Size"
};
// Display with Plotly
Plotly.newPlot("myPlot", data, layout);
Khi nào nên sử dụng biểu đồ phân tán
Biểu đồ phân tán rất phù hợp cho:
- Nhìn thấy “Bức tranh lớn”
- So sánh các giá trị khác nhau
- Khám phá xu hướng tiềm năng
- Khám phá các mẫu trong dữ liệu
- Khám phá mối quan hệ giữa dữ liệu
- Khám phá các cụm và mối tương quan