Khoa học dữ liệu - Hàm tuyến tính
Với tư cách là một nhà khoa học dữ liệu, các hàm toán học rất quan trọng vì chúng ta muốn đưa ra dự đoán và diễn giải chúng.
Hàm tuyến tính
Trong toán học, một hàm được sử dụng để liên hệ một biến với một biến khác.
Giả sử chúng ta xem xét mối quan hệ giữa lượng calo đốt cháy và nhịp tim trung bình. Thật hợp lý khi giả định rằng, nói chung, lượng calo tiêu hao sẽ thay đổi khi nhịp tim trung bình thay đổi - chúng ta nói rằng lượng calo đốt cháy phụ thuộc vào nhịp tim trung bình.
Hơn nữa, có thể hợp lý khi cho rằng khi nhịp tim trung bình tăng lên thì lượng calo đốt cháy cũng tăng theo. Lượng calo đốt cháy và nhịp tim trung bình là hai biến số đang được xem xét.
Bởi vì lượng calo tiêu hao phụ thuộc vào nhịp tim trung bình nên chúng ta nói rằng lượng calo đốt cháy là biến phụ thuộc và nhịp tim trung bình là biến độc lập.
Mối quan hệ giữa biến phụ thuộc và biến độc lập thường có thể được biểu diễn bằng toán học bằng công thức (hàm).
Hàm tuyến tính có một biến độc lập (x) và một biến phụ thuộc (y) và có dạng sau:
y = f(x) = ax + b
Hàm này dùng để tính giá trị cho biến phụ thuộc khi chúng ta chọn giá trị cho biến độc lập.
Giải trình:
- f(x) = đầu ra (biến phụ thuộc)
- x = đầu vào (biến độc lập)
- a = độ dốc = là hệ số của biến độc lập. Nó cho biết tốc độ thay đổi của biến phụ thuộc
- b = chặn = là giá trị của biến phụ thuộc khi x = 0. Đây cũng là điểm mà đường chéo cắt trục tung.
Hàm tuyến tính với một biến giải thích
Hàm có một biến giải thích có nghĩa là chúng ta sử dụng một biến để dự đoán.
Giả sử chúng ta muốn dự đoán mức tiêu thụ calo bằng cách sử dụng nhịp tim trung bình. Chúng ta có công thức sau:
f(x) = 2x + 80
Ở đây, các con số và biến có nghĩa là:
- f(x) = Đầu ra. Con số này là nơi chúng ta nhận được giá trị dự đoán của Calorie_Burnage
- x = Đầu vào là Average_Pulse
- 2 = Độ dốc = Chỉ định lượng Calo_Burnage tăng bao nhiêu nếu Average_Pulse tăng thêm một. Nó cho chúng ta biết đường chéo "dốc" như thế nào
- 80 = Chặn = Giá trị cố định. Đó là giá trị của biến phụ thuộc khi x = 0
Vẽ đồ thị hàm tuyến tính
Thuật ngữ tuyến tính có nghĩa là một "đường thẳng". Vì vậy, nếu bạn hiển thị hàm tuyến tính bằng đồ họa, đường thẳng sẽ luôn là đường thẳng. Đường này có thể dốc lên, dốc xuống và trong một số trường hợp có thể nằm ngang hoặc thẳng đứng.
Đây là biểu diễn đồ họa của hàm toán học ở trên:
Giải thích đồ thị:
- Trục ngang thường được gọi là trục x. Ở đây, nó đại diện cho Average_Pulse.
- Trục tung thường được gọi là trục y. Ở đây, nó đại diện cho Calorie_Burnage.
- Calorie_Burnage là một hàm của Average_Pulse, vì Calorie_Burnage được coi là phụ thuộc vào Average_Pulse.
- Nói cách khác, chúng tôi sử dụng Average_Pulse để dự đoán Calorie_Burnage.
- Đường (đường chéo) màu xanh biểu thị cấu trúc của hàm toán học dự đoán mức tiêu thụ calo.