Thuật ngữ ML
Các danh mục con học máy
- Học tập có giám sát
- Học không giám sát
Học máy được giám sát sử dụng một tập hợp các biến đầu vào để dự đoán giá trị của biến đầu ra.
Học máy không giám sát, sử dụng các mẫu từ bất kỳ tập dữ liệu chưa được gắn nhãn nào, cố gắng hiểu các mẫu (hoặc nhóm) trong dữ liệu.
Các giai đoạn học máy
Học máy có hai giai đoạn chính:
1. Đào tạo :
Dữ liệu đầu vào được sử dụng để tính toán các tham số của mô hình.
2. Suy luận :
Mô hình "được đào tạo" đưa ra dữ liệu chính xác từ bất kỳ đầu vào nào.
Mô hình học máy
Mô hình xác định mối quan hệ giữa nhãn (y) và các tính năng (x).
Có ba giai đoạn trong cuộc đời của một người mẫu:
- Thu thập dữ liệu
- Đào tạo
- Sự suy luận
Đào tạo học máy
Mục tiêu của việc đào tạo là tạo ra một mô hình có thể trả lời một câu hỏi. Giống như giá dự kiến cho một ngôi nhà là bao nhiêu?
Suy luận học máy
Suy luận là khi mô hình được đào tạo được sử dụng để suy ra (dự đoán) các giá trị bằng dữ liệu trực tiếp. Giống như việc đưa mô hình vào sản xuất.
Học tập có giám sát
Học có giám sát sử dụng dữ liệu được gắn nhãn (dữ liệu có câu trả lời đã biết) để huấn luyện các thuật toán nhằm:
- Phân loại dữ liệu
- Dự đoán kết quả
Học có giám sát có thể phân loại dữ liệu như "Thư rác trong e-mail là gì" dựa trên các ví dụ thư rác đã biết.
Học có giám sát có thể dự đoán kết quả như dự đoán loại video bạn thích, dựa trên những video bạn đã phát.
Học không giám sát
Học không giám sát được sử dụng để dự đoán các mối quan hệ không xác định như các mẫu có ý nghĩa trong dữ liệu.
Đó là về việc tạo ra các thuật toán máy tính để có thể tự cải thiện chúng.
Dự kiến, học máy sẽ chuyển sang học không giám sát để cho phép các lập trình viên giải quyết vấn đề mà không cần tạo mô hình.
Học tăng cường
Học tăng cường dựa trên học tập không giám sát nhưng nhận được phản hồi từ người dùng cho dù các quyết định đó là tốt hay xấu. Các ý kiến phản hồi góp phần hoàn thiện mô hình.
Học tập tự giám sát
Học tự giám sát tương tự như học không giám sát vì nó hoạt động với dữ liệu mà không có nhãn do con người thêm vào.
Sự khác biệt là học không giám sát sử dụng phân cụm, nhóm và giảm kích thước, trong khi học tự giám sát đưa ra kết luận riêng cho các nhiệm vụ hồi quy và phân loại.
Các thuật ngữ học máy chính là:
- Các mối quan hệ
- Nhãn
- Đặc trưng
- Người mẫu
- Đào tạo
- Sự suy luận
Các mối quan hệ
Hệ thống máy học sử dụng Mối quan hệ giữa các đầu vào để đưa ra Dự đoán .
Trong đại số, một mối quan hệ thường được viết là y = ax + b :
- y là nhãn chúng tôi muốn dự đoán
- a là độ dốc của đường
- x là giá trị đầu vào
- b là giao điểm
Với ML, một mối quan hệ được viết là y = b + wx :
- y là nhãn chúng tôi muốn dự đoán
- w là trọng lượng (độ dốc)
- x là các tính năng (giá trị đầu vào)
- b là giao điểm
Nhãn học máy
Trong thuật ngữ Machine Learning, nhãn là thứ chúng ta muốn dự đoán .
Nó giống như y trong đồ thị tuyến tính:
Đại số học | Học máy |
y = ax + b | y = b + wx |
Tính năng học máy
Trong thuật ngữ Machine Learning, các tính năng là đầu vào .
Chúng giống như các giá trị x trong biểu đồ tuyến tính:
Đại số học | Học máy |
y = a x + b | y = b + w x |
Đôi khi có thể có nhiều tính năng (giá trị đầu vào) với các trọng số khác nhau:
y = b + w 1 x 1 + w 2 x 2 + w 3 x 3 + w 4 x 4