Menu
×

Được chứng nhận

Ghi lại kiến ​​thức của bạn

Đăng nhập Đăng ký

Tạo Tài khoản Example.com.vn miễn phí để cải thiện trải nghiệm học tập của bạn

Người tìm đường và việc học của tôi

Theo dõi tiến độ học tập của bạn tại Example.com.vn và thu thập phần thưởng

Nâng cấp

Trở thành người dùng PLUS và mở khóa các tính năng mạnh mẽ (không có quảng cáo, lưu trữ, hỗ trợ, ..)

Bắt đầu từ đâu

Bạn không chắc chắn muốn bắt đầu từ đâu? Đi theo con đường được hướng dẫn của chúng tôi

Trình chỉnh sửa mã (Dùng thử)

Với trình chỉnh sửa mã trực tuyến của chúng tôi, bạn có thể chỉnh sửa mã và xem kết quả trong trình duyệt của mình

Video

Tìm hiểu những điều cơ bản về HTML qua video hướng dẫn thú vị và hấp dẫn

Mẫu

Chúng tôi đã tạo một loạt mẫu trang web đáp ứng mà bạn có thể sử dụng - miễn phí!

Web hosting

Lưu trữ trang web của riêng bạn và chia sẻ nó với mọi người với Example.com.vn Spaces

Tạo một máy chủ

Tạo máy chủ của riêng bạn bằng Python, PHP, React.js, Node.js, Java, C#, v.v.

Làm thế nào để

Bộ sưu tập lớn các đoạn mã cho HTML, CSS và JavaScript

Khung CSS

Xây dựng các trang web nhanh và phản hồi bằng cách sử dụng khung W3.CSS miễn phí của chúng tôi

Thống kê trình duyệt

Đọc xu hướng dài hạn của việc sử dụng trình duyệt

Tốc độ gõ

Kiểm tra tốc độ đánh máy của bạn

Đào tạo AWS

Tìm hiểu dịch vụ web của Amazon

Bộ chọn màu

Sử dụng công cụ chọn màu của chúng tôi để tìm các màu RGB, HEX và HSL khác nhau. Bánh xe màu hình tròn thể hiện sự chuyển màu trong quang phổ

Trò chơi mã

Trò chơi mã hóa W3Schools! Giúp linh miêu thu thập nón thông Logo Lynx

Đặt mục tiêu

Nhận hành trình học tập được cá nhân hóa dựa trên các kỹ năng và mục tiêu hiện tại của bạn

Bản tin

Tham gia bản tin của chúng tôi và có quyền truy cập vào nội dung độc quyền mỗi tháng

Việc làm

Thuê những tài năng công nghệ hàng đầu. Hợp lý hóa quy trình tuyển dụng của bạn để có đội ngũ phù hợp hoàn hảo

Lớp học

Hãy liên hệ để sử dụng Example.com.vn Plus và các chứng chỉ với tư cách là một tổ chức giáo dục

×
HTML CSS JAVASCRIPT SQL PYTHON JAVA PHP CÁCH W3.CSS C C++ C# BOOTSTRAP REACT MYSQL JQUERY EXCEL XML DJANGO NUMPY PANDAS NODEJS R TYPESCRIPT ANGULAR GIT POSTGRESQL MONGODB ASP AI GO KOTLIN SASS VUE DSA GEN AI SCIPY AWS AN NINH MẠNG DỮ LIỆU KHOA HỌC

Hướng dẫn Python

Python TRANG CHỦ Python Giới thiệu Python Python Bắt đầu Cú pháp Python Bình luận Python Biến Python Các kiểu dữ liệu Python Số Python Python Casting Chuỗi Python Python Booleans Toán tử Python Danh sách Python Bộ dữ liệu Python Bộ Python Từ điển Python Python If...Else Python While Loops Python For Loops Hàm Python Python Lambda Python Mảng Python Lớp/Đối tượng Python Kế thừa Python Vòng lặp Python Đa hình Python Phạm vi Python Mô-đun Python Python Ngày tháng Toán học Python Python JSON Python RegEx Python PIP Python Thử...Ngoại trừ người dùng Python Nhập định dạng chuỗi Python

Xử lý tập tin

Xử lý tệp Python Python Đọc tệp Python Viết/Tạo tệp Python Xóa tệp

Mô-đun Python

Hướng dẫn NumPy Hướng dẫn Pandas Hướng dẫn SciPy Hướng dẫn Django

Python Matplotlib

Matplotlib Giới thiệu Matplotlib Bắt đầu Matplotlib Pyplot Matplotlib Vẽ đồ thị Matplotlib Dấu Matplotlib Dòng Matplotlib Nhãn Matplotlib Lưới Matplotlib Subplot Matplotlib Phân tán Thanh Matplotlib Matplotlib Biểu đồ Matplotlib Biểu đồ hình tròn

Học máy

Bắt đầu Chế độ trung bình trung bình Độ lệch chuẩn Phân vị phần trăm Phân phối dữ liệu Phân phối dữ liệu bình thường Phân tán Biểu đồ Hồi quy tuyến tính Hồi quy đa thức Đa hồi quy Thang đo Train/Test Cây quyết định Ma trận nhầm lẫn Phân cụm phân cấp Hồi quy logistic Tìm kiếm lưới Dữ liệu phân loại K-mean Bootstrap Tổng hợp Xác thực chéo AUC - ROC Curve K- hàng xóm gần nhất

Python MySQL

MySQL Bắt đầu MySQL Tạo cơ sở dữ liệu MySQL Tạo bảng MySQL Chèn MySQL Chọn MySQL Nơi MySQL Thứ tự theo MySQL Xóa MySQL Drop Table Cập nhật MySQL Giới hạn MySQL MySQL Tham gia

Python MongoDB

MongoDB Bắt đầu MongoDB Tạo DB Bộ sưu tập MongoDB MongoDB Chèn MongoDB Tìm Truy vấn MongoDB MongoDB Sắp xếp MongoDB Xóa Bộ sưu tập thả MongoDB Cập nhật MongoDB Giới hạn MongoDB

Tham khảo Python

Tổng quan về Python Các hàm dựng sẵn của Python Phương thức chuỗi Python Phương thức danh sách Python Phương thức từ điển Python Phương thức Tuple Python Phương thức Python Set Phương thức tệp Python Từ khóa Python Ngoại lệ Python Bảng thuật ngữ Python

Tham khảo mô-đun

Yêu cầu mô-đun ngẫu nhiên Mô-đun thống kê Mô-đun Toán học Mô-đun cMath

Python Cách thực hiện

Xóa danh sách trùng lặp Đảo ngược một chuỗi Thêm hai số

Ví dụ về Python

Ví dụ về Python Trình biên dịch Python Bài tập Python Bài kiểm tra Python Máy chủ Python Python Bootcamp Chứng chỉ Python

Học máy - Cây quyết định



Cây quyết định

Trong chương này chúng tôi sẽ hướng dẫn bạn cách tạo "Cây quyết định". Cây quyết định là một sơ đồ luồng và có thể giúp bạn đưa ra quyết định dựa trên kinh nghiệm trước đó.

Trong ví dụ này, một người sẽ cố gắng quyết định xem mình có nên đi xem một chương trình hài kịch hay không.

May mắn thay, người mẫu của chúng tôi đã đăng ký mỗi khi có một buổi biểu diễn hài kịch trong thị trấn và đăng ký một số thông tin về diễn viên hài, đồng thời đăng ký xem anh ấy/cô ấy có đi hay không.

Tuổi Kinh nghiệm Thứ hạng Quốc tịch Đi
36 10 9 Vương quốc Anh KHÔNG
42 12 4 Hoa Kỳ KHÔNG
23 4 6 N KHÔNG
52 4 4 Hoa Kỳ KHÔNG
43 21 số 8 Hoa Kỳ ĐÚNG
44 14 5 Vương quốc Anh KHÔNG
66 3 7 N ĐÚNG
35 14 9 Vương quốc Anh ĐÚNG
52 13 7 N ĐÚNG
35 5 9 N ĐÚNG
24 3 5 Hoa Kỳ KHÔNG
18 3 7 Vương quốc Anh ĐÚNG
45 9 9 Vương quốc Anh ĐÚNG

Giờ đây, dựa trên tập dữ liệu này, Python có thể tạo một cây quyết định có thể được sử dụng để quyết định xem có chương trình mới nào đáng tham dự hay không.



Làm thế nào nó hoạt động?

Đầu tiên, đọc tập dữ liệu với gấu trúc:

Ví dụ

Đọc và in tập dữ liệu:

import pandas

df = pandas.read_csv("data.csv")

print(df)

Chạy ví dụ »

Để tạo cây quyết định, tất cả dữ liệu phải ở dạng số.

Chúng ta phải chuyển đổi các cột không phải số 'Quốc tịch' và 'Đi' thành các giá trị số.

Pandas có phương thức map() lấy từ điển có thông tin về cách chuyển đổi các giá trị.

{'UK': 0, 'USA': 1, 'N': 2}

Có nghĩa là chuyển đổi các giá trị 'UK' thành 0, 'USA' thành 1 và 'N' thành 2.

Ví dụ

Thay đổi giá trị chuỗi thành giá trị số:

d = {'UK': 0, 'USA': 1, 'N': 2}
df['Nationality'] = df['Nationality'].map(d)
d = {'YES': 1, 'NO': 0}
df['Go'] = df['Go'].map(d)

print(df)

Chạy ví dụ »

Sau đó, chúng ta phải tách các cột tính năng khỏi cột mục tiêu .

Các cột tính năng là các cột mà chúng tôi cố gắng dự đoán từ đó và cột mục tiêu là cột có các giá trị mà chúng tôi cố gắng dự đoán.

Ví dụ

X là cột tính năng, y là cột mục tiêu:

features = ['Age', 'Experience', 'Rank', 'Nationality']

X = df[features]
y = df['Go']

print(X)
print(y)

Chạy ví dụ »

Bây giờ chúng ta có thể tạo cây quyết định thực tế, điều chỉnh nó phù hợp với các chi tiết của chúng ta. Bắt đầu bằng cách nhập các mô-đun chúng tôi cần:

Ví dụ

Tạo và hiển thị Cây quyết định:

import pandas
from sklearn import tree
from sklearn.tree import DecisionTreeClassifier
import matplotlib.pyplot as plt

df = pandas.read_csv("data.csv")

d = {'UK': 0, 'USA': 1, 'N': 2}
df['Nationality'] = df['Nationality'].map(d)
d = {'YES': 1, 'NO': 0}
df['Go'] = df['Go'].map(d)

features = ['Age', 'Experience', 'Rank', 'Nationality']

X = df[features]
y = df['Go']

dtree = DecisionTreeClassifier()
dtree = dtree.fit(X, y)

tree.plot_tree(dtree, feature_names=features)

Chạy ví dụ »


Kết quả được giải thích

Cây quyết định sử dụng các quyết định trước đó của bạn để tính toán khả năng bạn có muốn đi xem diễn viên hài hay không.

Chúng ta hãy đọc các khía cạnh khác nhau của cây quyết định:

Thứ hạng

Rank <= 6.5 nghĩa là mọi diễn viên hài có hạng từ 6,5 trở xuống sẽ đi theo mũi tên True (ở bên trái), còn lại sẽ đi theo Mũi tên False (ở bên phải).

gini = 0.497 đề cập đến chất lượng của phần phân tách và luôn là một số nằm trong khoảng từ 0,0 đến 0,5, trong đó 0,0 có nghĩa là tất cả các mẫu đều có cùng kết quả và 0,5 có nghĩa là việc phân chia được thực hiện chính xác ở giữa.

samples = 13 có nghĩa là đến thời điểm này còn lại 13 diễn viên hài trong quyết định, đó là tất cả vì đây là bước đầu tiên.

value = [6, 7] nghĩa là trong số 13 nghệ sĩ hài này, 6 người sẽ nhận được "KHÔNG" và 7 người sẽ nhận được "ĐI".

Gini

Có nhiều cách để chia mẫu, chúng tôi sử dụng phương pháp GINI trong hướng dẫn này.

Phương pháp Gini sử dụng công thức này:

Gini = 1 - (x/n) 2 - (y/n) 2

Trong đó x là số câu trả lời tích cực ("GO"), n là số lượng mẫu và y là số câu trả lời phủ định ("NO"), cho chúng ta phép tính này:

1 - (7 / 13) 2 - (6 / 13) 2 = 0.497

Bước tiếp theo có hai hộp, một hộp dành cho các diễn viên hài có 'Xếp hạng' từ 6,5 trở xuống và một hộp dành cho những người còn lại.

Đúng - 5 diễn viên hài kết thúc ở đây:

gini = 0.0 có nghĩa là tất cả các mẫu đều có kết quả như nhau.

samples = 5 nghĩa là còn lại 5 diễn viên hài trong nhánh này (5 diễn viên hài có Rank từ 6,5 trở xuống).

value = [5, 0] có nghĩa là 5 sẽ nhận được "KHÔNG" và 0 sẽ nhận được "ĐI".

Sai - 8 diễn viên hài tiếp tục:

Quốc tịch

Nationality <= 0.5 có nghĩa là các diễn viên hài có giá trị quốc tịch nhỏ hơn 0,5 sẽ đi theo mũi tên bên trái (có nghĩa là tất cả mọi người đến từ Vương quốc Anh, ), và những người còn lại sẽ đi theo mũi tên bên phải.

gini = 0.219 có nghĩa là khoảng 22% số mẫu sẽ đi theo một hướng.

samples = 8 nghĩa là còn lại 8 diễn viên hài trong nhánh này (8 diễn viên hài có Rank cao hơn 6,5).

value = [1, 7] nghĩa là trong 8 diễn viên hài này, 1 người sẽ nhận được "KHÔNG" và 7 người sẽ nhận được "ĐI".




Đúng - 4 diễn viên hài tiếp tục:

Tuổi

Age <= 35.5 có nghĩa là các diễn viên hài ở độ tuổi 35,5 trở xuống sẽ đi theo mũi tên sang trái, còn lại sẽ đi theo mũi tên sang phải.

gini = 0.375 có nghĩa là khoảng 37,5% số mẫu sẽ đi theo một hướng.

samples = 4 nghĩa là còn lại 4 nghệ sĩ hài ở nhánh này (4 nghệ sĩ hài đến từ Anh).

value = [1, 3] nghĩa là trong 4 diễn viên hài này, 1 người sẽ nhận được "KHÔNG" và 3 người sẽ nhận được "ĐI".

Sai - 4 diễn viên hài kết thúc ở đây:

gini = 0.0 có nghĩa là tất cả các mẫu đều có kết quả như nhau.

samples = 4 nghĩa là còn lại 4 diễn viên hài ở nhánh này (4 diễn viên hài không đến từ Vương quốc Anh).

value = [0, 4] nghĩa là trong 4 diễn viên hài này, 0 sẽ nhận điểm "KHÔNG" và 4 sẽ nhận điểm "ĐI".




Đúng - 2 Diễn Viên Hài Kết Thúc Tại Đây:

gini = 0.0 có nghĩa là tất cả các mẫu đều có kết quả như nhau.

samples = 2 nghĩa là nhánh này còn lại 2 diễn viên hài (2 diễn viên hài ở độ tuổi 35,5 trở xuống).

value = [0, 2] nghĩa là trong 2 diễn viên hài này, 0 sẽ nhận điểm "KHÔNG" và 2 sẽ nhận điểm "ĐI".

Sai - 2 diễn viên hài tiếp tục:

Kinh nghiệm

Experience <= 9.5 có nghĩa là diễn viên hài có 9,5 năm kinh nghiệm trở xuống sẽ đi theo mũi tên sang trái, còn lại sẽ đi theo mũi tên sang phải.

gini = 0.5 có nghĩa là 50% số mẫu sẽ đi theo một hướng.

samples = 2 nghĩa là nhánh này còn lại 2 diễn viên hài (2 diễn viên hài lớn hơn 35,5 tuổi).

value = [1, 1] nghĩa là trong 2 diễn viên hài này, 1 người sẽ nhận được "KHÔNG" và 1 người sẽ nhận được "ĐI".




Đúng - 1 Diễn Viên Hài Kết Thúc Tại Đây:

gini = 0.0 có nghĩa là tất cả các mẫu đều có kết quả như nhau.

samples = 1 nghĩa là ngành này còn lại 1 diễn viên hài (1 diễn viên hài có 9,5 năm kinh nghiệm trở xuống).

value = [0, 1] có nghĩa là 0 sẽ nhận được "KHÔNG" và 1 sẽ nhận được "ĐI".

Sai - 1 diễn viên hài kết thúc ở đây:

gini = 0.0 có nghĩa là tất cả các mẫu đều có kết quả như nhau.

samples = 1 nghĩa là ngành này còn lại 1 diễn viên hài (1 diễn viên hài có trên 9,5 năm kinh nghiệm).

value = [1, 0] có nghĩa là 1 sẽ nhận được "KHÔNG" và 0 sẽ nhận được "ĐI".


Dự đoán giá trị

Chúng ta có thể sử dụng Cây quyết định để dự đoán các giá trị mới.

Ví dụ: Tôi có nên đi xem một chương trình có sự tham gia của một diễn viên hài người Mỹ 40 tuổi, có 10 năm kinh nghiệm và xếp hạng hài kịch là 7 không?

Ví dụ

Sử dụng phương thức dự đoán() để dự đoán các giá trị mới:

print(dtree.predict([[40, 10, 7, 1]]))

Chạy ví dụ »

Ví dụ

Câu trả lời sẽ là gì nếu xếp hạng hài kịch là 6?

print(dtree.predict([[40, 10, 6, 1]]))

Chạy ví dụ »


Kết quả khác nhau

Bạn sẽ thấy rằng Cây Quyết định mang lại cho bạn các kết quả khác nhau nếu bạn chạy nó đủ số lần, ngay cả khi bạn cung cấp cho nó cùng một dữ liệu.

Đó là vì Cây quyết định không cho chúng ta câu trả lời chắc chắn 100%. Nó dựa trên xác suất của một kết quả và câu trả lời sẽ khác nhau.


×

Liên hệ bán hàng

Nếu bạn muốn sử dụng dịch vụ của Example.com.vn với tư cách là một tổ chức giáo dục, nhóm hoặc doanh nghiệp, hãy gửi email cho chúng tôi:
[email được bảo vệ]

Báo cáo lỗi

Nếu bạn muốn báo cáo lỗi hoặc nếu bạn muốn đưa ra đề xuất, hãy gửi email cho chúng tôi:
[email được bảo vệ]

Example.com.vn được tối ưu hóa cho việc học tập và đào tạo. Các ví dụ có thể được đơn giản hóa để cải thiện khả năng đọc và học. Các hướng dẫn, tài liệu tham khảo và ví dụ liên tục được xem xét để tránh sai sót, nhưng chúng tôi không thể đảm bảo tính chính xác hoàn toàn của mọi nội dung. Khi sử dụng W3Schools, bạn đồng ý đã đọc và chấp nhận các điều khoản sử dụng , chính sách cookie và quyền riêng tư của chúng tôi.

Bản quyền 1999-2024 của Refsnes Data. Đã đăng ký Bản quyền. Example.com.vn được cung cấp bởi W3.CSS .