Menu
×

Được chứng nhận

Ghi lại kiến ​​thức của bạn

Đăng nhập Đăng ký

Tạo Tài khoản Example.com.vn miễn phí để cải thiện trải nghiệm học tập của bạn

Người tìm đường và việc học của tôi

Theo dõi tiến độ học tập của bạn tại Example.com.vn và thu thập phần thưởng

Nâng cấp

Trở thành người dùng PLUS và mở khóa các tính năng mạnh mẽ (không có quảng cáo, lưu trữ, hỗ trợ, ..)

Bắt đầu từ đâu

Bạn không chắc chắn muốn bắt đầu từ đâu? Đi theo con đường được hướng dẫn của chúng tôi

Trình chỉnh sửa mã (Dùng thử)

Với trình chỉnh sửa mã trực tuyến của chúng tôi, bạn có thể chỉnh sửa mã và xem kết quả trong trình duyệt của mình

Video

Tìm hiểu những điều cơ bản về HTML qua video hướng dẫn thú vị và hấp dẫn

Mẫu

Chúng tôi đã tạo một loạt mẫu trang web đáp ứng mà bạn có thể sử dụng - miễn phí!

Web hosting

Lưu trữ trang web của riêng bạn và chia sẻ nó với mọi người với Example.com.vn Spaces

Tạo một máy chủ

Tạo máy chủ của riêng bạn bằng Python, PHP, React.js, Node.js, Java, C#, v.v.

Làm thế nào để

Bộ sưu tập lớn các đoạn mã cho HTML, CSS và JavaScript

Khung CSS

Xây dựng các trang web nhanh và phản hồi bằng cách sử dụng khung W3.CSS miễn phí của chúng tôi

Thống kê trình duyệt

Đọc xu hướng dài hạn của việc sử dụng trình duyệt

Tốc độ gõ

Kiểm tra tốc độ đánh máy của bạn

Đào tạo AWS

Tìm hiểu dịch vụ web của Amazon

Bộ chọn màu

Sử dụng công cụ chọn màu của chúng tôi để tìm các màu RGB, HEX và HSL khác nhau. Bánh xe màu hình tròn thể hiện sự chuyển màu trong quang phổ

Trò chơi mã

Trò chơi mã hóa W3Schools! Giúp linh miêu thu thập nón thông Logo Lynx

Đặt mục tiêu

Nhận hành trình học tập được cá nhân hóa dựa trên các kỹ năng và mục tiêu hiện tại của bạn

Bản tin

Tham gia bản tin của chúng tôi và có quyền truy cập vào nội dung độc quyền mỗi tháng

Việc làm

Thuê những tài năng công nghệ hàng đầu. Hợp lý hóa quy trình tuyển dụng của bạn để có đội ngũ phù hợp hoàn hảo

Lớp học

Hãy liên hệ để sử dụng Example.com.vn Plus và các chứng chỉ với tư cách là một tổ chức giáo dục

×
HTML CSS JAVASCRIPT SQL PYTHON JAVA PHP CÁCH W3.CSS C C++ C# BOOTSTRAP REACT MYSQL JQUERY EXCEL XML DJANGO NUMPY PANDAS NODEJS R TYPESCRIPT ANGULAR GIT POSTGRESQL MONGODB ASP AI GO KOTLIN SASS VUE DSA GEN AI SCIPY AWS AN NINH MẠNG DỮ LIỆU KHOA HỌC

Hướng dẫn Python

Python TRANG CHỦ Python Giới thiệu Python Python Bắt đầu Cú pháp Python Bình luận Python Biến Python Các kiểu dữ liệu Python Số Python Python Casting Chuỗi Python Python Booleans Toán tử Python Danh sách Python Bộ dữ liệu Python Bộ Python Từ điển Python Python If...Else Python While Loops Python For Loops Hàm Python Python Lambda Python Mảng Python Lớp/Đối tượng Python Kế thừa Python Vòng lặp Python Đa hình Python Phạm vi Python Mô-đun Python Python Ngày tháng Toán học Python Python JSON Python RegEx Python PIP Python Thử...Ngoại trừ người dùng Python Nhập định dạng chuỗi Python

Xử lý tập tin

Xử lý tệp Python Python Đọc tệp Python Viết/Tạo tệp Python Xóa tệp

Mô-đun Python

Hướng dẫn NumPy Hướng dẫn Pandas Hướng dẫn SciPy Hướng dẫn Django

Python Matplotlib

Matplotlib Giới thiệu Matplotlib Bắt đầu Matplotlib Pyplot Matplotlib Vẽ đồ thị Matplotlib Dấu Matplotlib Dòng Matplotlib Nhãn Matplotlib Lưới Matplotlib Subplot Matplotlib Phân tán Thanh Matplotlib Matplotlib Biểu đồ Matplotlib Biểu đồ hình tròn

Học máy

Bắt đầu Chế độ trung bình trung bình Độ lệch chuẩn Phân vị phần trăm Phân phối dữ liệu Phân phối dữ liệu bình thường Phân tán Biểu đồ Hồi quy tuyến tính Hồi quy đa thức Đa hồi quy Thang đo Train/Test Cây quyết định Ma trận nhầm lẫn Phân cụm phân cấp Hồi quy logistic Tìm kiếm lưới Dữ liệu phân loại K-mean Bootstrap Tổng hợp Xác thực chéo AUC - ROC Curve K- hàng xóm gần nhất

Python MySQL

MySQL Bắt đầu MySQL Tạo cơ sở dữ liệu MySQL Tạo bảng MySQL Chèn MySQL Chọn MySQL Nơi MySQL Thứ tự theo MySQL Xóa MySQL Drop Table Cập nhật MySQL Giới hạn MySQL MySQL Tham gia

Python MongoDB

MongoDB Bắt đầu MongoDB Tạo DB Bộ sưu tập MongoDB MongoDB Chèn MongoDB Tìm Truy vấn MongoDB MongoDB Sắp xếp MongoDB Xóa Bộ sưu tập thả MongoDB Cập nhật MongoDB Giới hạn MongoDB

Tham khảo Python

Tổng quan về Python Các hàm dựng sẵn của Python Phương thức chuỗi Python Phương thức danh sách Python Phương thức từ điển Python Phương thức Tuple Python Phương thức Python Set Phương thức tệp Python Từ khóa Python Ngoại lệ Python Bảng thuật ngữ Python

Tham khảo mô-đun

Yêu cầu mô-đun ngẫu nhiên Mô-đun thống kê Mô-đun Toán học Mô-đun cMath

Python Cách thực hiện

Xóa danh sách trùng lặp Đảo ngược một chuỗi Thêm hai số

Ví dụ về Python

Ví dụ về Python Trình biên dịch Python Bài tập Python Bài kiểm tra Python Máy chủ Python Python Bootcamp Chứng chỉ Python

Học máy - Xác thực chéo


Trên trang này, W3schools.com hợp tác với Học viện Khoa học Dữ liệu NYC để cung cấp nội dung đào tạo kỹ thuật số cho sinh viên của chúng tôi.


Xác thực chéo

Khi điều chỉnh các mô hình, chúng tôi hướng tới việc tăng hiệu suất tổng thể của mô hình trên dữ liệu chưa được nhìn thấy. Điều chỉnh siêu tham số có thể mang lại hiệu suất tốt hơn nhiều trên các bộ thử nghiệm. Tuy nhiên, việc tối ưu hóa các tham số cho tập kiểm tra có thể dẫn đến rò rỉ thông tin khiến mô hình hoạt động kém hơn trên dữ liệu không nhìn thấy được. Để khắc phục điều này, chúng tôi có thể thực hiện xác nhận chéo.

Để hiểu rõ hơn về CV, chúng tôi sẽ thực hiện các phương pháp khác nhau trên tập dữ liệu mống mắt. Trước tiên chúng ta hãy tải vào và phân tách dữ liệu.

from sklearn import datasets

X, y = datasets.load_iris(return_X_y=True)

Có nhiều phương pháp để xác thực chéo, chúng ta sẽ bắt đầu bằng cách xem xét xác thực chéo k-Fold.


K -Fold

Dữ liệu huấn luyện được sử dụng trong mô hình được chia thành k tập nhỏ hơn để sử dụng để xác nhận mô hình. Mô hình sau đó được huấn luyện trên tập huấn luyện k-1. Phần còn lại sau đó được sử dụng làm bộ xác thực để đánh giá mô hình.

Vì chúng ta sẽ cố gắng phân loại các loài hoa diên vĩ khác nhau nên chúng ta sẽ cần nhập một mô hình phân loại, đối với bài tập này, chúng ta sẽ sử dụng DecisionTreeClassifier . Chúng tôi cũng sẽ cần nhập mô-đun CV từ sklearn .

from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import KFold, cross_val_score

Với dữ liệu được tải, giờ đây chúng ta có thể tạo và điều chỉnh mô hình để đánh giá.

clf = DecisionTreeClassifier(random_state=42)

Bây giờ, hãy đánh giá mô hình của chúng tôi và xem nó hoạt động như thế nào trên mỗi lần k -fold.

k_folds = KFold(n_splits = 5)

scores = cross_val_score(clf, X, y, cv = k_folds)

Bạn cũng nên xem CV hoạt động tổng thể như thế nào bằng cách tính điểm trung bình cho tất cả các lần gấp.

Ví dụ

Chạy CV gấp k:

from sklearn import datasets
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import KFold, cross_val_score

X, y = datasets.load_iris(return_X_y=True)

clf = DecisionTreeClassifier(random_state=42)

k_folds = KFold(n_splits = 5)

scores = cross_val_score(clf, X, y, cv = k_folds)

print("Cross Validation Scores: ", scores)
print("Average CV Score: ", scores.mean())
print("Number of CV Scores used in Average: ", len(scores))
Chạy ví dụ »

QUẢNG CÁO


K-Fold phân tầng

Trong trường hợp các lớp bị mất cân bằng, chúng ta cần một cách để giải quyết sự mất cân bằng trong cả tập huấn luyện và tập xác thực. Để làm như vậy, chúng ta có thể phân tầng các lớp mục tiêu, nghĩa là cả hai bộ sẽ có tỷ lệ tất cả các lớp bằng nhau.

Ví dụ

from sklearn import datasets
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import StratifiedKFold, cross_val_score

X, y = datasets.load_iris(return_X_y=True)

clf = DecisionTreeClassifier(random_state=42)

sk_folds = StratifiedKFold(n_splits = 5)

scores = cross_val_score(clf, X, y, cv = sk_folds)

print("Cross Validation Scores: ", scores)
print("Average CV Score: ", scores.mean())
print("Number of CV Scores used in Average: ", len(scores))
Chạy ví dụ »

Mặc dù số lần gấp là như nhau nhưng CV trung bình sẽ tăng so với lần gấp k cơ bản khi đảm bảo có các lớp được phân tầng.


Nghỉ phép một lần (LOO)

Thay vì chọn số lần phân chia trong tập dữ liệu huấn luyện như LeaveOneOut gấp k lần, hãy sử dụng 1 quan sát để xác thực và n-1 quan sát để huấn luyện. Phương pháp này là một kỹ thuật đầy đủ.

Ví dụ

Chạy LOO CV:

from sklearn import datasets
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import LeaveOneOut, cross_val_score

X, y = datasets.load_iris(return_X_y=True)

clf = DecisionTreeClassifier(random_state=42)

loo = LeaveOneOut()

scores = cross_val_score(clf, X, y, cv = loo)

print("Cross Validation Scores: ", scores)
print("Average CV Score: ", scores.mean())
print("Number of CV Scores used in Average: ", len(scores))
Chạy ví dụ »

Chúng ta có thể quan sát thấy rằng số điểm xác thực chéo được thực hiện bằng số lượng quan sát trong tập dữ liệu. Trong trường hợp này có 150 quan sát trong tập dữ liệu mống mắt.

Điểm CV trung bình là 94%.


Nghỉ phép P-Out (LPO)

Leave-P-Out chỉ đơn giản là một sự khác biệt về sắc thái đối với ý tưởng Leave-One-Out, trong đó chúng ta có thể chọn số lượng p để sử dụng trong bộ xác thực của mình.

Ví dụ

Chạy CV LPO:

from sklearn import datasets
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import LeavePOut, cross_val_score

X, y = datasets.load_iris(return_X_y=True)

clf = DecisionTreeClassifier(random_state=42)

lpo = LeavePOut(p=2)

scores = cross_val_score(clf, X, y, cv = lpo)

print("Cross Validation Scores: ", scores)
print("Average CV Score: ", scores.mean())
print("Number of CV Scores used in Average: ", len(scores))
Chạy ví dụ »

Như chúng ta có thể thấy đây là một phương pháp toàn diện, chúng tôi tính toán nhiều điểm hơn so với Bỏ một lần, ngay cả với ap = 2, nhưng nó đạt được điểm CV trung bình gần như nhau.


Chia ngẫu nhiên

Không giống như KFold , ShuffleSplit loại bỏ một phần trăm dữ liệu, không được sử dụng trong tập huấn luyện hoặc tập hợp xác thực. Để làm như vậy, chúng ta phải quyết định kích thước đoàn tàu và thử nghiệm cũng như số lần phân chia.

Ví dụ

Chạy ngẫu nhiên chia CV:

from sklearn import datasets
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import ShuffleSplit, cross_val_score

X, y = datasets.load_iris(return_X_y=True)

clf = DecisionTreeClassifier(random_state=42)

ss = ShuffleSplit(train_size=0.6, test_size=0.3, n_splits = 5)

scores = cross_val_score(clf, X, y, cv = ss)

print("Cross Validation Scores: ", scores)
print("Average CV Score: ", scores.mean())
print("Number of CV Scores used in Average: ", len(scores))
Chạy ví dụ »

Ghi chú kết thúc

Đây chỉ là một số phương pháp CV có thể áp dụng cho người mẫu. Có nhiều lớp xác thực chéo hơn, hầu hết các mô hình đều có lớp riêng. Kiểm tra xác thực chéo sklearns để có thêm tùy chọn CV.


×

Liên hệ bán hàng

Nếu bạn muốn sử dụng dịch vụ của Example.com.vn với tư cách là một tổ chức giáo dục, nhóm hoặc doanh nghiệp, hãy gửi email cho chúng tôi:
[email được bảo vệ]

Báo cáo lỗi

Nếu bạn muốn báo cáo lỗi hoặc nếu bạn muốn đưa ra đề xuất, hãy gửi email cho chúng tôi:
[email được bảo vệ]

Example.com.vn được tối ưu hóa cho việc học tập và đào tạo. Các ví dụ có thể được đơn giản hóa để cải thiện khả năng đọc và học. Các hướng dẫn, tài liệu tham khảo và ví dụ liên tục được xem xét để tránh sai sót, nhưng chúng tôi không thể đảm bảo tính chính xác hoàn toàn của mọi nội dung. Khi sử dụng W3Schools, bạn đồng ý đã đọc và chấp nhận các điều khoản sử dụng , chính sách cookie và quyền riêng tư của chúng tôi.

Bản quyền 1999-2024 của Refsnes Data. Đã đăng ký Bản quyền. Example.com.vn được cung cấp bởi W3.CSS .