Bộ ký tự HTML
Để hiển thị chính xác một trang HTML, trình duyệt phải biết bộ ký tự (mã hóa) nào sẽ sử dụng:
Ví dụ
<meta charset="UTF-8">
Bộ ký tự HTML
Tất cả các ngôn ngữ máy tính hiện đại đều sử dụng bộ ký tự UTF-8 làm mặc định.
Mã hóa cho web đầu tiên là ASCII . ASCII sử dụng 7 bit cho ký tự và chỉ có thể biểu thị 128 ký tự khác nhau (chữ cái tiếng Anh).
Để xem kỹ hơn, hãy nghiên cứu Tài liệu tham khảo ASCII hoàn chỉnh của chúng tôi.
Windows-1252 là bộ ký tự đầu tiên trong Windows. Đó là một bản sao của ASCII, nhưng sử dụng 8 bit để thể hiện 256 ký tự khác nhau (chữ cái quốc tế). Windows-1252 được hỗ trợ bởi tất cả các trình duyệt.
Để xem kỹ hơn, hãy nghiên cứu Tài liệu tham khảo Windows-1252 hoàn chỉnh của chúng tôi.
HTML 4: ISO-8859-1
Ký tự mặc định từ HTML 2.0 đến HTML 4.01 là ISO-8859-1.
ISO-8859-1 là phần mở rộng của ASCII, có thêm các ký tự quốc tế.
Ví dụ
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Trong HTML 4, bộ ký tự khác với ISO-8859-1 có thể được chỉ định trong thẻ <meta>:
Ví dụ
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">
Tất cả bộ xử lý HTML 4 cũng hỗ trợ UTF-8:
Ví dụ
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
Khi trình duyệt phát hiện ISO-8859-1, nó thường mặc định là Windows-1252, vì Windows-1252 có thêm 32 ký tự quốc tế.
Để xem kỹ hơn, vui lòng nghiên cứu: Tài liệu tham khảo ISO-8859-1 hoàn chỉnh
Trong HTML5: Unicode UTF-8
Đặc tả HTML5 khuyến khích các nhà phát triển web sử dụng bộ ký tự UTF-8.
Ví dụ
<meta charset="UTF-8">
Một bộ ký tự khác với UTF-8 có thể được chỉ định trong thẻ <meta>:
Ví dụ
<meta charset="ISO-8859-1">
Hiệp hội Unicode đã phát triển các tiêu chuẩn UTF-8 và UTF-16, vì bộ ký tự ISO-8859 bị hạn chế và không tương thích với môi trường đa ngôn ngữ.
Tiêu chuẩn Unicode bao gồm (gần như) tất cả các ký tự, dấu câu và ký hiệu trên thế giới.
Tất cả các bộ xử lý HTML5 và XML đều hỗ trợ UTF-8, UTF-16, Windows-1252 và ISO-8859.
Để xem kỹ hơn, vui lòng nghiên cứu: The Complete Unicode Reference .