Mã hóa/Giải mã UTF-8
Công cụ mã hóa/giải mã UTF-8 miễn phí trực tuyến, chuyển đổi codepoint Unicode
Mã hóa UTF-8 là gì?
UTF-8 là mã hóa ký tự có độ rộng thay đổi đại diện cho mọi ký tự trong tiêu chuẩn Unicode. Nó sử dụng một đến bốn byte mỗi ký tự và là mã hóa thống trị cho World Wide Web. Ký tự ASCII (0-127) sử dụng một byte, khiến UTF-8 tương thích ngược với ASCII.
Cách sử dụng UTF-8 Encoder/Decoder này
Nhập văn bản để xem code point Unicode của nó ở định dạng U+XXXX. Nhập code point để giải mã lại thành văn bản. Công cụ này giúp bạn kiểm tra và gỡ lỗi vấn đề mã hóa ký tự, đặc biệt với nội dung đa ngôn ngữ và ký tự đặc biệt.
▶Code point Unicode là gì?
Code point là số duy nhất được gán cho mỗi ký tự trong tiêu chuẩn Unicode. Ví dụ, U+0041 là 'A', U+4F60 là '你'. Code point nằm trong phạm vi từ U+0000 đến U+10FFFF.
▶UTF-8 khác UTF-16 như thế nào?
UTF-8 sử dụng 1-4 byte mỗi ký tự và tương thích ASCII. UTF-16 sử dụng 2 hoặc 4 byte mỗi ký tự. UTF-8 là mã hóa phổ biến nhất cho nội dung web, trong khi UTF-16 được sử dụng nội bộ bởi một số hệ thống như Windows và JavaScript.
▶Tại sao một số ký tự hiển thị dưới dạng dấu hỏi hoặc hình vuông?
Điều này thường có nghĩa là font không chứa glyph cho code point Unicode đó. Ký tự đã được mã hóa đúng nhưng không thể được hiển thị bởi font có sẵn trên hệ thống của bạn.