Codificador/Decodificador UTF-8
Ferramenta gratuita online de codificacao/decodificacao UTF-8, conversao de codepoint Unicode
O que é codificação UTF-8?
UTF-8 é uma codificação de caracteres de largura variável que representa cada caractere no padrão Unicode. Usa de um a quatro bytes por caractere e é a codificação dominante para a World Wide Web. Caracteres ASCII (0-127) usam um byte, tornando UTF-8 retrocompatível com ASCII.
Como usar este codificador/decodificador UTF-8
Insira texto para ver seus pontos de código Unicode no formato U+XXXX. Insira pontos de código para decodificá-los de volta para texto. Esta ferramenta ajuda a inspecionar e depurar problemas de codificação de caracteres, especialmente com conteúdo multilíngue e caracteres especiais.
▶O que é um ponto de código Unicode?
Um ponto de código é um número único atribuído a cada caractere no padrão Unicode. Por exemplo, U+0041 é 'A', U+4F60 é '你'. Pontos de código variam de U+0000 a U+10FFFF.
▶Como UTF-8 difere de UTF-16?
UTF-8 usa 1-4 bytes por caractere e é compatível com ASCII. UTF-16 usa 2 ou 4 bytes por caractere. UTF-8 é a codificação mais comum para conteúdo web, enquanto UTF-16 é usado internamente por alguns sistemas como Windows e JavaScript.
▶Por que alguns caracteres aparecem como pontos de interrogação ou caixas?
Isso geralmente significa que a fonte não contém um glifo para aquele ponto de código Unicode. O caractere está corretamente codificado, mas não pode ser exibido pelas fontes disponíveis no seu sistema.