Detetor de Codificação de Ficheiros
Gratuito online Detetor de Codificação de Ficheiros Ferramenta, sem necessidade de instalação
Sobre o detector de codificação de arquivo
Inspeciona o texto colado e relata a codificação de caracteres mais provável, juntamente com uma pontuação de confiança e qualquer Byte Order Mark (BOM) detectado. O detector codifica a entrada com TextEncoder, verifica assinaturas de BOM (UTF-8, UTF-16 LE, UTF-16 BE), valida sequências multibyte de UTF-8 e recorre a heurísticas para UTF-16 sem BOM, retornando um selo de codificação, uma confiança em porcentagem e uma nota de BOM opcional.
Como usar
1. Cole o texto que deseja inspecionar na área de texto de entrada. 2. Clique em Detect (desativado até que haja texto). 3. Leia o selo Detected Encoding, a porcentagem de Confidence e qualquer nota de BOM. 4. Clique em Copy para copiar um resumo de uma linha para a área de transferência.
Lógica de detecção e confiança
A detecção ocorre em estágios: uma sequência inicial de bytes EF BB BF retorna UTF-8 com uma nota de BOM com 100% de confiança; FF FE retorna UTF-16 LE com 100%; FE FF retorna UTF-16 BE com 100%. Se cada byte for ASCII (<= 0x7F), o resultado é ASCII com 100%. Caso contrário, os bytes são percorridos como sequências multibyte de UTF-8 (2 bytes C2-DF, 3 bytes E0-EF, 4 bytes F0-F4 com bytes de continuação 80-BF); se todos os bytes altos satisfizerem o padrão, UTF-8 é retornado com confiança entre 80 e 99 com base na proporção de bytes altos. Se UTF-8 falhar, uma heurística de padrão de bytes zero relata UTF-16 LE ou BE (sem BOM) com 75%, e o fallback final retorna UTF-8 (provável) com 60%.
▶Por que colar texto no detector não mostra a codificação original do arquivo?
▶O que significa a porcentagem de confiança?
▶Esta ferramenta pode detectar GBK, Shift-JIS ou Big5?
▶O que o botão Copy produz?
Se este ferramenta foi útil para você, pense em me dar um café.
Compre um café para mim.