Detector de Codificación de Archivos
Gratuito en línea Detector de Codificación de Archivos Herramienta, no se requiere instalación
Acerca del detector de codificación de archivos
Inspecciona el texto pegado e informa la codificación de caracteres más probable junto con una puntuación de confianza y cualquier marca de orden de bytes (BOM) detectada. El detector codifica la entrada con TextEncoder, comprueba las firmas BOM (UTF-8, UTF-16 LE, UTF-16 BE), valida las secuencias multibyte UTF-8 y recurre a heurísticas para UTF-16 sin BOM, devolviendo una insignia de codificación, un porcentaje de confianza y una nota BOM opcional.
Cómo usarlo
1. Pega el texto que deseas inspeccionar en el área de texto de entrada. 2. Haz clic en Detect (deshabilitado hasta que haya texto). 3. Lee la insignia Detected Encoding, el porcentaje de Confidence y cualquier nota BOM. 4. Haz clic en Copy para copiar un resumen de una línea al portapapeles.
Lógica de detección y confianza
La detección se ejecuta por etapas: una secuencia inicial de bytes EF BB BF devuelve UTF-8 con una nota BOM con un 100% de confianza; FF FE devuelve UTF-16 LE al 100%; FE FF devuelve UTF-16 BE al 100%. Si cada byte es ASCII (<= 0x7F), el resultado es ASCII al 100%. De lo contrario, los bytes se recorren como secuencias multibyte UTF-8 (2 bytes C2-DF, 3 bytes E0-EF, 4 bytes F0-F4 con bytes de continuación 80-BF); si todos los bytes altos cumplen el patrón, se devuelve UTF-8 con una confianza entre 80 y 99 basada en la proporción de bytes altos. Si UTF-8 falla, una heurística del patrón de bytes cero informa UTF-16 LE o BE (sin BOM) al 75%, y el fallback final devuelve UTF-8 (probable) al 60%.
▶¿Por qué pegar texto en el detector no muestra la codificación original del archivo?
▶¿Qué significa el porcentaje de confianza?
▶¿Puede esta herramienta detectar GBK, Shift-JIS o Big5?
▶¿Qué produce el botón Copy?
Si este herramienta le ha sido útil, considere comprarme un café.
Compra un café para mí.