Detector di Codifica dei File
Gratuito online Detector di Codifica dei File Strumento, nessuna installazione richiesta
Informazioni sul rilevatore di codifica file
Analizza il testo incollato e segnala la codifica dei caratteri più probabile, insieme a un punteggio di confidenza e a un eventuale Byte Order Mark rilevato. Il rilevatore codifica l'input con TextEncoder, verifica le firme BOM (UTF-8, UTF-16 LE, UTF-16 BE), valida le sequenze multibyte UTF-8 e ricorre a euristiche per UTF-16 senza BOM, restituendo un badge per la codifica, una confidenza in percentuale e una nota BOM opzionale.
Come usarlo
1. Incolla il testo da analizzare nell'area di testo di input. 2. Fai clic su Detect (disabilitato finché non è presente testo). 3. Leggi il badge Detected Encoding, la percentuale di Confidence ed eventuali note BOM. 4. Fai clic su Copy per copiare un riepilogo a una riga negli appunti.
Logica di rilevamento e confidenza
Il rilevamento avviene per stadi: una sequenza iniziale di byte EF BB BF restituisce UTF-8 con una nota BOM al 100% di confidenza; FF FE restituisce UTF-16 LE al 100%; FE FF restituisce UTF-16 BE al 100%. Se ogni byte è ASCII (<= 0x7F), il risultato è ASCII al 100%. Altrimenti i byte vengono attraversati come sequenze multibyte UTF-8 (2 byte C2-DF, 3 byte E0-EF, 4 byte F0-F4 con byte di continuazione 80-BF); se tutti i byte alti soddisfano il pattern, viene restituito UTF-8 con una confidenza tra 80 e 99 in base alla proporzione di byte alti. Se UTF-8 fallisce, un'euristica sul pattern dei byte zero segnala UTF-16 LE o BE (senza BOM) al 75%, e il fallback finale restituisce UTF-8 (probabile) al 60%.
▶Perché incollare testo nel rilevatore non mostra la codifica originale del file?
▶Cosa significa la percentuale di confidenza?
▶Questo strumento può rilevare GBK, Shift-JIS o Big5?
▶Cosa produce il pulsante Copy?
Se questo strumento è stato di aiuto per te, considera l’idea di regalarmi un caffè.
Comprami un caffè.