Détecteur d’encodage de fichiers
Gratuit en ligne Détecteur d’encodage de fichiers Outil, pas de nécessité d’installation
À propos du détecteur d'encodage de fichier
Inspecte le texte collé et signale l'encodage de caractères le plus probable, accompagné d'un score de confiance et d'un éventuel Byte Order Mark (BOM) détecté. Le détecteur encode l'entrée avec TextEncoder, recherche les signatures BOM (UTF-8, UTF-16 LE, UTF-16 BE), valide les séquences multioctets UTF-8 et recourt à des heuristiques pour l'UTF-16 sans BOM. Il renvoie un badge d'encodage, un pourcentage de confiance et une note BOM facultative.
Mode d'emploi
1. Collez le texte à inspecter dans la zone de saisie. 2. Cliquez sur Detect (désactivé tant qu'aucun texte n'est présent). 3. Lisez le badge Detected Encoding, le pourcentage de Confidence et toute note BOM. 4. Cliquez sur Copy pour copier un résumé d'une ligne dans le presse-papiers.
Logique de détection et confiance
La détection s'exécute par étapes : une séquence d'octets EF BB BF en tête renvoie UTF-8 avec une note BOM à 100 % de confiance ; FF FE renvoie UTF-16 LE à 100 % ; FE FF renvoie UTF-16 BE à 100 %. Si chaque octet est ASCII (<= 0x7F), le résultat est ASCII à 100 %. Sinon, les octets sont parcourus comme des séquences multioctets UTF-8 (2 octets C2-DF, 3 octets E0-EF, 4 octets F0-F4 avec octets de continuation 80-BF) ; si tous les octets élevés satisfont le motif, UTF-8 est renvoyé avec une confiance comprise entre 80 et 99 selon la proportion d'octets élevés. Si UTF-8 échoue, une heuristique de motif d'octets nuls signale UTF-16 LE ou BE (sans BOM) à 75 %, et l'ultime repli renvoie UTF-8 (probable) à 60 %.
▶Pourquoi coller du texte dans le détecteur n'affiche-t-il pas l'encodage original du fichier ?
▶Que signifie le pourcentage de confiance ?
▶Cet outil peut-il détecter GBK, Shift-JIS ou Big5 ?
▶Que produit le bouton Copy ?
Si cet outil vous a été utile, pensez à m’offrir un café.
Achetez-moi un café.