Bestandencoderingdetector
Gratis online Bestandencoderingdetector geen installatie nodig
Over de bestandscoderingsdetector
Inspecteert geplakte tekst en meldt de meest waarschijnlijke tekensetcodering, samen met een betrouwbaarheidsscore en een eventueel gedetecteerde Byte Order Mark (BOM). De detector codeert de invoer met TextEncoder, controleert op BOM-handtekeningen (UTF-8, UTF-16 LE, UTF-16 BE), valideert UTF-8-multibytereeksen en valt terug op heuristieken voor UTF-16 zonder BOM. Hij retourneert een badge voor de codering, een betrouwbaarheid in procenten en een optionele BOM-opmerking.
Gebruik
1. Plak de tekst die je wilt onderzoeken in het invoertextarea. 2. Klik op Detect (uitgeschakeld totdat er tekst is). 3. Lees de badge Detected Encoding, het percentage bij Confidence en eventuele BOM-opmerkingen. 4. Klik op Copy om een éénregelige samenvatting naar het klembord te kopiëren.
Detectielogica en betrouwbaarheid
De detectie verloopt in fasen: een leidende bytereeks EF BB BF retourneert UTF-8 met een BOM-opmerking met 100% betrouwbaarheid; FF FE retourneert UTF-16 LE met 100%; FE FF retourneert UTF-16 BE met 100%. Is elke byte ASCII (<= 0x7F), dan is het resultaat ASCII met 100%. Anders worden de bytes als UTF-8-multibytereeksen doorlopen (2-byte C2-DF, 3-byte E0-EF, 4-byte F0-F4 met 80-BF-vervolgbytes); voldoen alle hoge bytes aan het patroon, dan wordt UTF-8 geretourneerd met een betrouwbaarheid tussen 80 en 99 op basis van de verhouding van hoge bytes. Faalt UTF-8, dan meldt een nul-byte-patroonheuristiek UTF-16 LE of BE (zonder BOM) met 75%, en de uiteindelijke fallback retourneert UTF-8 (waarschijnlijk) met 60%.
▶Waarom toont het plakken van tekst in de detector niet de oorspronkelijke bestandscodering?
▶Wat betekent het betrouwbaarheidspercentage?
▶Kan deze tool GBK, Shift-JIS of Big5 detecteren?
▶Wat produceert de knop Copy?
Als deze tool je heeft geholpen, denk dan eens aan het geven van een kop koffie aan mij.
Koop me een kop koffie.