Datei-Encoding-Detektor
Kostenlos online verfügbar Datei-Encoding-Detektor Tool – keine Installation erforderlich
Über den Datei-Codierungsdetektor
Untersucht eingefügten Text und meldet die wahrscheinlichste Zeichencodierung zusammen mit einem Konfidenzwert und einem eventuell erkannten Byte-Order-Mark (BOM). Der Detektor codiert die Eingabe mit TextEncoder, prüft auf BOM-Signaturen (UTF-8, UTF-16 LE, UTF-16 BE), validiert die UTF-8-Multibyte-Sequenzen und greift bei UTF-16 ohne BOM auf Heuristiken zurück. Er liefert ein Badge für die Codierung, eine prozentuale Konfidenz und einen optionalen BOM-Hinweis.
Verwendung
1. Fügen Sie den zu untersuchenden Text in das Eingabefeld ein. 2. Klicken Sie auf Detect (deaktiviert, bis Text vorhanden ist). 3. Lesen Sie das Detected-EnCoding-Badge, den Prozentwert bei Confidence und eventuelle BOM-Hinweise. 4. Klicken Sie auf Copy, um eine einzeilige Zusammenfassung in die Zwischenablage zu kopieren.
Erkennungslogik und Konfidenz
Die Erkennung erfolgt in Stufen: Eine führende Bytefolge EF BB BF liefert UTF-8 mit BOM-Hinweis bei 100% Konfidenz; FF FE liefert UTF-16 LE bei 100%; FE FF liefert UTF-16 BE bei 100%. Ist jedes Byte ASCII (<= 0x7F), lautet das Ergebnis ASCII bei 100%. Andernfalls werden die Bytes als UTF-8-Multibyte-Sequenzen durchlaufen (2-Byte C2-DF, 3-Byte E0-EF, 4-Byte F0-F4 mit 80-BF-Fortsetzungsbytes); erfüllen alle hohen Bytes dieses Muster, wird UTF-8 zurückgegeben, mit einer Konfidenz zwischen 80 und 99 basierend auf dem Anteil hoher Bytes. Schlägt UTF-8 fehl, meldet eine Null-Byte-Muster-Heuristik UTF-16 LE oder BE (ohne BOM) bei 75%, und der abschließende Fallback liefert UTF-8 (wahrscheinlich) bei 60%.
▶Warum zeigt das Einfügen von Text in den Detektor nicht die ursprüngliche Dateicodierung an?
▶Was bedeutet der Prozentwert der Konfidenz?
▶Kann dieses Tool GBK, Shift-JIS oder Big5 erkennen?
▶Was erzeugt die Schaltfläche Copy?
Wenn dieses Tool Ihnen geholfen hat, zögern Sie nicht, mir einen Kaffee zu kaufen.
Kaufe mir einen Kaffee.