Detektor Kodowania Pliku
Bezpłatnie online Detektor Kodowania Pliku narzędzie, nie wymaga instalacji
O wykrywaniu kodowania pliku
Bada wklejony tekst i zgłasza najbardziej prawdopodobne kodowanie znaków wraz z wynikiem pewności i ewentualnym wykrytym znacznikiem kolejności bajtów (BOM). Detektor koduje dane wejściowe za pomocą TextEncoder, sprawdza sygnatury BOM (UTF-8, UTF-16 LE, UTF-16 BE), waliduje wielobajtowe sekwencje UTF-8 i w przypadku UTF-16 bez BOM stosuje heurystyki, zwracając plakietkę kodowania, pewność w procentach oraz opcjonalną notatkę o BOM.
Jak używać
1. Wklej tekst, który chcesz zbadać, do obszaru tekstowego wejścia. 2. Kliknij Detect (wyłączone, dopóki nie pojawi się tekst). 3. Odczytaj plakietkę Detected Encoding, wartość procentową Confidence oraz ewentualne notatki BOM. 4. Kliknij Copy, aby skopiować jednowierszowe podsumowanie do schowka.
Logika wykrywania i pewność
Wykrywanie przebiega etapami: wiodąca sekwencja bajtów EF BB BF zwraca UTF-8 z notatką BOM przy pewności 100%; FF FE zwraca UTF-16 LE przy 100%; FE FF zwraca UTF-16 BE przy 100%. Jeśli każdy bajt to ASCII (<= 0x7F), wynikiem jest ASCII przy 100%. W przeciwnym razie bajty są przemierzane jako wielobajtowe sekwencje UTF-8 (2-bajtowe C2-DF, 3-bajtowe E0-EF, 4-bajtowe F0-F4 z bajtami kontynuacji 80-BF); jeśli wszystkie bajty wysokie spełniają wzorzec, zwracane jest UTF-8 z pewnością od 80 do 99 w oparciu o udział bajtów wysokich. Jeśli UTF-8 się nie powiedzie, heurystyka wzorca bajtów zerowych zgłasza UTF-16 LE lub BE (bez BOM) przy 75%, a końcowe rozwiązanie awaryjne zwraca UTF-8 (prawdopodobnie) przy 60%.
▶Dlaczego wklejenie tekstu do detektora nie pokazuje oryginalnego kodowania pliku?
▶Co oznacza procent pewności?
▶Czy to narzędzie wykrywa GBK, Shift-JIS lub Big5?
▶Co generuje przycisk Copy?
Jeśli ten tool był dla ciebie przydatny, pomyśl o tym, aby kupić mi kawę.
Kup mi kawę.