Детектор кодирования файлов
Бесплатно онлайн Детектор кодирования файлов Инструмент; не требуется установка
О детекторе кодировки файлов
Анализирует вставленный текст и сообщает наиболее вероятную кодировку символов, а также оценку уверенности и обнаруженную метку порядка байтов (BOM). Детектор кодирует входные данные с помощью TextEncoder, проверяет сигнатуры BOM (UTF-8, UTF-16 LE, UTF-16 BE), валидирует многобайтовые последовательности UTF-8, а для UTF-16 без BOM применяет эвристику, возвращая бейдж кодировки, уверенность в процентах и необязательное примечание о BOM.
Как использовать
1. Вставьте текст, который нужно проверить, в текстовое поле ввода. 2. Нажмите Detect (недоступно, пока нет текста). 3. Прочитайте бейдж Detected Encoding, процент Confidence и любые примечания о BOM. 4. Нажмите Copy, чтобы скопировать однострочную сводку в буфер обмена.
Логика обнаружения и уверенность
Обнаружение выполняется поэтапно: ведущая последовательность байтов EF BB BF возвращает UTF-8 с примечанием о BOM при уверенности 100%; FF FE возвращает UTF-16 LE при 100%; FE FF возвращает UTF-16 BE при 100%. Если каждый байт — ASCII (<= 0x7F), результат — ASCII при 100%. В противном случае байты обходятся как многобайтовые последовательности UTF-8 (2-байтовые C2-DF, 3-байтовые E0-EF, 4-байтовые F0-F4 с байтами продолжения 80-BF); если все старшие байты удовлетворяют шаблону, возвращается UTF-8 с уверенностью от 80 до 99 в зависимости от доли старших байтов. Если UTF-8 не проходит проверку, эвристика шаблона нулевых байтов сообщает UTF-16 LE или BE (без BOM) при 75%, а последний резервный вариант возвращает UTF-8 (вероятно) при 60%.
▶Почему вставка текста в детектор не показывает исходную кодировку файла?
▶Что означает процент уверенности?
▶Может ли этот инструмент определять GBK, Shift-JIS или Big5?
▶Что создаёт кнопка Copy?
Если этот инструмент оказался полезным для вас, подумайте о том, чтобы подарить мне кофе.
Купите мне кофе.