Phân tích mã hóa tệp
Miễn phí trực tuyến Phân tích mã hóa tệp Công cụ, không cần cài đặt
Giới thiệu về bộ dò tìm mã hóa tệp
Kiểm tra văn bản được dán và báo cáo mã hóa ký tự có khả năng cao nhất, kèm theo điểm tin cậy và Byte Order Mark (BOM) nếu được phát hiện. Bộ dò tìm mã hóa đầu vào bằng TextEncoder, kiểm tra các chữ ký BOM (UTF-8, UTF-16 LE, UTF-16 BE), xác thực các chuỗi đa byte UTF-8 và áp dụng phương pháp heuristic cho UTF-16 không có BOM, trả về huy hiệu mã hóa, phần trăm tin cậy và một ghi chú BOM tùy chọn.
Cách sử dụng
1. Dán văn bản bạn muốn kiểm tra vào ô nhập văn bản. 2. Bấm Detect (bị vô hiệu hóa cho đến khi có văn bản). 3. Đọc huy hiệu Detected Encoding, phần trăm Confidence và mọi ghi chú BOM. 4. Bấm Copy để sao chép tóm tắt một dòng vào bảng tạm.
Logic dò tìm và độ tin cậy
Việc dò tìm chạy theo từng giai đoạn: một chuỗi byte dẫn đầu EF BB BF trả về UTF-8 kèm ghi chú BOM với độ tin cậy 100%; FF FE trả về UTF-16 LE ở 100%; FE FF trả về UTF-16 BE ở 100%. Nếu mọi byte đều là ASCII (<= 0x7F), kết quả là ASCII ở 100%. Nếu không, các byte được duyệt dưới dạng chuỗi đa byte UTF-8 (2 byte C2-DF, 3 byte E0-EF, 4 byte F0-F4 với byte tiếp nối 80-BF); nếu tất cả byte cao đều thỏa mãn mẫu, UTF-8 được trả về với độ tin cậy nằm trong khoảng 80 đến 99 dựa trên tỷ lệ byte cao. Nếu UTF-8 thất bại, phương pháp heuristic dựa trên mẫu byte không sẽ báo cáo UTF-16 LE hoặc BE (không có BOM) ở 75%, và phương án dự phòng cuối cùng trả về UTF-8 (khả năng cao) ở 60%.
▶Tại sao dán văn bản vào bộ dò tìm lại không hiển thị mã hóa tệp gốc?
▶Phần trăm tin cậy có ý nghĩa gì?
▶Công cụ này có thể dò tìm GBK, Shift-JIS hoặc Big5 không?
▶Nút Copy tạo ra kết quả gì?
Nếu công cụ này đã giúp ích cho bạn, hãy nghĩ đến việc mua một cốc cà phê cho tôi.
Hãy mua cho tôi một cốc cà phê nhé.