파일 인코딩 감지기
무료 온라인 서비스 파일 인코딩 감지기 설치가 필요 없는 도구
파일 인코딩 감지기 소개
붙여넣은 텍스트를 검사하여 가장 가능성이 높은 문자 인코딩과 신뢰도 점수, 그리고 감지된 바이트 순서 표시(BOM)를 보고합니다. 감지기는 TextEncoder로 입력을 인코딩하고, BOM 시그니처(UTF-8, UTF-16 LE, UTF-16 BE)를 확인하며, UTF-8 멀티바이트 시퀀스를 검증한 뒤 BOM이 없는 UTF-16에는 휴리스틱을 적용하여 인코딩 배지, 백분율 신뢰도, 선택적 BOM 메모를 반환합니다.
사용 방법
1. 검사할 텍스트를 입력 텍스트 영역에 붙여넣습니다. 2. Detect를 클릭합니다(텍스트가 없으면 비활성화됨). 3. Detected Encoding 배지, Confidence 백분율, 그리고 BOM 메모를 확인합니다. 4. Copy를 클릭하여 한 줄 요약을 클립보드에 복사합니다.
감지 로직과 신뢰도
감지는 단계별로 실행됩니다. 선행하는 EF BB BF 바이트 시퀀스는 100% 신뢰도로 UTF-8을 반환하며 BOM 메모를 추가합니다. FF FE는 100%로 UTF-16 LE, FE FF는 100%로 UTF-16 BE를 반환합니다. 모든 바이트가 ASCII(<= 0x7F)이면 100%로 ASCII를 반환합니다. 그렇지 않으면 바이트를 UTF-8 멀티바이트 시퀀스(2바이트 C2-DF, 3바이트 E0-EF, 4바이트 F0-F4, 뒤에 80-BF 연속 바이트)로 순회하며, 모든 상위 바이트가 이 패턴을 만족하면 UTF-8을 반환하고 신뢰도는 상위 바이트 비율에 따라 80~99 사이가 됩니다. UTF-8 검증이 실패하면 제로 바이트 패턴 휴리스틱으로 UTF-16 LE 또는 BE(BOM 없음)를 75%로 보고하며, 최종 폴백은 UTF-8(추정)을 60%로 반환합니다.
▶텍스트를 감지기에 붙여넣었을 때 원본 파일의 인코딩이 표시되지 않는 이유는 무엇인가요?
▶신뢰도 백분율은 무엇을 의미하나요?
▶이 도구는 GBK, Shift-JIS, Big5를 감지할 수 있나요?
▶Copy 버튼은 무엇을 생성하나요?
이 도구가 당신에게 도움이 되었다면, 저에게 커피 한 잔 사주세요.
제게 커피 한 잔 사주세요.