ファイルエンコーディング 検出器
無料でオンラインで利用可能 ファイルエンコーディング 検出器 インストール不要のツール
ファイルエンコーディング検出器について
貼り付けたテキストを調査し、最も可能性の高い文字エンコーディングを信頼度スコアおよび検出されたバイト順マーク(BOM)と共に報告します。検出器は TextEncoder で入力をエンコードし、BOM シグネチャ(UTF-8、UTF-16 LE、UTF-16 BE)を確認し、UTF-8 のマルチバイトシーケンスを検証した上で、BOM のない UTF-16 にはヒューリスティックで対応し、エンコーディングのバッジ、パーセンテージの信頼度、および任意の BOM 備考を返します。
使い方
1. 調べたいテキストを入力テキストエリアに貼り付けます。 2. Detect をクリックします(テキストが入力されるまで無効です)。 3. Detected Encoding バッジ、Confidence のパーセンテージ、および BOM 備考を確認します。 4. Copy をクリックして、1 行のサマリーをクリップボードにコピーします。
検出ロジックと信頼度
検出は段階的に実行されます。先頭の EF BB BF バイトシーケンスは 100% 信頼度で UTF-8 を返し BOM 備考を付けます。FF FE は 100% で UTF-16 LE、FE FF は 100% で UTF-16 BE を返します。すべてのバイトが ASCII(<= 0x7F)であれば、100% で ASCII を返します。それ以外の場合は、バイトを UTF-8 マルチバイトシーケンス(2 バイトの C2-DF、3 バイトの E0-EF、4 バイトの F0-F4、後続に 80-BF の継続バイト)として順に走査します。高位バイトがすべてこのパターンを満たせば UTF-8 を返し、信頼度は高位バイトの比率に基づき 80 から 99 となります。UTF-8 の検証に失敗した場合は、ゼロバイトパターンのヒューリスティックで UTF-16 LE または BE(BOM なし)を 75% で報告し、最終的なフォールバックは UTF-8(可能性あり)を 60% で返します。
▶テキストを検出器に貼り付けても、元のファイルのエンコーディングが表示されないのはなぜですか?
▶信頼度のパーセンテージは何を意味しますか?
▶このツールは GBK、Shift-JIS、Big5 を検出できますか?
▶Copy ボタンは何を出力しますか?
このツールがあなたに役立ったなら、私にコーヒーをご馳走することをお勧めします。
私にコーヒーを買ってください。