UTF-8エンコーダー/デコーダー
無料オンライン UTF-8 エンコード・デコードツール、Unicode コードポイント相互変換
UTF-8エンコードとは
UTF-8は、Unicode標準のすべての文字を表現できる可変長文字エンコーディングです。各文字に1〜4バイトを使用し、Webの主流エンコーディングです。ASCII文字(0〜127)は1バイトで表現され、UTF-8はASCIIと後方互換性があります。
UTF-8エンコード/デコードツールの使い方
テキストを入力するとUnicodeコードポイント(U+XXXX形式)が表示されます。コードポイントを入力するとテキストにデコードされます。多言語コンテンツや特殊文字の文字エンコーディング問題の確認とデバッグに役立ちます。
▶Unicodeコードポイントとは?
コードポイントは、Unicode標準で各文字に割り当てられた一意の番号です。例:U+0041は'A'、U+4F60は'你'。範囲はU+0000からU+10FFFFです。
▶UTF-8とUTF-16の違いは?
UTF-8は各文字に1〜4バイトを使用し、ASCIIと互換性があります。UTF-16は各文字に2または4バイトを使用します。UTF-8はWebコンテンツで最も一般的で、UTF-16はWindowsやJavaScriptなどの内部表現で使用されます。
▶文字が?や□で表示されるのはなぜ?
フォントにそのUnicodeコードポイントのグリフが含まれていない場合に発生します。文字エンコーディングは正しくても、利用可能なフォントで表示できないことを意味します。