Unicode コンバーター
無料オンライン Unicode 変換ツール、エスケープシーケンスとテキストの相互変換
Unicodeエスケープ表記とは
Unicodeエスケープシーケンスは、\u接頭辞に続く4桁の16進数で文字を表します。例えば'A'は\u0041、'你'は\u4F60です。この表記はJavaScript、Java、Python、JSONのソースコードで、入力が難しい文字やエンコード問題を引き起こす可能性のある文字を埋め込むために一般的に使用されます。
テキストとUnicodeエスケープの変換方法
「テキスト→Unicode」モードに切り替えてテキストを入力すると、各文字が\uXXXX表現に変換されます。「Unicode→テキスト」モードで逆の処理を行います。CJK文字、絵文字、希少なスクリプトを含むすべてのUnicode文字に対応しています。
Unicodeエスケープを使用する場面
JSONやJavaScriptファイルの文字エンコーディング問題のデバッグ。ゼロ幅スペースなどの不可視文字の検査。ソースコード用の国際化文字列の準備。正しいUnicodeコードポイントが使用されていることの確認。
▶\uXXXXとU+XXXXの違いは何ですか?
\uXXXXはJavaScriptやJSONなどのプログラミング言語で使用されるエスケープ構文です。U+XXXXはドキュメントで使用されるUnicodeコードポイント表記です。同じ文字を指しますが、使用される文脈が異なります。
▶Unicodeエスケープで絵文字を表現できますか?
はい、基本多言語面(BMP)を超える絵文字は\u表記でサロゲートペアが必要です。例えば😀は\uD83D\uDE00です。現代のJavaScriptでは\u{1F600}も使用できます。
▶JSONで中国語文字が\uXXXXとして表示されるのはなぜですか?
一部のJSONシリアライザは、デフォルトで非ASCII文字をUnicodeエスケープとしてエンコードします。これは有効なJSONであり正しくデコードされますが、可読性が低下します。多くのシリアライザには生のUnicode文字を出力するオプションがあります。