テキスト to ユニコード コンバーター
この無料オンラインツールを使って、テキストをUnicodeエスケープシーケンスに変換したり、Unicodeシーケンスをデコードして可読テキストに戻したりできます。国際化、文字エンコーディングの問題のデバッグ、またはコード内の特殊文字の処理を行う開発者に最適です。絵文字、記号、非ラテン文字を含むすべてのUnicode文字をサポートしています。
よくある質問
Unicodeは世界共通の文字エンコーディング標準であり、すべての文字体系、記号、絵文字にわたって、すべての文字に一意の番号(コードポイント)を割り当てます。
入力フィールドにテキストを入力または貼り付け、「変換」をクリックします。このツールは、各文字をUnicodeのエスケープシーケンス形式(BMP文字の場合は \uXXXX、その他の場合は \u{XXXXXX})に変換します。例えば、'Hello'は'˶u0048u0065˶u006C˶u006Cu006F'になります。このフォーマットは、JavaScript、JSON、および多くのプログラミング言語で一般的に使用されています。
はい!入力フィールドにUnicodeエスケープシーケンス(例: \u0048 や \u{1F600})を貼り付け、「変換」をクリックします。ツールは自動的にUnicodeシーケンスを検出し、可読文字に変換します。これは、コードをデバッグしたり、エンコードされたJSONデータを読んだり、国際化されたコンテンツを扱うときに便利です。
Unicodeは文字に数字(コードポイント)を割り当てる文字セットであり、UTF-8はそれらの数字がどのようにバイトとして格納されるかを決定するエンコーディングです。Unicodeのエスケープシーケンスはコードポイントを直接表しますが( \u0041 )、UTF-8のエンコーディングはその文字がメモリに格納される方法を表します。このツールは、Unicode コードポイントとそのエスケープシーケンス表現を扱います。
はい!このUnicodeコンバータは、絵文字、数学記号、通貨記号、非ラテン文字(中国語、アラビア語、キリル文字など)、特殊文字を含むすべてのUnicode文字をサポートしています。絵文字や、基本多言語面以外の文字は、ニヤニヤ顔の絵文字のような拡張エスケープシーケンスで表すことができます。
Unicodeエスケープシーケンスは、エディタで正しく表示されない可能性のある特殊文字をソースコードに含める必要がある場合、異なるシステム間での互換性を確保する場合、エスケープ文字が必要なJSONを扱う場合、またはキーボードにない文字を表現する必要がある場合に使用します。特に、国際化や異なる言語からのユーザー入力の処理に便利です。
(16進数4桁)は、基本多言語面(BMP)-コードポイントU+0000からU+FFFFをカバーする伝統的なJavaScript/JSONフォーマットです。u{XXXXXX}フォーマット(ES6+ JavaScript)は、中括弧と可変長の16進数を使って、絵文字や珍しい文字を含む、U+10FFFFまでのUnicodeコードポイントを表現します。U+FFFFを超える文字については、古いシステムではサロゲートペア(2つのªuXXXXシーケンス)を使用します。
Unicodeコードポイントとは、文字に割り当てられた抽象的な番号('A'を表すU+0041のようなもの)であり、UTF-8とは、その番号が保存用のバイトとしてエンコードされる方法です。ASCII文字(U+0000~U+007F)はUTF-8を1バイト、ヨーロッパ文字は2バイト、アジア文字は3バイト、絵文字は4バイト使用します。ユニコードのエスケープはコードポイントを直接示しますが、UTF-8はファイルやネットワークで使用される実際のバイト表現を示します。
複雑な絵文字では、ゼロ幅結合(ZWJ)シーケンスによって結合された複数のコードポイントを使用することがよくあります。たとえば、家族の絵文字は、人物+ZWJ+人物+ZWJ+子供の絵文字を組み合わせています。肌色の修飾子もコードポイントを追加します。さらに、BMP外の文字(U+10000~U+10FFFF)は、UTF-16サロゲートペアとして表現されることがあり、古いJSONやJavaScript環境では2つの㊙XXXXXシーケンスとして表示されます。
ほとんどの現代言語はUnicodeエスケープをサポートしています:JavaScript/JSON (㊟)、Python (㊟と㊟)、Java (㊟)、C/C++ (㊟と㊟)、C# (㊟)、Ruby (㊟)、PHP (㊟)。構文は言語によって若干異なり、拡張範囲に大文字の \U を使用するものもあれば、中括弧を使用するものもあります。正確なフォーマッ トについては、常に各言語のドキュメントを確認してください。
