文本 至 统一码 转换器

使用这款免费在线工具,将文本转换为 Unicode 转义序列,或将 Unicode 序列解码为可读文本。它是开发人员处理国际化问题、调试字符编码问题或处理代码中特殊字符的完美工具。支持所有 Unicode 字符,包括表情符号、符号和非拉丁脚本。

常见问题

Unicode 是一种通用字符编码标准,它为所有书写系统、符号和表情符号中的每个字符分配一个唯一的数字(码位)。当你需要在代码、JSON、URL 中表示特殊字符,或调试国际应用程序中的编码问题时,转换为 Unicode 转义序列(如 \u0041 表示 "A")非常有用。

在输入框中键入或粘贴文本,然后点击 "转换"。该工具会将每个字符转换为 Unicode 转义序列格式(BMP 字符为 \uXXXX,其他字符为 \u{XXXXXX})。例如,"Hello "会变成"\u0048\u0065\u006C\u006C\u006F "。这种格式常用于 JavaScript、JSON 和许多编程语言。

可以!将 Unicode 转义序列(如 \u0048 或 \u{1F600})粘贴到输入栏,然后点击 "转换"。该工具会自动检测 Unicode 序列,并将其转换为可读字符。这在调试代码、读取编码 JSON 数据或处理国际化内容时非常有用。

Unicode 是将数字(码位)分配给字符的字符集,而 UTF-8 是决定如何将这些数字存储为字节的编码。Unicode 转义序列直接表示码位 (\u0041),而 UTF-8 编码则表示该字符在内存中的存储方式。该工具可处理 Unicode 代码点及其转义序列表示。

是的!此 Unicode 转换器支持所有 Unicode 字符,包括表情符号、数学符号、货币符号、非拉丁字母(中文、阿拉伯文、西里尔文等)和特殊字符。表情符号和基本多语言平面外的字符可以使用扩展转义序列来表示,如 \u{1F600} 表示咧嘴笑的表情符号。

当您需要在源代码中包含可能无法在编辑器中正确显示的特殊字符时,当您需要确保不同系统间的兼容性时,当您处理需要转义字符的 JSON 时,或者当您需要表示键盘上没有的字符时,请使用 Unicode 转义序列。它们对于国际化和处理不同语言的用户输入尤其有用。

\uXXXX 格式(4 个十六进制数字)是传统的 JavaScript/JSON 格式,涵盖基本多语言平面(BMP)--码位 U+0000 至 U+FFFF,其中包括大多数常见字符。\u{XXXXXX} 格式(ES6+ JavaScript)使用大括号和长度可变的十六进制来表示 U+10FFFF 以下的任何 Unicode 代码点,包括表情符号和稀有字符。对于 U+FFFF 以上的字符,旧系统使用代用对(两个 \uXXXX 序列)。

Unicode 代码点是分配给字符的抽象数字(如 U+0041 表示 "A"),而 UTF-8 则是将该数字编码为字节进行存储的方式。ASCII 字符(U+0000 至 U+007F)使用 1 个 UTF-8 字节,欧洲字符需要 2 个字节,亚洲字符需要 3 个字节,表情符号需要 4 个字节。Unicode 转义字符直接显示代码点,而 UTF-8 则显示文件和网络中使用的实际字节表示法。

复杂的表情符号通常使用多个通过零宽度连接(ZWJ)序列组合的代码点。例如,家庭表情符号结合了人物 + ZWJ + 人物 + ZWJ + 儿童表情符号。肤色修饰符也会增加额外的代码点。此外,BMP(U+10000 至 U+10FFFF)以外的字符可以用 UTF-16 代理对表示,在旧版 JSON 或 JavaScript 环境中显示为两个 \uXXXX 序列。

大多数现代语言都支持 Unicode 转义:JavaScript/JSON(\uXXXX)、Python(\uXXXX 和 \UXXXXXX)、Java(\uXXXX)、C/C++(\uXXXX 和 \UXXXXXX)、C#(\uXXXX)、Ruby(\uXXXX)和 PHP(\u{XXXXXX})。不同语言的语法略有不同--有些语言使用大写 \U 来表示扩展范围,有些语言则使用大括号。有关确切格式,请务必查看您的语言文档,但底层的 Unicode 代码点在所有平台上都是相同的。