在线提供UTF-8编码与文本字符串的相互转换,支持文本字符串转换为UTF-8编码,UTF-8编码转换为文本字符串。
1、汉字转UTF-8:支持简体中文、繁体中文、生僻字、标点符号和全角字符的转换。
2、UTF-8转汉字:将UTF-8编码序列还原为可读的中文文本。
3、工具更新时间:2025-12-25 10:00:00。
UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。它可以用来表示Unicode标准中的任何字符,而且其编码中的第一个字节仍与ASCII相容,使得原来处理ASCII字符的软件无须或只进行少部份修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。
| 中文名 | UTF-8 | 作 者 | Ken Thompson |
| 外文名 | 8-bit Unicode Transformation Format | 创建时间 | 1992年 |
| 别 称 | 万国码 | 针 对 | Unicode |
UTF-8编码可以通过屏蔽位和移位操作快速读写。字符串比较时strcmp()和wcscmp()的返回结果相同,因此使排序变得更加容易。字节FF和FE在UTF-8编码中永远不会出现,因此他们可以用来表明UTF-16或UTF-32文本(见BOM) UTF-8 是字节顺序无关的。它的字节顺序在所有系统中都是一样的,因此它实际上并不需要BOM。
你无法从UNICODE字符数判断出UTF-8文本的字节数,因为UTF-8是一种变长编码它需要用2个字节编码那些用扩展ASCII字符集只需1个字节的字符 ISO Latin-1 是UNICODE的子集,但不是UTF-8的子集 8位字符的UTF-8编码会被email网关过滤,因为internet信息最初设计为7位ASCII码。因此产生了UTF-7编码。 UTF-8 在它的表示中使用值100xxxxx的几率超过50%, 而现存的实现如ISO 2022, 4873, 6429, 和8859系统,会把它错认为是C1 控制码。因此产生了UTF-7.5编码。
正在加载... ...