Unicode标准12.0版发布,字符总数达137929个

最后编辑于 2019年03月06日 开发

Unicode是一个编码标准或一个字符集,它为每个字符提供了唯一的二进制代码,即唯一的数字号码。采用该标准,任何平台、程序、语言,都可以传输和显示同样的字符。

互联网上用的最多的UTF-8,就是一种实现了Unicode标准的编码格式,使用1到4个字节编码了Unicode字符。UTF-8的全称是,Unicode Transformation Format – 8-bit。

UTF-8

3月5日,Unicode编码联盟(The Unicode Consortium)宣布,Unicode标准12.0版本可以使用了。该标准包括核心规范、附录和数据文件。

Unicode标准12.0版的字符总数达到了137929个。其中新增字符554个,包括61个emoji字符和4个脚本(script),脚本总数也达到了150个。

新增加脚本和字符,是为了支持那些使用较少的和书写独特的语言,这些语言包括:伊朗西南部的Elymaic语、印度南部的Nandinagari语、老挝/泰国/越南等国的Nyiakeng Puachue Hmong语、印度/缅甸/不丹的Wancho语。

其它增加的支持还包括:中国苗族和彝族的方言脚本、用于古代日语的平假名(Hiragana)和片假名(Katakana)小写字母、南印度泰米尔(Tamil)的历史碎片文字和符号、老挝的巴利语(Pali)字母、埃及语和乌嘎利特语中使用的拉丁字母、埃及象形文字的格式控制。

下图是埃及哈布(Medinet Habu)的神庙天花板图案,图中的下部就是用Unicode纯文本写的象形文字。


Image From:unicode.org

unicode.org的文章:
Announcing The Unicode® Standard, Version 12.0

Unicode编码联盟:
http://www.unicode.org/

登录注册后才能评论。