《信息技术中文编码字符集》8月1日实施

从人名、地名到古籍用字,只要不是特别难写的字,理论上以后都能在电脑和手机里顺畅地输进去,以前被电脑给打不出来的麻烦事,这下算是解决了。根据工信部电子工业标准化研究院中文信息研究室的黄姗姗介绍,因为汉字是表意文字,所以每个字都得有个固定的形状和代码。为了能让这些生僻字出现在系统里,光是向ISO国际组织提交提案和在国家标准委那边审查同步更新,通常就会花上好几年的功夫。再加上不同的字形写法、大家对这些字的认可程度,还有它被使用的频率高低这些因素搅在一起,大量本来该有的汉字就被挡在了信息世界的门外。这次由国家标准委联合多部门制定的新版《信息技术中文编码字符集》要在8月1日正式实施,一次性把1.7万多个生僻字加进了编码表里,让收录的总汉字数量达到了88115个。这样一来,以后大家再去银行开卡、医院挂号或者进行实名认证时,碰到那些生僻字就不会像以前那样直接让系统死机了。像上海的蒋女士名字里就藏着三个生僻字,去办这些手续时系统常常直接宕机。她每次都得让工作人员人工核对身份信息,这排队的过程就跟闯关似的特别难办。 安阳师范学院的刘永革老师曾说过,保护生僻字其实就是保护那段已经不再发生的历史。把这些字搜集整理起来的工作已经做了好几十年了,这次新版标准其实只是个开头。后面会有更多经过专业审核的新增生僻字陆续进入国家的字库系统里去。各个操作系统和输入法的厂商也会按节奏更新他们的字库版本。甲骨文、金文等古文字的数字化工程也会同步推进下去。 这是怎么回事呢?中国社会科学院语言研究所的谭景春研究员用一句话概括了原因:五千年的文化长河不停地冲刷着过去的东西。有些字当年天天都在用,现在却没人用了,最后就变成了生僻字。从甲骨文演变到篆隶行草这些字形变化中可以看出,汉字的生与灭跟当时的时代背景联系得非常紧密。了解这些冷门的字形往往能让人看到一段被时间遗忘的社会风貌。比如甲骨文里的那个“冫口”字,就是商代的先民根据当地的地形和方位造出来的字。现在的日照栈子村人见到这个字时心里还是会觉得很亲切。 山东日照市东港区栈子村的情况也很典型。村里有座高5米的门楼上面还挂着“栈子”两个大字呢。可是到了电脑上却怎么都打不出那个“冫口”字来。村里为了方便办事只好把标识牌换成了“栈桥的栈”。老村名和新村牌就这么并行存在了很多年成了数字鸿沟一样的存在一直刻在老村民们的心里。 这个新版本的标准不仅把《通用规范汉字表》里的全部汉字都给收纳进去了,还把这些年大家经常吐槽的典型人名、地名生僻字全部请进了“大家庭”。覆盖范围之广真的是汉字数字化过程中难得的一次查漏补缺动作。 把这些名字和村庄相关的情况写出来之后你就会发现生僻字并不是一个抽象的概念而是无数普通人生活里的“拦路虎”。