山东省泰安市岱岳区石蜡社区的困扰
石蜡社区的“蜡”字本应为上分下石(⿱分石)。石蜡社区位于泰山脚下,是泰山玉的产地。泰山脚下,当然最不缺的就是石头,传说古时候当地人把大石头分成了小石头,小石头又分成了更小的石头,从而有了“⿱分石”这个字。但这个字一般计算机显示不了,故日常大部分场合只能用“蜡”或“腊”代替。正如石蜡社区李家庚书记所说,老祖宗留下来的东西,我们不能把它弄丢了。同“⿱分石”类似,每一个生僻字的背后都有一个美丽的传说。
2022年9月,中国科学院软件研究所时空数据管理与数据科学研究中心刘汇丹博士听说了山东省泰安市岱岳区粥店街道石蜡社区因地名生僻字而导致日常办事诸多不便,便联系到石蜡社区的李家庚书记,向其赠送了与北京卓玛之裕科技有限公司一起研发的卓码输入法和知春宋体字库,解决了社区日常办公中需要使用“⿱分石”字的问题。
2023年3月17日,应泰安市石蜡社区李家庚书记邀请,刘汇丹博士前往协助解决地名生僻字办理房产证的问题。石蜡社区属棚户区改造回迁社区,2020年底迁入新社区,但因为疫情影响,社区楼栋在测绘信息登记等方面的基础工作还未完成,办理房产证首先得先做一系列的前置工作。
在安装卓码生僻字显形工具和卓码输入法软件之后,在测绘系统能够正确的显示和打印社区地址。但同样方法在不动产登记系统中仍然无法显示。由于涉及到省市多级审批、多个部门,在无法显示的情况下让人相信那里是那个字,实在强人所难。由此可知解决生僻字问题困难重重,除了输入法和字库,还需要业务系统配合升级改造。
(⿱分石)在户籍管理系统中,曾以PUA U+E5F5编码,但在通用系统无法显示和正常处理。
(⿱分石)Unicode 10.0 2017年正式收录,编码为U+2E00E,是强制性国家标准GB18030-2022《信息技术中文编码字符集》中正式收录的汉字,但目前通用系统多数无法显示和输入。
卓码人的努力
2020年底卓码生僻字显形工具和卓码输入法软件在招商银行成功上线,为招商银行打开了生僻字无障碍服务的大门;随后经过多轮优化和升级,目前已对齐Unicode最新标准扩展H,收字近10万字(含PUA)。
2020-2022年疫情期间,以“姓名生僻字处理平台”网站和“姓名生僻字交流”微信群为平台,我们帮助无数姓名中有生僻字的朋友解决了获取健康码、微信实名绑卡、支付宝实名绑卡、银行卡开户等等涉及生僻字当事人日常生活工作各种事项的难题,但仍需更进一步努力。
汉字强国计划
汉字是中华文化传承的载体,人名地名生僻字问题关乎国计民生,是数字中国建设中绕不开的问题。为了推动在全国全社会顺畅使用包括生僻字在内的全部汉字,解决人名地名生僻字民生难题,依托中国科学院软件研究所和北京卓玛之裕科技有限公司,刘汇丹博士有意以众筹的方式开展一系列活动,称之为“汉字强国计划”。
“汉字强国计划”的最终目标在全国全社会彻底解决汉字用字问题,解决因生僻字而办不成事儿的问题,实现目标的方法是让全国每一台信息处理设备都具备处理全部汉字的能力。
“汉字强国计划”主要内容包括生僻字软件产品的研发与完善、生僻字软件产品的推广应用、公共服务系统生僻字处理改造技术支持、中文信息处理公开课等四个方面的内容。
1、生僻字软件产品的研发与完善
(1)以Windows版卓码输入法、卓码查字为基础提供面向Windows平台的生僻字的输入能力,已完成,只需少量优化维护。
(2)以Linux版卓码输入法为基础提供面向国产信创操作系统平台的生僻字的输入能力,已完成,只需少量优化维护。
(3)以知春宋体为基础,提供面向Windows/国产信创操作系统平台的生僻字宋体显示能力,已完成,只需少量优化维护。
(4)以Windows版卓码生僻字显形工具软件为基础,在操作系统层面提供生僻字显示增强能力,可使大量业务系统使用缺省的“宋体”即可显示生僻字,大幅度减少业务系统升级改造工作量,已完成,只需少量优化维护。
(5)以知春等线体系列共计8个不同字重(粗细)的等线黑体为基础,提供生僻字黑体显示能力,已完成,只需对少量汉字字形继续优化。
以上产品均对标编码字符集最新版国家标准和国际标准,已实现对强制性国家标准GB18030-2022《信息技术 中文编码字符集》实现级别3规定的所有汉字的全覆盖,并已覆盖GB18030-2022《信息技术中文编码字符集》第1号修改单中规定的CJK统一汉字扩展G、H的全覆盖。全面达到金融行业标准JR/T 0253-2022《金融服务 生僻字处理指南》完整级收录汉字的要求。
(6)研发适用于银行、医院等场景的排队叫号系统语音合成模块生僻字补音组件,让系统遇到生僻字时也能正确读出来,此工作核心数据与算法已就绪,已开发出原型系统。
(7)研发卓码输入法的Android、iOS、鸿蒙等移动终端版,已开发出原型系统。
(8)其他涉及生僻字的软件研发工作。
2、生僻字软件产品的推广应用
(1)免费发布输入法产品,推动国产信创操作系统厂商、国产手机厂商预装生僻字输入法。
(2)免费发布字库产品,推动国产信创操作系统厂商、国产手机厂商预装至少一款全字符集字库。
(3)推动全国范围内有需要的场景免费下载安装Windows版的输入法、字库、生僻字显形工具软件。
(4)推动现有大型输入法软件、语音合成软件厂商集成卓码核心算法和数据,一道推动解决问题。
3、涉及生僻字处理改造的技术支持
依托“姓名生僻字处理平台”,面向全社会免费提供公共服务业务系统涉及生僻字处理改造的远程技术支持。在所筹集到的经费保障下提供必要的现场技术支持。
4、中文信息处理公开课
开展以汉字编码字符集基础知识、信息设备汉字处理的原理、生僻字录入方法和技巧、新建业务系统支持生僻字的注意事项、现有业务系统支持生僻字的升级改造方法等为主要内容的中文信息处理公开课。
汉字强国计划需要您的参与
生僻字本是个技术小问题,却是20年来民生大难题。我们呼唤全国各行各业的朋友,与我们一起携手同行,为在全国全社会彻底解决生僻字问题而共同努力奋斗。
现针对上述计划征集有公众影响力的单位为共同发起单位,预计10家左右,有意者请联系我们。
现针对上述计划征集众筹共建参与单位,有意者请联系我们。