今人在整理录入先人族谱的时候,经常会遇到的一个问题是,先人名字中的某个字现在已经不再使用了。这种情况令续谱者很是为难,是直接用现在的规范字还是沿用古字?用古字,大家都不仅不会读,更不知道字的含义。用规范字,又有擅改先人名字冒犯先人的顾虑。要解决这个难题,首先要了解汉字的使用和延续。
汉字的数量并没有准确数字。2012年,“中华字库”工程在我国启动,据统计约有10万个汉字、10万少数民族文字以及10万多个如甲骨文这种不常见的古代书写文字编码,总计约30万字。而日常生活中常用的汉字数量为2500个,次常用字1000个。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字时已到99%,简体与繁体的统计结果相差不大。
历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为异体字和罕用字。绝大多数异体字和罕用字已自然消亡或被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“二简字”,已被废除,但仍有少数字在社会上流行。
汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。
另外有些字典收字也较多,如清朝的《康熙字典》收字47035个;日本的《大汉和字典》收字48902个,另有附录1062个;台湾的《中文大字典》收字49905个;《汉语大字典》收字54678个。20世纪已出版的字数最多的是《中华字海》,收字85000个。
在汉字计算机编码标准中,目前最大的汉字编码是台湾的CNS11643,目前(4.0)共收录可考证之繁简、日、韩语汉字共76067个,但并不普及,只有在户政系统等少数环境使用。台港民间通用的大五码收录繁体汉字13053个。GB18030是我国现时最新的内码字集,GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB2312收录简体汉字6763个。而Unicode的中日韩统一表意文字基本字集则收录汉字20902个,另有两个扩展区,总数亦高达七万多字。
那么,面对家谱中先人名字中不再使用的字怎么处理呢?首先,要明确家谱并非公开发行的出版物,因此不需要严格执行我国目前现行的通用规范汉字的用法,即繁体字、异体字、简化字、现行的通用规范汉字使用选择权在于家谱编撰人(群体、机构)。其次,要统一标准。即如果统一使用规范汉字,就要全篇使用;如繁体字、异体字、简化字、规范汉字等混用,就要根据情况混用。例如鑑,现已经改为鉴:统一用规范汉字,那么先人和现人名字中都要写为鉴;如果混用,那么先人名字中鑑字保留,现人的名字中就用鉴。统一用规范汉字的优势在于便于查阅辨读和续修。混用的优势在于尊重和还原,比如鑑同胞兄弟有钊、钦、锦等,如用鉴,阅后会有其兄弟辈格格不入的感觉。汉字是在不断演化的,今人不识古字也是正常,但后人铭记先人不应该连名讳都不会认不会读。因此,也有一些新修的家谱中采取了混用加备注的方式。还是以鑑为例,先人名字中仍记作鑑,但备注有“通鉴”或“同鉴”。无论采取哪种标准,都需要召开编委会、家族会议等,广泛征求族人意见,共同商议决定。