时间:2024-08-31
杨 城
(辽宁大学 a.文学院;b.文科综合实验中心,辽宁 沈阳 110036)
现代汉字的属性研究是对现代汉字所负载的各种信息的具体分析,其中字量研究是所有属性研究的基础。进行现代汉字的定量研究首先就必须界定现代汉字的范围,只有先对现代汉字进行定性研究才能保证现代汉字定量研究的准确和科学。现代汉字定量研究主要分为字量研究和字频研究两个部分。字量研究是以现代汉字在不同情况下的字的使用度和出现概率为条件,具体涉及用字全表、常用字表、通用字表、罕用字表、专业用字、专门用字等问题。字频研究是以现代汉字在不同情况下出现频率为条件,具体涉及各类汉字使用频度表和频率词典等问题。
1.现代汉字字量研究概况
(1)20世纪四五十年代,艾伟、徐则敏统计过20部中小型通用字典,收字最少的有4 431字,最多的有15 431字,大约是在7 500字左右。
(2)1953年,中国文字改革委员会制定《现代用字统计报告》,共收9 163个字种。
(3)1956年,中国文字改革委员会制定《通用汉字表草案(初稿)》,共收通用汉字5 390个。
(4)1965年,文化部和中国文字改革委员会联合发布的《印刷通用汉字字形表》收6 196字。
(5)1974年,北京新华字模厂制作《字目表》,共收字6 805个,包括一般报刊书籍用字6 310个和添盘字495个。
(6)1974年邮电部编的《标准电码本》收9 317个字,1983年出版《标准电码本》(修订本),共收7 292个字。
(7)1981年国家标准总局发布的GB23 12—80《信息交换用汉字编码字符集·基本集》收6 763个字。分为两级,一级常用字3 755个,二级次常用字3 008个。
(8)1988年,国家语言文字工作委员会研制出《现代汉语通用字表》和《现代汉语常用字表》,常用字表收字3 500个,通用字表收字7 000个。
(9)1980年以来,专门用字研究兴起,先后研制出《小学语文用字研究》(1983),《扫盲用字表》(1993),《汉字应用水平等级测试大纲》(2006)。
(10)另外,字量研究已经逐渐涉及汉字从古到今的各个方面,如既有《西汉早期简牍字量研究》《金文字量研究》《传统蒙学识字教材与现行识字教材汉字字种研究》等研究古代汉语用字的文章问世,也不乏如《人教版小学〈语文〉教材收字统计分析》《常用汉字字量、字种研究》《初级汉语教材汉字字序字量的考察——以〈发展汉语·(初级汉语)上〉为例》《小学五年级识字量与语文成绩的相关研究》《农村小学生识字量调查研究——以安徽省庐江县某镇小学生识字量调查研究为例》等针对现代汉字字量问题的研究成果。
2.现代汉字字量研究计量可视化分析
以“现代汉字字量”为主题检索词在中国知网进行检索,共计得到44条搜索结果,对这44条结果进行计量可视化分析得到总体趋势分析图和主题分布图,如图1、图2所示。
图1现代汉字字量研究总体趋势分析图
图2 现代汉字字量研究主题分布图
通过计量可视化分析,可以看出现代汉字字量研究的发文量在2004年、2012年和2015年左右达到了历史的较高值和最高值,但是也仅仅只有5~6篇文献,其他年份则均少于5篇文献。可见,现代汉字字量的研究尚处于起步阶段,发文年代分布不均,但有较为明显的增长趋势。同时,现代汉字字量研究的内容较为侧重汉字教学,也有关注字频统计、识字量、常用汉字、方块字等的研究。总之,现代汉字的字量研究重视应用,主要在现代汉字的识字教学方面,对于其他方面的研究涉及较少,特别是专业用字方面,尚无规范的、经过国家审查和业界广泛讨论完成的用字表,研究导向比较分散,尚未形成系统科学的学科研究体系。
1.现代汉字字频研究概况
(1)1928年,陈鹤琴编写了《语体文应用字汇》,“是现代汉字的字频统计最早的成果”[1]。书中频率最高的前20位汉字依次是:的不一了是我上他有人全这来小在们说子可道。
(2)1977年,新华印刷厂印制出《汉字频度表》,分为科学技术、文学艺术、政治理论、新闻通讯、综合五个部分,但因为当时时代背景的影响,导致个别与社会现实相关的汉字不正常地增多,且分文体的排列方式不便于检索。所以,在此基础上,1980年新华印刷厂编写完成了《按字音查汉字频度表》、1988年编写完成了《汉字频度统计》。《汉字频度统计》将现代汉字分为五级用字,分别是最常用字、常用字、次常用字、稀用字、冷僻字,共计5 991个。书中频率最高的前10位汉字依次是:的一是在了不和有大这。
(3)1986年,北京语言学院出版社出版《现代汉语频率词典》,书中较为科学地统计出了《汉字频率表》,共收字4 574个。书中频率最高的前10位汉字依次是:的一了是不我在有人这。
(4)1992年,国家语言文字工作委员会和国家标准局汇编成《现代汉语字频统计表》,根据社会科学和自然科学分门别类,统计出13个字频统计表,共收7 754个字种。
(5)2006年,国家语言文字工作委员会发布了《中国语言生活状况报告(2005)》,这份报告中包含《报纸、广播电视、网络用字用词调查》和《报纸、广播电视、网络用字总表》,统计共有8 128个字种,书中频率最高的前10位汉字依次是:的一在是有国了中人不。
(6)另外,字频研究也从现代汉字研究为主,逐渐向古代汉语用字延伸。例如,《中国古籍用字字频与分布统计分析》《〈三国演义〉字频研究》《三国吴简文字研究》《战国楚文字用字调查》《殷商甲骨文字形系统再研究 》《中国传统蒙学文献用字研究》《四大名著字频研究》《〈甲骨文合集〉第五~八册文字基础整理与研究 》等。但这些文献绝大多数仍然只是利用现代汉字字频统计的手段,以古代汉语书面语为研究语料,甚至部分语料直接采用现代汉字的书籍,单纯研究古代汉语用字的文献仅限于几篇研究古文字的文章而已。
2.现代汉字字频研究计量可视化分析
以“现代汉字字频”为主题检索词在中国知网进行检索,共计得到71条搜索结果,对这71条结果进行计量可视化分析得到总体趋势分析图和主题分布图,如图3、图4所示。
图3现代汉字字频研究总体趋势分析图
图4 现代汉字字频研究主题分布图
通过计量可视化分析,可以看出现代汉字字频研究的发文量在2011年、2013年左右达到了历史的最高值和较高值,但是也仅仅只有9~10篇文献,其他年份则均少于9篇文献。可见,现代汉字字频的研究也尚处于起步阶段,初始发文年代较现代汉字字量研究更晚,直到近年才有比较明显的增长趋势。现代汉字字频研究的内容以字频统计为主,立足于汉字方块字的本体属性,多为汉字教学方面的研究,这与现代汉字字量研究相同,都更为侧重汉字的应用。也有关于留学人员的对外汉语教学用字、汉字识别技术以及少数民族用字的统计分析。值得注意的是,与字量研究相比,字频研究更为依赖计算机技术,涉及的跨学科领域也更为广泛。字频研究的发文量较字量研究有了明显的增长,但研究导向同样比较分散,也尚未形成系统科学的学科研究体系。
“语言文字之学”是清末章太炎首先提出的,在这之前一直处于经学的附庸地位,而其中的汉字学是以汉字的发展和规律为研究对象的学问。1952年丁西林发表《现代汉字及其改革的途径》,首次提出“现代汉字”的概念,但是还没有涉及“现代汉字学”。直到1980年,周有光先生在《语文现代化》丛刊第二辑发表《现代汉字学发凡》一文,明确提出了这个概念,并将汉字学分为历史汉字学、现代汉字学、外族汉字学三个部分,“这是汉字学的重大发展”[2]。从此,现代汉字学作为一门独立的学问发展起来。
周先生提出了现代汉字研究的六个具体问题:“字量、字义、字形、字序、字音和汉字教学法”[3]。其中字量研究的首要任务的是给汉字进行断代,确定古今分界,明确现代汉字研究的量的范围。他将古今通用和现代通用的汉字归入现代汉字,将文言古代汉语用字而普通话不通行的汉字归入古代汉语用字。从而完善了汉字古今分野理论,明确了现代汉字的研究范围。
1.现代汉语用字全表
周先生提出字量研究的首要课题是制定出一份“现代汉语用字全表”[4]2,这是基于对现代汉字界定后在字性审定的基础上制定出来的,而不是考量现代汉字的出现频度。所以要将“现代汉语用字全表”和“现代汉语通用字表”“现代汉语常用字表”等区别开来。整理现代汉字的基本工作就是对现代汉字进行摸底,搞清楚书写现代汉语用字到底需要多少个汉字。
周先生以“造句实践法”对现代汉字字性进行审定工作,通过定性达到定量。同时,他指出定量工作的程序是波圈扩大,以词书为核心逐步拓展定量工作。而“用字全表”的结果应该是最佳逼近,不可能达到百分之百的“全”。
2.特种用字
周先生高瞻远瞩地看到了存在于现代汉字中的一些特殊场合才会出现的汉字,这些特种用字虽然出现频率极低,却不可忽视。对于此类现代汉字,周先生做了详细的分类,并对其归属于“现代汉语用字全表”表内还是表外还是交界地带也分别做了详细的说明。这些特种用字主要有以下几类:科技专用字(如氢、溴、鲅等)、民族宗教专用字(如佤、訇、稣等)、人地名专用字(如廖、邙、鄱等)、行业专用字(如等)、译音和象声专用字(如浬、哎、嘭等)、方言专用字(如冇、靓、垃等)、外族汉字(如辻、椥等)。
3.汉字查频
周先生在20世纪80年代就提出要将“五四”以来出版的书刊进行分期分类的字频统计,有全面有抽样,并且每隔若干年就要重新进行一次统计,不断研究小学用字和扫盲用字,利用计算机技术,将字频统计工作做得又快又好。
1.现代词书的收字基础
周先生指出一本现代汉语辞书,必须要告诉读者书写现代汉语要用多少个文字符号,而该词书又收录了多少文字符号。这两个工作必须通过现代汉字的定量研究才能完成。
2.教育用字的分级定量
周先生提出教育用字要实行分级定量,只有明确现代汉字量的范围,才能在此基础上选字、分级,这依赖于现代汉字字频的统计,同时不分古今的分级定量是没有意义的。
3.文字工作的机械化、自动化和电脑化
周先生提出,实现国家的现代化必须实现汉字的现代化,汉字输入输出计算机的技术日臻成熟,将哪些汉字进行输入输出必须建立在现代汉字常用字表、通用字表和用字全表的基础上进行选择。
4.汉字定量促进汉字稳定
周先生提出汉字定量是促进汉字稳定的条件之一,整理汉字要限定汉字的字量,不再起用死字,不再随意创造新字,再进一步研究如何减少汉字总数。
周先生善于将自己的研究发现上升到理论高度,建设新的学科体系,这种创新思维和开阔眼界在学术研究领域十分宝贵,中国的语言理论建设明显滞后于国外,导致现在很多最新的语言理论都要学习西方。这是每一个语言文字工作者需要终生思考的问题和提升的能力。
周先生早年研究经济学,在研究语言文字的过程中往往受到跨学科思维的影响,对于推进语言文字与计算机技术接轨表现出了浓厚的兴趣。另外字频研究、字量统计都涉及跨学科的方法,类似于现代汉字定量研究用到的波圈扩大法和最佳逼近法也都是明显的自然科学的研究方法。国内近年兴起的通识课程开设,向西方教育制度学习其实更有利于激发研究思维,语言研究本身就处于文理交叉的道路上,因此,语言文字工作者应适当地学习一些数理统计等基本自然科学的方法,往往对自身研究可以收到事半功倍的效果。
周先生对现代汉字的定量研究明显地具有国家政策导向,重视语言文字的应用和解决应用中的实际问题,从而“建设现代化时期的新语文”[5]。这表明,语言研究不可能脱离社会时代的大背景而处于真空之中,我们毕生研究的更高追求不应只局限于书本知识、只促进人类认知发展的纯理论研究,而更应该是有助于国家发展、社会运用和进步的。特别是语言研究进入“后牛顿时代”,传统的本体研究愈来愈受到现代科学的挑战,如何在这样的大数据、云计算的背景下找到传统语言文字学研究的立足之地是每一个语言文字工作者需要面对的问题。
周先生在现代汉字定量研究的过程中,分别研究了中国和日本的汉字定量研究,通过对比的方法找到优缺点,从而完善自己的理论。这在其比较文字学的研究上体现得更为明显。他的《现代汉字学发凡》对后期高家莺、范可育、费锦昌、杨润陆、苏培成等人的现代汉字学研究都具有高屋建瓴的指导作用。
周先生对特种用字的分类问题较为庞杂,考虑得过为细致,如书中提到的行业专用字“”已成为死字,现在直接采用“扎”字代替。这一点在苏培成的《现代汉字学纲要》中重新进行了分类,共分为专门用字和专业用字两大类,下设各个小类,分类更为科学合理。
另外,周先生提出“名字用字是‘无限量’的,可以选用任何汉字,不论字典里有没有”[4]10,该观点明显不适用于当今社会。取名采用生僻字会给本人和他人都带来识读困难,在办理相关证件和手续时也会遇到各种阻碍,更不用说采用字典字库里没有的字,现行的国家法律也明确规定了姓名用字的问题。
周先生开创了现代汉字学学科体系四十年来,很多学者都在追随着周老的脚步,共同为中国语文的现代化工作而砥砺前行。周老对于现代汉字学定量问题的研究无疑是具有开创性的,其研究的思维方法和研究成果也得到了广泛运用。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!