汉语和汉字
◇吕叔湘
今天讲的分两部分,第一部分讲汉语的字音结构,第二部分讲汉字的形、音、义之间的一些错综复杂的现象。
有—种民间文艺形式叫绕口令,又叫急口令,例如:(1)“吃葡萄不吐葡萄皮儿,不吃葡萄倒吐葡萄皮儿”;(2)“板凳不让扁担绑在板凳上,扁担偏要板凳让扁担绑在板凳上”;这种话说快了准会说错字儿,比如把“葡萄皮儿”说成“皮条蒲儿”,把“扁担”说成“板担”,“板凳”说成“扁凳”,这就叫做绕口。绕口令为什么会绕口呢?这得从双声、叠韵说起。
什么叫做双声、叠韵?用现在的名词来解释,双声就是两个字的声母相同,叠韵就是两个字的韵母和声调都相同。(如果不是完全相同,而只是相近,就只能叫做准双声、准叠韵。也有人不加分别。)刚才那两个绕口令里的双声,叠韵关系,可以这样表示:
(1)
(2)
双声和叠韵的字音都是一部分相同,一部分不同,把许多这样的字音安插在一句话里面,说快了就容易“串”。
古人很早就发现汉语字音极容易发生双声叠韵的关系,因而在修辞上加以利用。例如古代有大量的联绵字,或者是双声,或者是叠韵。双声的像:留连、流离、辗转、颠倒、踌躇、踟蹰、踯躅、嗫嚅、鸳鸯、蟋蟀。叠韵的像:逍遥、绸缪、猖狂、优游、蹉跎、逡巡、彷徨、徘徊。这种联绵字很多一直保存到现代。现代的象声词也都利用双声叠韵关系,如“丁当”双声,“当郎”叠韵,“丁零当郎、丁丁当当”双声兼叠韵。双声叠韵的最广泛的用处自然是在诗歌方面,这个下文再谈。现在且说双声、叠韵在汉字注音方面的利用。
汉字不是表音的文字,不能看见字形就读出字音来,因此有注音的需要。最古的注音办法是“读如、读若”,用乙字比况甲字的音,就是后世所说的直音法。直音法的缺点是很明显的:如果不认识乙字,也就读不出甲字;要是一个字没有同音字,那就根本无法注音。大约在魏晋时代,产生了反切法。反切法用两个字切一个字,例如“光,姑汪切”。姑光双声,汪光叠韵,这就是所谓“上字取其声,下字取其韵”。反切法比直音法进步,但是还有很大的缺点,主要是用来做反切上下字的总字数还是太多,一般字书里都在一千以上。换句话说,一个人必得先会读一千多字,才能利用它们来读其余的字。为什么要用到这么多字,这得先把汉语的字音解剖一番。
汉语里每个字的音,按传统的说法是由“声”和“韵”两部分构成的。事实上,只有“声”是比较单纯,可以不再分析,“韵”却相当复杂,还可以进一步分析。首先应该提出的是“声调”,就是字音的高低升降,古时候的“平、上、去、入”,现代普通话的“阴平、阳平、上声、去声”。把声调提开之后,“韵”还可以分成“韵头、韵腹、韵尾”三部分。换个说法,汉语里一个字音包含声调、声母、韵头、韵腹、韵尾五个成分。其中声调和韵腹是必不可少的,声母、韵头、韵尾不是每个字音都有的,有些字缺少这个,有些字缺少那个,有些字全都没有。用1、2、3、4代表声母、韵头、韵腹、韵尾,我们可以用下面这些字作各种字音结构的例子:
(1234)桥qiáo黄huáng(234)摇iáo王uánɡ(134)报bào乾ɡān(34)傲ào安ān(123)家jiā瓜ɡuā(23)鸦iā蛙uā(13)补bǔ河hé(3)五ǔ鹅é每个字音都可以有声调变化,例如阴平“敲”,阳平“瞧”,上声“巧”,去声“窍”。也有四声不全的,例如阴平“光”,阳平缺,上声“广”,去声“逛”。这就是汉语字音结构的基本情况。
反切法为什么要用到那么多上下字呢?首先是因为反切下字要管韵头、韵腹、韵尾、声调四个成分,只要有一个成分跟被切字不同,就不适用。因此字数就不可能太少。还有一个原因是历代编纂的各种字书的反切用字,有因袭也有创新,很不一致,这也使字数加多。
我们现在用汉语拼音字母来注音,比反切法又进步多了。声母、韵头、韵腹、韵尾,声调都只要用少数符号来表示:
1.声母:b,p,m,f,d,t,n,l,ɡ,k,h,j,q,x,zh,ch,sh,r,z,c,s
2.韵头:i(y),u(w),ü(y)
3.韵腹:ɑ,e,o,i,u,ü
4.韵尾:i,u,o,n,nɡ
5.声调: ' ˇ `
这样,25个字母加4个调号,就把注音问题全部解决了。
“声、韵、调”是了解汉语字音的基本概念,必须弄清楚,尤其是因为“声”和“韵”都有不止一种意义。拼音方案声母的“声”是一种意义,声调的“声”,即平、上、去、入声的“声”又是一种意义。古时候只说“四声”,现在为了跟声母区别才说“声调”。
“韵”也有两种意义。拼音方案韵母的“韵”包括韵头、韵腹、韵尾,可是不包括声调。诗韵的“韵”就加上声调的因素,“东”和“董”韵母相同,但不是一个韵;可是不计较韵头,例如“麻”和“霞”和“华”是一个韵。叠韵的“韵”一般也不计较韵头,有时候声调不同也算是叠韵。
关于声调,常说“四声”,可是得区别现代普通话的四声和古音的四声。古音的四声是平、上、去、入,普通话的四声是阴平、阳平、上声、去声。古音的入声在普通话里已经分别变成阴平、阳平、上声或去声。
声调是汉语字音的不可缺少的部分,它的重要决不在声母、韵母之下。有些人以为声调仿佛是外加的,是可以拿掉的,这是一种误解。光写一个“ma”,不标调,你就不知道是“妈”,是“麻”,是“马”,还是“骂”,干脆就是读不出来。有了上下文当然可以解决,可要是有上下文,去掉个把声母也不碍事。比如“qíshanɡletādezǎohónɡ…ǎ”,你也知道说的是“骑上了他的枣红马”。许多人不爱听用汉语演唱的西洋歌剧。为什么?除民族风格的差别外,还因为那唱词里的四声大半走了样,听不懂不好受,听懂了更不好受。
弄清楚声、韵、调的概念,是了解古典文学作品中许多现象的必要条件。叠韵的关系首先被利用来在诗歌里押韵。上古时代押韵只求元音和谐,声调不同也可以押韵。六朝以后用韵渐严,开始要求分别四声,后世的诗韵一直遵守这个原则。宋朝人做词,渐渐有上、去不分乃至四声通押的现象,韵部也归并成较少的数目。到了元曲,四声通押成为通例(这时候入声已经分别变成平、上、去声)。现代的京戏和曲艺用的是“十三辙”,只分十三韵,可算是最宽的韵类了。
押韵可以是全篇用一个韵,也可以在当中换韵。律诗总是一韵到底,很长的“排律”也是如此。古体诗有一韵到底的,也有几句换一个韵的,例如白居易的《长恨歌》头上和末尾都是八句一韵,中间多数是四句一韵,也有几处是两句一韵。词的用韵变化更多,举一首比较复杂的做例子,温庭筠的《酒泉子》:
花映柳条,闲向绿萍池上。凭阑干,窥细浪,雨萧萧。近来音信两疏索,洞房空寂寞。掩银屏,垂翠箔,度春宵。
全首十句,除第三句和第八句外,其余花搭着押了三个韵:

这种用韵的格式在西洋诗里很普通,汉语诗歌里只有在词里才偶尔见到。元曲用韵又归于简单,一般是一套曲子一韵到底。
双声和叠韵常常被用在诗句里作为一种调协声律的手段。例如杜甫的诗:“吾徒自漂泊,世事各艰难”,“吾徒”、“艰难”叠韵,“漂泊”、“世事”双声。在一首之中,李清照的《声声慢》是一个很好的例子。又如韩愈的诗《听颖师弹琴》头上两句:“昵昵儿女语,恩怨相尔汝。”“昵女”双声,“儿尔汝”双声,这两组字的声母以及“语”的声母在韩愈的时代是同类(鼻音)。此外,“恩怨”也是双声。“女语汝”是叠韵,“儿尔”韵母相同,“昵”的韵母也大部分相同。这两句诗里边没有一个塞音或塞擦音的声母,并且除“恩”字外,韵母都有i介音。这样就产生一种跟这两句诗的内容配合得非常好的音乐效果。
在汉语的诗律里,比双声、叠韵更重要的,占主导地位的语音因素,还得数四声。四声之内,音韵学家把平、上、去归为一类,和入声对立,但是文学家却把上、去、入归为一类,称之为仄声,和平声对立。平声和仄声的种种组合,一句之内的变化,两句之间的应和,构成诗律的骨架,这里不能细说。
不但是诗律以平仄对立做它的核心,散文作者也常常利用平声和仄声的配合,特别是在排偶句的末字上,使语句在声音上更加和谐,便于诵读。例如:

上面例子里加o和△的是平声字,加·和▲的是仄声字,o和·是主要的位置,△和▲是次要的位置。以主要位置上的平仄而论,第一例是基本上用“仄平平仄,平仄仄平”的配列,节奏柔和,近于骈文和律诗。第二例四个排句的结尾是两个平声之后接着两个仄声,末句用平声字结。第三例的配列又不同,前面三个排句,九个字里有七个是仄声,后面三个排句,九个字全是平声,结句的末尾用仄声,节奏十分挺拔,跟第一例形成显明的对比。
现在来谈谈汉字的形、音、义。字形、字音、字义之间的关系可以从两个角度来研究。或者是研究一个字的形、音、义的内部联系:这个字为什么这样写,这个字为什么读这个音。这种研究从《说文解字》以来就形成了一个传统,现在管它叫文字学。或者是研究不同的字在形、音、义方面的异同以及由此形成的错综复杂的关系。从前的文字学著作有的也附带讲点儿,后来又有《字辨》一类的书,供人参考和学习,但是缺少系统的论述。对一般人来说,知道一个字本身的形、音、义关系当然也有点好处,可是关于这个字和那个字的形、音、义的异同和关系的知识也许更有实用价值。
最理想的文字应该是一个字只有一个写法(拼法),一种读音,一个(或者相近的一组)意义;任何两个字都在形、音、义三方面互相区别。可惜世界上没有这种文字。任何文字都在形、音、义方面有些交叉,不过有的利害些,有的比较好些罢了。汉字应该说是属于利害的一类。请看下面这个例子:

你看,三个读音,三个字形,三组意义,但不是一对一而是互相参差。zhǎnɡ这个音联系两组意义;生长、增长这一组意义分属两个音,写成三个字;zhǎnɡ和zhànɡ各有两种写法;“长”这个字形要为两个读音和三组意义服务。这种错综复杂的情形当然不多,可是一般程度的纠葛是很多的。
如果拿汉字做出发点,可以分别这几种情况:(1)一字多形——异体字;(2)一字多音——异读字;(3)一音多字——同音字;(4)一字多义——多义字。底下就按这个次序来谈。
(1)先说异体字。异体字是一个字的不同写法。两个或几个字形,必须音义完全相同,才能算是一个字的异体。例如“强、強、彊”是一个字,“呼、虖、嘑、”是一个字,“欢、歡、懽、”是一个字,“窗、窓、窻、牕、牎”是一个字。一般情况,异体字的形体总有一部分相同,上面“强、呼、欢、窗”这四组都是这样,别的例子还很多。可是也有全不相同的,例如“乃、廼”,“以、吕”,“专、耑”,“野、埜”,等等。
有些字只是在用于某一意义的时候才有另外一种写法,用于另一意义的时候就不能那样写。例如“凋、琱、彫、雕、鵰”五个字形,没有两个字形是在任何场合都可以通用的。
“草木零落” 凋×彫雕×
“镂刻彩画涂饰” ×琱彫雕×
“鸷鸟” ×××雕鵰
像这种情形就只能管这些字叫做部分异体字。再举两个例子:
纪、记(纪念、纪录、纪事)
纪(纪律、世纪)
记(记号、记忆、记者)
挫、剉、锉(挫折、挫伤)
挫(抑扬顿挫)
锉、剉(锉刀、锉平)
异体字问题又常常同异读问题纠结在一起。例如“强”有三种写法,同时有三种读音(qiánɡ,qiǎnɡ,jiànɡ),不过字形和字音之间没有选择关系。下面是有选择关系的例子:

异体字是汉字历史发展的产物,古书上的异体字也不可能一概取消。然而作为现代人应用的工具,异体字实在是有百弊而无一利,应当彻底整理一下。可是单纯异体字好处理,部分异体字就得费点心思。
(2)异读字的情况比异体字复杂得多。异读字可以按几个读音是否相近分成两类,读音相近的又可以按意义的异同分开来谈。读音相近的,它们的差别或者是声母不同,例如:
系:jì,系鞋带儿;xì,联系
秘:mì,秘密;bì,秘鲁
或者是韵母不同,例如:
薄:báo,纸很薄;bó,薄弱
熟:shóu,饭熟了;shú,成熟
或者是声调不同,例如:
骨:ɡú,骨头;ɡǔ,骨节、脊椎骨
差:chā,差别;chà,差不多
或者是声韵调里有两项或者三项不同,例如:
吓:hè,恐吓;xià,吓坏了
壳:ké,鸡蛋壳儿;qiào,地壳
虹:hónɡ,虹彩;jiànɡ,天上出虹了
这些不同的读音往往是一个用在口语性较强的词语里,一个用在书面性较强的词语里。这些字的读音差别一般是有规律的。它们大多数在古时候只有一个读音,后来说话音和读书音分化了,形成所谓文白异读的现象。各地方言都有这种现象,北京话不是最突出的。
上面这些例子都可以说是读音的差别,并不表示意义有多大差别,只是使用的场合不同罢了。另外有些字,不同的读音所联系的意义已经有相当的距离。例如:
好:hǎo,好坏;hào,爱好
缝:fénɡ,缝补;fènɡ,缝儿
传:chuán,传播;zhuàn,传记
调:tiáo,调弦;diào,腔调
这类字很多。它们的读音差别是古来就有的,规律性也更强,主要是声调不同,声母的不同往往是声调不同引起的(如“传”“调”)。这类字从语言的角度看,都应该算是两个字,不过关系很密切,可以叫做“亲属字”。
有些异读字,读音虽然相近,意义相差很远,那就不是亲属字,只是几个字共用一个字形罢了。例如:
差:chā,差别;chāi,差遣
炮:páo,炮制药材;pào,枪炮
的:dí,的确;dì,目的;de,红的
打:dá,一打十二个;dǎ,打人
末了这个例子最明显,一打的“打”是译音,跟打人的“打”毫无关系。枪炮的“炮”原来写做“礮”,红的的“的”原来写作“底”,也可以证明跟另外那个“炮”和另外那个“的”是不同的字。(的确的“的”和目的的“的”意义相关,古时候读音相同,可以算一个字,现在读音不同,也许得算两个字。)
另一类异读字的读音相差很大。这里面有的意义相同,例如:“尿”有niào和suī两读,“拗”有ào和niù两读。这往往是不同方言混合的结果。有的意义毫无关系,是借用字形的结果。例如古代三十斤为钧,四钧为石,后世称一百斤为一担,有时也写作“石”,于是“石”就添了dàn这个音。广西僮族的僮读zhuànɡ,借用“僮”tónɡ字,于是“僮”就有了两个读音。这种现象就是日本人所说的训读——借用汉字代表日语的字眼,不取汉字的音而用原有字眼的音来读。无论是“尿”这一类或者“石”这一类,从语言的角度看,都得算两个字,而且不能归入亲属字。
异读字也是历史发展的结果,可是在文字的学习上增加不小的困难。普通话审音委员会已经删汰了不少异读,保留下来的是委员会认为有区别意义的作用或者使用场合不同的。可是大多数字都只有一个读音,一字一读是合乎文字功能的原则,因而也是深入人心的趋势。因此只有几个读音都是常常应用,势均力敌的时候,才能长久并行,例如长短的“长”念chánɡ,生长的“长”念zhǎnɡ,快乐的“乐”念lè,音乐的“乐”念yuè。否则比较少用的音很容易被常用的音挤掉,例如处理的“处”不念chǔ而念成chù,一唱一和的“和”不念hè而念成hé,不但常常可以从一般人嘴里听到,而且常常可以在电影里、舞台上和广播里听到了。
与此有关的是文言里的破读问题。例如“解衣衣我,推食食我”的第二个“衣”字读去声,第二个“食”字读“饲”;“故王之不王,不为也,非不能也”的第二个“王”字读“旺”。有人说这种破读是注家的造作,不一定在实际语音上有根据,也有人认为当时语音确实有分别,现代还有不少用声调区别词类的字,可以作证。作为语言史上的问题,可以进一步研究,但是作为现代人学习文言的问题,也未尝不可以另作考虑。现代的异读是活在人们口头的,尚且有一部分已经在逐渐被淘汰,古代的异读只存在于古书的注释中,自然更不容易维持。还有一说,文言里的字已经全用现代音来读,很多古代不同音的字都已经读成同音,惟独这些破读不予通融,是不是也有点儿过于拘泥呢?
(3)同音字可以按意义是否相关分成两类。意义不相关的,像“工、公、弓”,“电、店、殿、惦”,例子多得很,不必列举,也没有什么可讨论的。意义相关的同音字就不同了。它们的意义联系不是偶然的,是跟字音有关的,例如“崖”和“涯”,“亭”和“停”,“方”和“坊”,“椅”和“倚”,“曆”和“歷”。这些字是古时候就同音的。也有古时候只是读音相近,现代已经完全相同的,例如,“穫”和“獲”,“座”和“坐”(古上声)。此外还有从古到今都只是读音相近而不是完全相同的,例如“长、张、帐”,“孔、空、腔”,“环、圆、圈、旋”,“见、现”,“昭、照”,“劈、闢”,“知、智”。这三类字,光从读音看,只有前两类是同音字,但是这三类字都是每组读音相同或者相近,而意义相关的,从语言的角度看都是亲属字。
还有一种特殊的同音字:“他”和“她”和“它”,“的”de和“地”de,这里的字形分别纯粹是书面上的事情,在语言里只能算是一个字。
现代汉语里同音字特别多。普通话里有字的音节大约一千二百多个,一般字典、词典大约收字八千到一万个,平均一个音节担负七八个字。当然不可能“平均”,有许多音节只有一个字,有不少音节有十五六个字,《新华字典》(一九六二年版)里zhì这个音节有三十八个字,外加九个异体。
同音字多了,是否会在语言里产生混乱呢?事实上这种可能性极小。因为字总是组织在词句里的,这个音在这里联系什么意义,一般没问题。在书面上,字形不同当然有帮助,但是也不起决定性作用,“一字多义”一般也没问题。口语没有字形的帮助,照样能发挥交际工具的作用。不过在文字的学习上倒的确引起一些困难,写别字多数是由于同音。
(4)多义字在任何语言里都是很普通的现象。越是常用的字,越是意义多。意义的分项也很难有固定的标准,可以分得细些,也可以分得粗些。同一个字,在小字典里也许只分两三个义项,在大字典里就可能分成十几项,这里就不举例了。需要讨论的是一个字的意义相差到什么程度,在语言里就不应当还把它们看成一个字。最明显的是译音字。例如长度单位的“米”跟吃的“米”毫无关系,重量单位的“克”跟克服的“克”毫无关系。其次是虚字,虚字一般都是借用一个实字。例如须要的“须”借用胡须的“须”(后来写成“鬚”,现在又简化复原为“须”),不要的“别”借用分别的“别”。这些都应该破除字形的假象,看成同音同形的两个不同的字。
此外还有许多字,几个意义的差别也很大。随便举几个例子:快速的“快”和痛快的“快”,缓慢的“慢”和傲慢的“慢”,树木的“木”和麻木的“木”,配偶的“偶”和偶然的“偶”,排列的“排”和排除的“排”,快速的“疾”和疾病的“疾”,竹简的“简”和简单的“简”,材料的“料”和料想的“料”,露水的“露”和显露的“露”,等等。这些字的不同意义很可能原来就没有关系,有的也许当初有联系,可是现在也联系不上了。这种字也应当看成两个同音字。
另一类字,几个意义之间的联系是很清楚的,可是差别还是比较大,尤其考虑到词类。例如:锁门的“锁”和一把锁的“锁”,消费的“费”和水电费的“费”,相信的“信”和一封信的“信”,书写的“书”和一本书的“书”,张开的“张”,和一张纸的“张”,等等。这种字似乎可以算一个字,也可以算同音的两个亲属字。在语言里,一字多义和两字同音是很难区别的。这种游移两可的情形可以从某些“俗字”的产生看出来。例如把“上鞋”写做“绱鞋”,把“安装”写作“按装”,把“包子”写作“饱子”。这些字我们管它叫“俗字”,其实过去汉字的越来越多,主要就是这样来的,不过通用的时间长了,著录在字书里,就不再说它是俗字罢了。
上面分别讲到异体字、异读字、同音字、多义字,是从汉字出发来谈的。谈着谈着就发现,从语言的角度看,这样分类并不能说明问题。从语言的角度看,主要是音和义的问题,字形只有有限的参考作用。在语言里,或者是一个字,或者是两个亲属字,或者是两个无关系的字。语言里的一个字,在文字里可以有几个字形;更多的情况是,文字里的一个字,在语言里该算作两个字。可以画成一个简单的图(附后)。从这个图上可以看出,两方面的参差是相当利害的,特别是异读字包含多种情况。语言在不断发展中,文字总是比较固定,比较保守。有人说汉字是最适合汉语的文字,可是要照我们今天谈的各种情况来看,汉字为汉语服务也并不那么尽善尽美。
