“血色曙光──华夏文明与汉字的起源”之五
汉字与阿尔泰语渊源关系
□徐江伟
一、汉字的起源
当我们在水边散步的时候,看到水底下黑黝黝的水草随水流飘动,我们可能会产生这样的遐想:水草原本生长在岸上,后来被水淹没,慢慢适应了水中的环境,最后变成水中之草……大地上草木繁多,生长丰茂,相比之下水草显得单调多了,由丰富多样变成单调稀少的原因是很容易想象出来的,也是很常见的自然现象,因此产生这种水草起源的想法是很自然的。但研究生命起源的科学家告诉我们,水草的历史比我们想象的要悠久得多了,地球上的生命包括草木都是在水下环境中产生出来,陆地上的草木原本都是水草,它们渐渐向陆地蔓延,逐步适应了陆地上无水的生存环境,才演化出今天我们看到的千姿百态的植物世界。
又如我们看到黑非洲,不管是人种还是社会都呈现出人类的原始风貌,想当然地以为他们的历史可能比较短暂,但人类学家研究表明,世界上所有人类都是从黑非洲走出来的,没有哪个民族能比他们的历史更悠久,原始风貌反而是历史更悠久的表现。
由此可见人们原来的观念可能是一种错觉!
关于汉字起源,情况正是如此,我们已经被假象迷惑了数千年!
如果回顾东方民族文字发展史,我们看到历史上阿尔泰游牧民族建立的国家,如辽、西夏、金,还有朝鲜、日本,他们的文字都是借用汉字偏旁部首创造出来,他们原本没有文字,汉字被他们借用并改造之后,适应了他们的语言环境,形成了他们自己的民族文字,这些都属于汉字的延伸应用,为此我们的观念早已固化,再也不会去做相反的推想了。【作者简介】 徐江伟, 1982年毕业于浙江师范学院中文系,曾当过教师,后从商,现为自由职业者,134并爱好历史研究。
汉字起源于阿尔泰语,这会是真的吗?是的,汉字起源于阿尔泰语,汉字最初表达的的确是多音节的古代阿尔泰语。对此笔者将从诸多方面加以论证说明,通过对汉字“基因分析”来展开讨论,这有助于我们揭开华夏文明起源的奥秘,从而描述出真实的华夏文明起源发展史。
让我们首先对两种语言中的基本词汇做一些分析考察:
水,古代突厥语读作“苏乌”suw(西文字母转写)
土,古代突厥语读作“拓”tu
木,古代突厥语读作“莫”mo
石,古代突厥语读作“它斯”tas
儿,古代突厥语读作“乌鲁儿”orul
心,古代突厥语读作“身”siin
从读音上我们很容易发现,古代突厥语发音与现代汉语十分相似。这种相似性是怎么来的呢?有人会说:这是语言的借用现象啊,借用现象在世界上各种语言之间广泛存在,有什么可奇怪的呢?那么,到底是谁借用了谁呢?
应知这样一些基本词汇,在人类出现之初就已经存在于各种语言中了,那是一些最基本的概念,那是人类认知世界的最初成果,应在人类开始说话时就形成了。可以推定说阿尔泰语的游牧民族对此早就有自己的读音,说单音节语言的汉民族先民也早就有自己的读音,而且两个读音不会相同或相似,因为两种语言不存在亲缘关系,两大族类可能在人类出现之初就分开独自发展了,他们的语言应不会出现“撞车”现象;两者之间必定有一个是借用者,借用者把自己原有的读音遗失了。
笔者的结论是,汉语借用了古代突厥语,并把自己的原有的读音遗失了。为什么这样推定?因为古代阿尔泰语游牧民族都没有自己的文字,由于没有文字,他们远古祖先遗留下来的读音就会代代相传,不会遗失;而汉民族由于早有文字,原来固有的读法就可能被文字读音取代,换言之,历史上汉民族面临过这种被取代的风险,而阿尔泰游牧民族由于没有文字,没有面临过这种风险,采用排除法可以推定汉语上述读音是借来的,这样的推定其实是一种逻辑的必然性。
请注意下面一段文字:汉民族先民奴隶出身的历史真实已经注定汉民族先民不可能是汉字最早的创造者,因为奴隶不需要文字,需要文字的是作为统治者的阿尔泰语游牧民族,汉字最初表达的必然是古代阿尔泰语,其最初的读音必定是多音节读音的。
为了形象直观地说明问题,让我们立即着手对汉字做一些本义方面的人随笔汉字与阿尔泰语渊源关系135
分析。我们可以通过考察汉字的本义来指认它最初表达的是哪一种语言:
载,古代突厥语“年”读作“支意儿”ziil,“一年”的意思,蒙古语“年”读作“恩即儿”enjil,两者读音非常近似,快读都是汉字“载”的读音。甲骨文和金文“载”的本义也是“年”。但现代汉语中这个“年”的意思早已经淡出,变成“载重”的意思了。但直到今天蒙古语读音仍然是这个汉字的古义。
树,蒙古语“尚树”的读音,专指那种对高大,高龄树木的祭祀仪式。游牧民族认为所有大树都有神灵附体,这种祭拜树木的习俗至今在延续着,他们常常在那里“尚树”,而这正是汉字“树”的本义。树,会意字,本来就指一种祭祀仪式,你看象形字“木”前面摆放一“豆”(一种祭祀器皿),上面盛有献祭物品,“寸”是手,手拿着祭品做祭拜之礼,甲骨文,金文如图:
甲骨文“树”不是指树木,树木另有“木”字,对此古人绝不会混淆。但现代汉语把“树”的本义剔除了,由此可见甲骨文“树”最初表达的是蒙古语“尚树”,后来两个音节缩成一个,多音节词汇单音节化了。
曰,古代汉语常用字,但汉语口语完全不用,古代突厥语口语“话语”读作“阿语儿”ayr,故可以推定这个象形字最初表达的是古代突厥语而不是汉语,汉字读音由突厥语单音节化而来。
坐:象形字,本义是高台上有二人,但他们不是一般的人,而是高高在上的尊者。从象形字中可以看出,这个汉字本义不是一般的行为动作,而是指一种等级地位。如图:
我们在古代突厥语中找到了这个汉字本义,古代突厥语读作“乌乍”uza。《阙特勤碑》有这样的句子:kisi orlinda uza,“众人之上(坐)有我的祖先”。坐是“在……之上”的意思。象形字“坐”本义清楚地告诉我,是说古代突厥语的人创造了这个字,本义是“尊者”,汉语把它转而用做一般的行为动词,本义已被抛弃了。但这种以“坐”来体现尊贵的习俗在阿尔泰游牧民族中始终存在。
歹,古代突厥语危险或死亡读作“阿达”ada,习惯用“歹”来表示“危险”“死亡”是古代汉语的特色,但汉语口语不用,因此可推定“歹”原来表达的是突厥语口语。
136狐,汉语读作hú。我们知道这是一个形声字,“瓜”是其声旁,
因此远古
时候可能读作“瓜”(gua)。这可以从古突厥语中得到印证,《阙特勤碑》中“狐”果然读作tilku “脱儿姑”,快读即成“瓜”音了。
陈,蒙古语“旧的”读作“呼陈”huuchin,而这正是汉字“陈”的本义,古代汉语中“旧”都写作“陈”,现代汉语中陈的本义已经被抛弃不用,但在蒙古语口语中依旧保持其本义,就是说“陈”字最初表达的是蒙古语。
妾,满洲语读作“福晋”,“妾”,会意字,意思是站立伺候的女子,刚造出来时应读作“福晋”两个音节,快读即可缩音成qie。
鬼,蒙古语读作“翁贡”,缩音后即成今天汉语普通话“鬼”的读音了。《史记》记载:“楚人读‘鬼’,越人读‘几’”,今天的吴越方言仍然读作ju,因此前者读音可能由阿尔泰语而来,后者读音可能是汉语方言固有的发音。
贷,《金史・国语解》记载“买到”女直语读作“兀带”,这应是“贷”字的本义和原始读音,因为它不见于汉语方言和口语中,可能是个外来词,来自女直语的可能性最大了。
适,《金史・国语解》曰:“安乐”女直语读作“赛里”,这可能是汉字“适”的本义以及今天读音的来源。
讼,这是“雅言”,只会出现在书面语言中,汉族口语中从不见使用,“讼”,象形会意字,意思是许多人同时在说话,引申为“争辩”“分辨”。满洲女直语读作“倍申”becen,可能就是其原始读音。
爵,古突厥语“大臣”“大官”读作“吉利”,推测其为汉字“爵”的来源。匕,象形字,古汉语中常用,意思是刀,现代汉语中已不单独使用了,汉语口语也不用,但古代突厥语“刀”确读作“毕”bi,至今如此读法,故推定是古代突厥人创造了这个字。
香,蒙古语读作“桑”,意为“熏香”,而这正是这个象形字的本义。
昆,蒙古语“高山”读作“昆”,如“额儿吉涅昆”(即“额儿古纳山”),而这正是“昆”的本义。
玉,蒙古语读作“哈须”,快读即成“玉”。
都,汗廷所在地蒙古语读作“斡儿朵”ordu,本义是可汗的宫帐,这应是“都”字读音的来源。
黑,蒙古语读作“哈拉”kara,快读即成汉字“黑”的读音了。同义字“乌”到可能是汉语方言固有的读音,今天吴越方言黑仍然都读作乌。
自,古突厥语“我”读作“乌自”oz,正是象形字“自”(象形鼻子)的本义,但现代汉语早已舍弃其本义而移作他用了,故推测“自”字由说古代突厥语的人创造出来,也就是说原来表达的是突厥语。人随笔汉字与阿尔泰语渊源关系137
技,古代突厥语“能巧的”读作“乌兹”uz,这可能就是这个汉字的原始读音。
言,古突厥语“歌曲”“说唱”读作“以尔”yir,正是象形字“言”的本义,就是说“言”原先可能读作yir。
野,古突厥语“草原”“土地”读作“以耳”yil,正是汉字“野”的本义。如“牧野之战”,这个野就是指商纣王拥有的草原。
谁,古突厥语“人们”读作“克虽”kisi,正是“谁”的本义,应知这个谁字原先确不是疑问代词,而是指称代词,指称人们,而今天的突厥语仍然用作的指称代词,故推测其为原始读音。
让我们再来看看“国粹”,十二生肖和天干地支的汉字读音,它们确实不见于汉语口语中,但古代阿尔泰语读音恰恰明白无误地指向这个汉字的本义,举例如下:
“申”(猴),这个汉字的本义是猴子,但古突厥语猴子读作“杯申”bicin,与这个“申”的读音近似。
“酉”(鸡),这个汉字的本义是鸡,但古突厥语鸡读作“泰奇区”taqiqu,与这个“酉”的读音近似。
“午”(牛?马?),这个汉字的本义有两种理解,一是牛,二是马,但今天蒙古语牛的确读作“午得”ud,与这个“午”字的读音近似,并且汉字“午”是个象形字,象形牛而非马。
天干地支中的甲,对应的古突厥语读作“甲卜”qap ;乙,读作“乙儿”ir ;丙,读作“匹”pi ;丁,读作“替”ti ;辛,读作“生”sin ;癸,读作“快”kui。所有这些读音能对应起来,这就提示我们,单音节的汉语与多音节的阿尔泰语之间存在诸多内在联系,这其实是一种历史的渊源关系。
如此国粹从何而来?似乎可以做这样的比喻:如果一个钱包有两个失主认领,一个失主能说出钱包中钱的数目,另一个却不能,那么这个钱包应判定给谁,不是很清楚了吗?笔者以为,汉字的本义犹如钱包中钱的数目。
阿尔泰语词汇中有少量单音节的,但绝大多数是多音节的。古代汉语首先是把这些读音全部继承下来,后来慢慢单音节化,以适应单音节汉语的发音习惯,方法很简单,快读即成。有些字原来可能有三个以上音节,但音节有轻重,轻音可以被人为遗失,于是全都演变成了单音节。当然这种读音的演变不会是短时间里完成的,肯定有一个漫长历史过程,笔者推测这
138一过程至少持续了上千年。
二、汉字与阿尔泰语的对应关系
汉字与阿尔泰语之间存在非常广泛的对应关系,这种对应关系,不是用偶然巧合就能解释得了的,这其实是一种渊源关系,问题是应当分别哪一个是源,哪一个又是流。
笔者发现这两种语言之间甚至有双重重合现象,汉语和阿尔泰语都有同音多义现象,但两种语言同音多义也能重合就需要特别关注了。如:
悟:古突厥语读作“吾”o,同样是“想通”的意思;寤,古代突厥语读作吾”uu,同样是“睡觉”的意思。
瘸,古突厥语读作qat,同样是“腿有病”的意思;加,古突厥语读作qat,同样是“加入”的意思。
夹,古突厥语读作qap,同样是“口袋”的意思;夹,古突厥语读作qap,同样是“抓住”的意思。
发,满洲语读作afa,同样是“出去作战”的意思;发,满洲语读作afa,同样是“交付文书”的意思。
齿,古突厥语读作tis,同样是“牙齿”的意思;雌,古突厥语读作tisi,同样是“母”的意思。
哥,古突厥语读作og,同样是“哥哥”的意思;歌,古突厥语读作og,同样是“称颂”的意思。
阳,古突厥语读作yan,同样是“太阳”的意思;样,古突厥语读作yan,同样是“样子”的意思。
域,古突厥语读作il,同样是“国家”的意思;依,古突厥语读作il,同样是附属”的意思(il-khan伊尔汗,从属的汗国)。
这种多义词双重重合现象更不会是一种偶然巧合,更能表明两者之间存在渊源关系,汉字可能起源于古代阿尔泰语,汉字最初表达的可能是多音节的匈奴语!
10世纪的《突厥语大辞典》记载了大量中古时代新疆地区的突厥语词汇,其中也有许多能与汉字读音对应起来。
上述阿尔泰语词汇都是多音节读音,但快读即可成单音节,并近似今天汉字的读音了。阿尔泰语读音,例如蒙古语,与汉字比起来颚音特别重,发音时舌头要卷起并往后缩,这对说惯了汉语的人是很不习惯的,特别是说惯了中国南方方言的人就更不习惯了。
为什么汉字读音与阿尔泰语读音存在如此广泛的对应关系?到底是单人随笔汉字与阿尔泰语渊源关系139““
音节读音变成了多音节读音,还是多音节读音变成了单音节读音呢?当然两者都有可能。但当我们发现华夏文明由北而南扩展,三皇五帝和夏商周秦的创建者是游牧民族背景的时候,合乎逻辑的判断就产生了,汉字读音有过的演变趋势应当是后者而不是前者!
阿尔泰语是一个庞大的语系,里面有许多分支,各分支间许多基本词汇也是不同的,各分支甚至有各自的数字体系,即使是同源词汇,读音也有一些差异,主要是后缀音有所不同。阿尔泰语词汇是一种黏着性词汇,由词根连接一些语法成分组成,后缀的语法成分常常会出现差异,对此中原汉人早已发现并有所记载了,明人《卢龙塞语》举例说:同样是树木的“木”,辽河三卫之人读作“抹敦”,东夷(朝鲜边境)读作“莫多”,北虏(蒙古地区)读作“末都”,但三者词根是完全一致的。
从整体上看,阿尔泰语各分支间的共同性远多于差异性,特别是句法和文化词相当统一,正因为如此,《突厥语大辞典》把南俄草原到大兴安岭以东所有族类都归入“突厥语”之中,书中对突厥语方言有如此解释:“所有突厥语在基本词汇上的差别很小,方言词汇的差别仅表现为几个字母的互相替代或脱落。”这就是一种宏观描述。
其实汉字与阿尔泰语之间不但在名词、动词、代词上存在许多对应关系,甚至在虚词上也有全面的对应关系,我们知道虚词有许多种,令人吃惊的是古代汉语中的所有虚词都能与阿尔泰语虚词对应起来,这已经不能用两种语言之间的互相影响、互相借用来解释了,而是一种明白无误的渊源关系了。
关于汉字起源的描述是一种宏观描述,既然是宏观,也就放弃了细节和局部,把古代阿尔泰语视为一个无差别整体了,就像我们把分支更多的古代百越语视为无差别整体一样,乃是由观察高度决定了的,站得很高的时候能看到全局,但已经看不清局部了,注定要舍弃细节了。
汉字起源的问题是“汉学”的核心问题,当然也是中国文明史的核心问题,这是一个涉及面很大的话题,涉及到华夏文明的方方面面,对此作者将进一步展开讨论。
三、从旦字说起解读汉字起源
汉字是怎样一种文字?如举例简要说明之,则典型莫过于旦字矣!
140汉字“旦”,一个高度象形、高度会意的文字。地平线上,更确切地说是平
坦广阔的草原上,冒出一轮太阳,即画作圆圈的“日”,于是天亮了,已经是第二天了,或曰又一天开始了,这就是旦所表达的意思,象形兼会意,一目了然。
这个汉字,实在无需冥思苦想,无需神灵指引,无需多少学问和智商,人人都能发明之。就是说被儒家说得神秘兮兮的文字缘起其实并无神秘可言,乃是一种很自然的事。为了表达一个自己能懂、别人也能理解的概念,古人自然而然就如此这般在某种物体上刻下了一个可供许多人识别的符号,汉字就这样出现了。
旦字必应是最早出现的汉字之一,因为这个概念在人类生活中最常显现,每天都要重复一次,它就可能最早被发明出来,并被那个部族的人最频繁地使用过。
令人奇怪的是这个“旦”在汉语口语中从不使用,你能找出有哪一种汉语方言把“第二天”说成“旦”的吗?实在找不出来,一个也没有!“旦”只在古代汉语中存在,在汉语书面语言中使用。因此这个旦词不会是汉语方言所固有的,发明这个字的人不太可能是说汉语方言的人。
那么什么语言把第二天说成“旦”呢?笔者在满洲女直语种中找到了答案。满族是一个极其重视祭祖的民族,这也是阿尔泰游牧民族的共同特征,游牧文化具有强烈的血缘属性。满族人每年要举行大祭,一般在三九天举行,最重要的仪式是祭拜“祖宗匣”,一个珍藏着家谱或祖先遗物匣子,里面还有一个名叫“妈妈口袋”的黄色袋子,装着有神秘故事的“子孙绳”,此外就是隆重祭拜“索罗杆”,一根高高竖起的树干,上有一锡斗,内装杂碎猪内脏和五谷,招乌鸦或喜鹊飞来啄食,满洲人把这种隆重大祭叫做“换锁”
。
在隆重繁忙的家祭中,当族人们忙碌一整天做完神糕,煮好猪肉等享神物品之后,他们就静候“乌尔顿”的到来。传说祭祀那一天,当东方破晓之时,满族的一个祖神“乌忻贝勒”(“兀颜”贝勒),就会降临到他们的神堂中来。
“乌尔顿”是满洲女直语“黎明”“天亮”的读音,重音在“顿”,这不正是汉字“旦”的原始读音吗?缩音的方法很简单,快读即成(今天蒙古语“日”“今日”读作“殴德陆”odor,读音与女直语稍有差异)。
由此可见,“旦”原本表达的是多音节的阿尔泰语,应是由古代女直先民,即“匈奴”发明创造出来,只是到后来才被说单音节语言的汉民族先民继承过来,并逐渐单音节化,先是存在于古代汉语“雅言”中,后来才扩大到汉语口语中去。由于汉字原本用于占卜祭祀,笼罩着神秘的光环,且是官方语言,即社会主流语言,拥有强大的吸引力,雅言词汇很容易进入汉语言中去。人随笔汉字与阿尔泰语渊源关系141(汉字拟音)
“旦”在阿尔泰语中原本是一个完整的词汇,在古代汉语中也是一个完整的、可单独使用,慢慢成为了单音节汉语的一个词素,词素能够组成词,如“元旦”“一旦”,但已经不能单独使用了。
这种由完整词汇演变成词素的过程在汉字发展史上如此广泛普遍地存在,几乎大多数汉字都经历了这样一种脱胎换骨的演变,以至于人们已经难以想象汉字原本表达的是多音节的阿尔泰语。而那个女直语“换锁”不正是汉字“祀”的原始读音吗?这个祀字也不能单独使用,那么旦字不是由操满洲女直语的人发明又会是谁呢?
为了更清楚地说明汉字的起源和演变,试着继续举例:
1.卉,“花草”如用满洲语读,读作“噢尔会”orho,很容易就找到了对应的汉字“卉”,但这是雅言,汉语口语不用,如果你指着公园里的花草说那是“卉”,人家不把你当作神经病才怪呢!就是说那些习惯用“卉”指称花草的人说古代女直语,不可能是汉民族先民,或者说发明这个“卉”字的人是操多音节语言的匈奴。
2.卿,卿是古代汉语中常用的人称代词,类似于现代汉语中的“您”,但不见汉语口语中有用“卿”来称呼人的。只有今天的蒙古语中“卿”仍然是最常用的指代词,如“哈布格钦”,“哈布格”意思是狩猎,“钦”是人的意思,也是你的意思,不是尊称,随便用,意思就是狩猎之人。我们发现古代汉语中的卿开始也是普通人称代词,并非尊称,只是到后来变成了尊称。因此这个汉字原本表达的应该是蒙古语。
3.册,《尚书》记载夏代即“有典有册”,就是说夏人已经使用文字并有成文法典了,可惜没有成文典籍传世。“册”是个高度象形的汉字,写有文字的木片或竹片用丝线连缀成“册”,所记载的当不是一般的东西,而是威严神圣的帝王律令。蒙古语把可汗发布的律令叫做“札撤”。从13世纪成吉思汗蒙古人开始使用古代回鹘文记载可汗“札撤”的情况看,最迫切需要文字的确是政府。
现代汉语中的册字已经没有法典的含义了,只有蒙古语的“札撤”能与册字的本义匹配,故推定“札撤”是册的原始读音,夏代的奴隶主们应是说古代蒙古语的。
4.戮,这个会意字由杀人的“戈”与两个肢体分离的人形组成,意思就是杀人,但不见于汉语口语,而古突厥语杀人读作“欧路尔”olur,能与这个读音对应起来,故推测其为原始读音。
5.霾(mai),完全是“雅言”,意思是浑浊的雾气,例如《诗经・终风》:“终
”但古突厥语浓重的雨雾读作“图埋”tuman,且是口语用词,两者142风且霾。
读音能对应起来,故推定是古代突厥人发明了这个汉字。
6.鬻(yu),古代汉语中的鬻是买卖的意思,但从不见汉语口语有此词汇,但古突厥语“买卖”倒是读作“语路尔”yulur,能与这个冷僻汉字对应起来,故推定其原来表达的是古代突厥语。
7.实,这个汉字原来指果实,如《韩非子・五蠹》:“草木之实足食也。”这个“实”也指祭祀中的素果供品,但现代汉语中果实的意思已经淡出,变成了“内容”的意思了,而古突厥语果实读作“图实”tus,可能是这个汉字的原始读音。
8.唁,属于“雅言”,意思是吊唁,不是汉语口语用词,但古突厥语吊唁读作“唁尔”yor,丧礼的意思,可能是这个汉字的原始读音。
9.浴,会意字,甲骨文中就出现了,是“洗”的意思,如《楚辞・渔父》:“新浴者必振衣。”《夏小正》:“十月黑乌浴。”但这个汉字不单独出现在汉语口语中,而古突厥语“洗”读作“浴”yu,推测其来自古代突厥语。
古代汉语中的雅言词汇有这样一个特点,越古奥的字,就越是对应着阿尔泰语口语中的常用词汇。例如这个“歼”字,本是杀死敌人的意思,但汉语口语不用“歼”来指称这个“杀死”。此外还有“殆”,也是杀死敌人的意思,如果人们在口语中用了这个词,听的人就莫名其妙了,因为它通常只出现在书面语言中。但“歼”和“殆”却是今天蒙古语口语最常用的词汇,并且蒙古人常常用之取名,许多蒙古人名叫“阿去”,意思是消灭敌人,不正是“歼”的原始读音吗?还有许多蒙古人名叫“达尔”,意思也是杀死敌人,不正是“殆”的原始读音吗?草原民族就这样用自己的名字顽强地传承着古老的游牧文化!
人类文明起源以文字的出现为标识,故本文中文明起源与汉字起源是相提并论同义互通的,当古人在龟甲或兽骨上刻下这个“旦”字的时候,华夏文明就起源了,但你万万不可把这个场景想象成温馨悦目、诗情画意的场景,其实当时既无“圣”,亦无“德”,实乃一个血腥弥漫之时代,因为其时人刚刚从动物界分离出来,所有的人还保持着浓重的兽性,那种原始兽性尚未被后来才慢慢出现的人性所覆盖,注定了这将是一个残酷无比的奴隶制时代。换言之,从这个“旦”字漾起的乃是一片令人心悸的血色曙光!
四、汉语音韵学的困境
所谓文明,就是那种能把人类与动物区别开来的东西,文明起源以什么为标识呢?文字的出现就是标识。我们可以这样理解“文明”:“文”就是文人随笔汉字与阿尔泰语渊源关系143
字,“明”就是出现,文字诞生标志着文明开始形成。
当然可以作为文明起源的标志物还有很多,如火的使用、工具的使用、陶器的出现、金属工具的使用等等,此处还可以通过一些社会现象去指认文明的起源,如社会分工的出现、贵贱等级的分化、国家的产生等等,但都不足以成为描述华夏文明起源的对象,或者说不足以成为华夏文明的象征。
为什么这样说呢?因为那些东西只能模模糊糊地把人与动物区别开来,能使用工具并不是人所特有的,动物界也存在使用工具的现象,至于火本质上也是一种工具。还有分工等级之类的社会现象,猴子、猩猩、狼都是社会性动物,其内部也是等级森严,既然有等级自然就产生了初步的分工,因此分工等级也不是人类社会所特有的现象,这些都不足以成为描述华夏文明起源的对象。
只有文字的出现才是文明起源的标识,只有文字才是人类所特有的东西,文字把人从动物界彻底区别开来;任何动物都没有文字,故描述文字的起源可以成为描述文明起源的代名词。
在描述华夏文明起源时,描述汉字的起源更具有特殊重要的意义,因为汉字的起源显示出华夏文明起源的特殊性,故华夏文明起源与汉字起源在本书中是同义互通的,换言之,本书把描述汉字起源作为描述华夏文明起源的核心内容,两者互相印证,互为表里,并以此作为本书的题目。
研究汉字字形的变化当然很重要,但笔者又以为描述出读音变化更有意义,因为汉字属于语言的范畴,文字所表达的最终仍是人类的有声语言,文字只是语言的从属物,语言的第一要素是“音”而不是“形”。
但是直到晚清才有学者开始关注起汉字读音的演变来,他们研究古代韵书,发现了一些规律性的东西。如“古无轻唇音”“古无舌上音”“古无去声”等等,在汉字读音溯源的道路上迈出了第一步。
不过在汉字读音演变研究中,真正有开拓性贡献的学者不是中国人,而是瑞典汉学家高本汉。高本汉确有语言学天赋,他十五岁时便写出了《瑞典南部方言同中部方言的分界线》论文。1910年他来到中国,专门研究汉字读音的演变规律,并为中国学界带来了西方的语言学理论和科学工具,即国际音标。
高本汉的研究极具创造性。他收集所有中国古代韵书,如宋代《广韵》等等,梳理里面的反切注音,最终编排出了汉字的音类体系,即声母和韵母体系,并用国际音标注音。他拟构出了汉字在中古时代的读音,发现了汉字读音从中古到现代的变化规律,这一研究成果就是他于1926年写成的《中
一书。144国音韵学研究》
此后高本汉决定向先秦古汉语攀登,他研究了《诗经》的韵脚、《说文》的谐音字等等,并以此拟构出“上古汉语”读音体系,这一研究成果就是《汉文典》一书。
高本汉发现汉字读音有一个从多到少的过程,越是远古,汉字的读音越宽泛,实际上有许多读音,他在《从上古汉语到中古汉语》一文中这样写道:
汉语的语音从古到今一直沿着简化的道路发展,尽管汉语原是一种单音节语言,但语音却非常丰富,有许多不同的音节(指“谐声”读音),后来经过剧烈的变化,早期区分得很清楚的音位合并了,语音变得非常贫乏,以致在现代北京话中只剩下420个不同的音节,而且这个数字也是把声调计算在内……我们发现中古汉语被大大简化了,许多声母合并了,中古12个声母只留下3个,韵母的演变也十分惊人,原来数量众多的韵母被大大地合并,精简掉了。高本汉指出,汉字曾有过许多读音,这些读音大体相同但有一些细微差异,这种差异被中国古代韵书记录下来了,差异可能出现在声母中,也可能出现在韵母中。但后来差异越变越少,众多读音好像被合并起来了。他以为古代汉字声母多达四十个,韵母多达二百九十个。
高本汉的研究意义十分巨大,他为中国引进了全新的汉字读音研究科学方法,开启了汉字读音研究的新时代,正当汉字字形研究,这门古老的
山穷水尽的时候,一个欧洲人从字音的方向上开辟出一片汉字研究的新天地。高本汉的研究极大地调动起中国学界的热情,特别是他“古音拟构”,探寻汉字源头的设想,激动着无数中国学人的心。
高本汉回国后,中国的语言学家们按照他的思路继续向前走了一程,但一程之后便再也迈不开前进的步伐了。今天离高本汉之时已过去了八十年,他提出的“古音拟构”的目标,渺茫得好像已经消失了,这又是为什么呢?
高本汉是从“反切”入手研究汉字上古音,就已经把研究对象严格地限制在了单音节范畴中,高本汉其实已经认定上古汉字是单音节读音,只是读音很不稳定,处于变化不停之中,他从来没有推测过汉字可能原本是多音节读音,更不可能把古汉字同古代阿尔泰语联系起来考察,他虽然发现了汉字读音演化的一些轨迹,但不可能发现汉字的真正源头。
中国一代代语言学家们和高本汉一样,在汉字的长河中努力探寻过,他们确可以在这条长河的中下游惬意地畅游,但一旦进入源头峡谷便显得力不从心了,他们既然止步于水诡流急的上游入口,当然见不到源头河谷人随笔汉字与阿尔泰语渊源关系145“汉学”
的奇异风光。那么到底是什么原因造成这种状态呢?原因就是他们的手脚被传统的文明起源观制约了。不要指望传统的文明起源观里会发生汉语音韵学的突破——就像在“天圆地方”传统宇宙观念中不可能产生牛顿力学一样,汉语音韵学的突破必然以旧的文明起源观被突破为前提!
高本汉树立起了古音拟构的宏伟目标,但他指明的路径从大方向上看一开始就是往死胡同里前进,中国音韵学家最后发现此路不通,乃是一种必然。
五、汉字单音节化的原因
高本汉发现先秦时代的“上古音”与隋唐时代的“中古音”相比已经有了许多变化,就是说汉字的读音竟然一直在演变之中。为描述这种现象,高本汉拟构出复辅音,他为汉字揣测出一系列的复辅音,就是复合声母,如kl-、gl-、mr-等等,有十九个之多。
笔者以为,历史上汉字读音宽泛,其实是一种读音游移不定的现象。复辅音的存在说明汉字读音曾经比较宽泛,即读音曾在两个声母间游移不定。
读音为什么会游移不定呢?音韵学家们一般用方言干扰来解释,所谓“吴音”“汉音”“中原音”“洛阳音”者是也。
但我们知道,华夏文明从肇始时期起,文明中心就没有改变过。“中国”总是在渭河流域的黄土高原上,汉字也首先出现在那里,成熟在那里,那里的“方言”会不断变动吗?显然不会。
如果用汉字的单音节化现象去解释就能说得通,读音游移不定的现象是单音节化过程中必然会出现的阶段,因为单音节化是一种约定俗成的过程,多音节的阿尔泰语词汇可以单音节成许多近似的读音,众多的读音在使用过程中约定俗成地、不知不觉地减少,最后趋于统一,那是由文字的社会功能使然,高本汉描述出来的复声母现象反过来证明汉字有过单音节化过程的推测可以成立。
一个民族的固有语言具有相当的稳定性,因为已经有过千万年的传承固化,民族语言的背景可能是整个人类的历史,文明史与之相比短暂得多了。民族语言在短短的数千年间应不会出现剧烈的变化,就是说如果汉字一开始表达的就是汉民族固有的单音节语言,就不可能出现数千年间读音剧烈变化的情形。
汉字读音之所以会变化不停,就是因为汉字一开始表达的并不是汉
它原本表达的是与这种单音节语言截然不146民族固有的单音节语言的缘故,
同,与这种单音节语言没有任何亲缘关系的古代阿尔泰语。
语言之间的根本区别是什么?根本区别不是词汇,词汇只是语言表层的东西,语言之间的根本区别是发音基础。多音节语言与单音节语言发音基础截然不同,那才是两种语言不可混淆、无法替换的东西。
因为词汇处在语言的表层,可以被轻松地替换掉,外来词汇可以大量地移植到另一种语言中去,甚至可能逐步取代那种语言的基本词汇,但发音基础无法移植,因为它处在语言的底层,它牢固地存在,犹如磐石般难以撬动。
汉字原本是匈奴创造出来,原本表达的是多音节的古代阿尔泰语,但最后竟变成了单音节读音,看似不可思议,却是规律使然,其实无可抗拒。
多音节读音向单音节汉语演变的趋势,从根本上说来是由双方人口数量决定的。在中国范围内占人口大多数的是汉民族先民,他们说单音节语言,他们虽然不是统治阶级,但人口数量上占有极大优势,汉字只有单音节化后才能根植到他们的语言中去,它别无选择。
虽然历史上北方游牧民族凭着他们的战争优势,总能以少胜多,进而成为中原农耕民族的统治者,但南方农耕人口数量远远超北方游牧人口的情况早就存在,远古时代就已经如此了。这是因为农耕有更高的土地利用率,能养活更多人口,而游牧民族以征战掳掠为生,人口在长期的杀伐中不可能很快增长,反而常常有大量的消失,他们在人口数量上从来是少数,永远是少数,他们有无法改变的“少数民族”身份。
他们成为奴隶主后养尊处优,不可避免地减少了流动性,不可避免地汉化了,于是失去一些战斗力,最后被更加原生态的游牧民族取而代之,到时一部分人必然降格成为平民甚至被统治者,慢慢消融进农耕汉民族中。沉降下来的那部分人会把他们使用过的文字带进汉民族中,最后他们连同带去的文字一起被彻底汉化,文字的读音由多音节变成了单音节,这就是汉字曾经有过的演变过程!
多音节的古代匈奴语虽然曾是那个奴隶制社会的强势语言,但终究不能取代被统治者的语言,强势语言也无法撬动有如此大基数人口的发音基础,强势语言并不具备杠杆效应,汉民族先民语言的发音基础如此深厚,无法替换,一言以蔽之,汉字单音节化乃是由人口的占比优势决定了的。
游牧文化特别强调尊卑等级,带来一种强烈的种族隔离作用,可以想见,高贵的奴隶主们不会让卑贱的耕奴们使用他们的语言;在那个社会中,奴隶也没有任何机会上升到统治阶级中去,就是说汉民族先民语言的“阿尔泰化”之所以不曾有过,乃是由游牧文化的特质注定了的,而奴隶主们不人随笔汉字与阿尔泰语渊源关系147
可阻挡地从高处沉降则是不可抗拒的自然规律决定了的。
如果你对汉字读音有过的演变仍然不能理解,如果你对“禹”的原始读音竟是“药逻”仍然心存疑虑的话,那么就让笔者再举一个时代较近,方便考证的例子来说明吧。
佛教由印度人发明并经中亚传到中国,汉民族接触佛教最早可以追溯到汉武帝时代。《史记》记载,汉武元狩年,大将霍去病出征西域,击败匈奴休屠王,“获其金人,帝(武帝)以为大神,列于甘泉宫”。《魏书・释老志》对此解释说:“金人”就是“菩萨”,汉武帝的行为便是中国“佛道流通之渐也”。在此之前,中原汉人只知有神仙,从未接触过菩萨,汉武帝也是把他当作一神仙放置于甘泉宫中。佛教真正传入中国是一百多年之后的东汉时期,汉人终于知道那个“金人”名叫“浮屠”,印度梵语的本义是“觉悟者”。
此“浮屠”后来又写作“佛陀”,原本是汉字注音,故有多种写法,梵语是多音节语言,故其读音也是多音节的。但多音节的“佛陀”来到汉语环境中后,很快便被单音节化了,最后变成一个音节“佛”。
因为汉语只允许定谓语性质的、可分割开来的多音节词组存在,如“大佛”“金佛”之类,不能容忍不可分割的多音节词汇存在,如“浮屠”,有两个音节,且不可分割,分割之后全都失去意义,这种词汇存在对汉语来说实在是太难受了。汉语仿佛存在一种非把它改造过来不可的“语言意志”,即使你是血缘高贵的“台吉”,也必须意译成可分割的“太子”才能在汉语中获得生存权。正是这种不可抗拒的语言意志促使“佛陀”读音简化,就是说对于这种“语言意志”法力无边的佛陀也无可奈何,只能“服”了,也正是这种语言意志促使原本是多音节读音的汉字全都演变成了单音节!
六、古音拟构的人类学思考
从宏观上描述,迄今为止的人类历史可分为两个阶段,或者说人类已经历过了两个时期,一曰“分”,二曰“合”。
人类在“分”化中产生,在分化中繁衍扩散开来。原始人类从非洲慢慢扩散至世界各地,在扩散中他们改变成了不同的肤色,产生出不同的语言,选择了不同的生存方式。在分化过程中逐渐出现各种民族的源头,人类在分化中崛起于蓝色地球上,其行为方式也与野兽世界渐行渐远。
人类文明则是在“合”的过程中起源的。人类分化到一定时候,不同的族
我们这个星球没有给人类148类最终会在这个不能无限扩大的大陆某处相遇,
提供无限大的生存空间,人类必然在扩散后走向汇合,不管是东方还是西方,人类文明全都在不同民族的融合中萌发出来。不同族类的征服和融合,不同文化的碰撞和吸收,乃是人类文明起源的不二途径,世界上没有一个文明是从单一民族,单一文化中产生出来的。
但东方文明确不像儒家所描述的那样在脉脉温情中产生,而是在血泪中潜行,当亚洲东部两支有着不同生存方式,操两种完全不同语言,一开始无法用语言交流的人类分支相遇的时候,他们把对方看成野兽,并不会意识到对方与自己是一样的人,当然不会施以人道,因为其时人类还不具备现代人才具有的那种人性。
考古显示人类很可能曾在长时间里把另一类族群当作猎取的对象,用作食物来源。当我们看到自然界中大猩猩以其他灵长类动物为主要肉食来源的时候,就会觉得如此推测的可能性是存在的。当远古人类发现猎获的另一种人比牛马有更好的使用价值时,才不会当作食物吃掉。就是说早期人类必定有过一段兽性大过人性的时期,有过一段兽性慢慢褪去,人性慢慢显现的时期。
考古显示,华夏文明从一种非常典型的奴隶制中起源。笔者以为,这种典型的奴隶制出现的历史条件就是当时人性尚处于蒙昧时期,奴隶主们并不觉得杀戮奴隶用以殉葬与杀戮牛羊“以为死人粮”有什么不同,不觉得使用牛马与使用奴隶有所区别,这种人性发育的低水平才是那种严酷奴隶社会存在的基础条件,而不是什么“生产力水平”,或者“经济基础”之类的东西,那种生产力水平低下会导致奴隶制的说法实在难以找到经验基础。一定是人的观念,或者说人的价值取向导致了这种社会形态的出现。
笔者进一步推测,远古东方两大民族先民在人种特征上也会比如今有更大的差别,可以肯定两大民族先民在外貌体征上的差异会在民族融合过程中变得越来越小。总之,远古时代是不可能产生圣人的时代,孔儒们杜撰出来的所有远古圣贤都是假的;而民族融合之缓慢,奴隶社会之漫长则会远远超出人们原有的想象!
关于华夏文明起源,儒家编造出来的第一个圣人是所谓的“燧人氏”,儒家认为“火为百德先”,天下文明肇始于圣人之火德,例如《太平御览》就如此说:
遂明国有大树,名遂,屈盘万顷,后世有圣人游明之外,至于其国,见此树下,有鸟啄树,粲然火出,圣人感焉,因用小枝钻火,号燧人氏。人随笔汉字与阿尔泰语渊源关系149
又曰:
上古之世,民食果蔬蚌蛤,腥臊恶臭,而伤腹胃,民多病,有圣人作钻燧取火,以化腥臊,而民悦之,使王天下,号之曰燧人氏。
儒家认为人类一开始便进入了一个“以德王天下”的高尚时代,远古时代是非有美德不能称王,先王“燧人氏”之所以有天下,乃是因为有大德于先民。
且不说“有鸟啄树,粲然火出”何等荒谬,“小枝钻火”也缺乏经验基础,笔者以为“人类文明始于用火”就是一个非常错误的观念。
人类使用火与陶器的历史已经十分久远了。火与陶乃是人类的标识而不是文明的标识,其所对应的是人类的历史而不是相对短暂的文明史。
人类的生理结构表明人只能吃比较精细的食物,且是以吃烧煮过的食物为主的一种动物。只有烧煮过的食物才适合人类的肠胃,长期吃烧煮过的食物,人类才出现了其他动物所没有的发达的大脑,人类的进化和出现都与吃烧煮食物有关。就是说火与陶在人类的进化过程中起过重要作用,人类使用火与陶历史之久远会远远超出人们原来的想象。这些都不可能是圣人教导的结果,就像汉民族先民的农耕不可能是“神农”教导的结果一样,数万年以前他们已经选择以农耕为生了。
笔者以为,历史研究者在描述华夏文明起源史的时候,一定不能离开这样一个已经被考古挖掘反复证明了的历史前提,那就是先秦时代是一个等级森严的奴隶社会,一个人道尚未萌现的时代。在那个社会里,低贱的奴隶可以像猪牛狗马一样成百上千地用于殉葬。在这个血腥弥漫的时代里不可能产生出大德之圣,就像千年沙海中不可能长出牡丹花一样,如果有,那一定是人为插上去的假货。历史研究者如果本着儒家观念一味赞美陶醉其间,蒙羞的乃是人类理性。
孔儒学说描述出来的先王时代虽然美妙但与历史真实无关,而本于孔学,源自儒术的名言“得人心者得天下”,也不应当继续成为我们描述中国历史的出发点和目的地。中华文明史其实就是一部北方游牧民族不断南侵征服农耕民族,建立起大大小小奴隶制国家的历史。征服者实在无需“人心”,要人心何用?而成为奴隶也不会是汉民族先民心之所向的事!
笔者以为,当两支人类初遇,互认对方为“野兽”的一个重要原因,就是他们说完全不同的语言,语言障碍会导致无法交流沟通而视同野兽,只有随着接触交往的增多,人性才会被慢慢唤醒并萌发,最终他们会意识到对
“人”,但那是一个十分漫长的历史过程。150方与自己是一样的
当我们思考设想华夏文明起源时期为何呈现出来的是一种典型的奴隶制的时候,最合理的解释是,奴隶和奴隶主是说两种完全不同的语言的人。
人是社会性动物的事实排除了人在同类同族中无休止残酷施暴的可能性,这一点甚至可以从动物界中得到印证,有共同语言的同类间应不会出现如此典型的奴隶制。满州女直固有的“同类不相为奴”的习俗也引导我们做这样的推测:先秦时代那种典型的奴隶制应有一种语言基础,那就是统治者与被统治者说两种完全不同的语言。
无法用语言交流的情况下,人是可能把对方视为兽类的,这甚至可以在近代找到佐证。如16世纪初,当欧洲白人侵入美洲的时候,他们确没有把见到的印弟安土著当人看待,对土著屠杀施虐的情形是随着交流接触的增多而减少的,应知其时欧洲已沐浴现代文明的霞光,且那些殖民者都是基督徒,其时仍会发生灭绝人性的行为,那么在遥远的古代,在人类刚刚从动物界分离不久的时候,奴隶主表现得全无人性就不足为奇了,其实是一种必然。
如果推定奴隶主和奴隶是说两种完全不同语言的人,那么远古时代亚洲东部可能存在哪两种完全不同的语言呢?显然只能是多音节的古代阿尔泰语和单音节的百越先民语言,前者是北方的游牧民族使用的语言,后者是南方农耕定居民族的固有语言。中国历史上游牧民族奴役农耕民族的情况不断出现,反之则难以找见。历史经验告诉我们,那些奴隶主的人选非阿尔泰游牧民族莫属,他们虽然被称为“匈奴”,从字面上看他们好像应当为奴”,其实从未被农耕汉民族奴役过。
既然汉字产生在这样一种典型的奴隶制社会中,那么汉字古音拟构的方向就明白了,只能是多音节的阿尔泰语——这便是笔者从人类学角度思考得出的结论。
人类文明进程,从本质上来说,就是人如何看待同类的观念不断演变的过程。人性最终覆盖了兽性。
现代文明的发展趋势就是在世界范围内,人开始把各种肤色、各种语言的人,都看成与自己一样的人,都有存在的价值。可以肯定,在遥远的将来,世界上所有的人最终将被相互接纳。
七、可疑的古代汉语
上古汉语中的对话简奥得令人生疑:如《诗经・郑风》:人随笔汉字与阿尔泰语渊源关系151“
溱与洧方涣涣兮,士与女方秉蕳兮,女曰:“观乎!”士曰:“既且。”
上面的男女对话只有两个音节:“观乎”—“既且”,而且只有“观”和“且”有实际含义。古人真的如此说话吗?他们为什么如此这般惜“音”如金吗?不过意思倒是大体可以理解,因为这个“且”是“祖”的原始写法,并且是个高度象形的字,象形一个男根。
又如《尙书・舜典》:
帝曰:“俞,咨!垂,汝,共工。”帝曰:“俞,往哉!汝谐。”
佥曰:“垂哉!”佥曰:“盖哉!”帝曰:“来,禹!汝亦昌言。”
禹拜曰:“都!帝,予何言?余思日孜孜。”皋陶曰:“吁,如何?”
这是谁在说话?为什么好像是哑巴的手语?!哑巴因为发声器官残疾,只会发出几个依依哑哑的声音,如果不附之以手势,就无法表情达意,古人难道都哑巴了?
非也!如果上文中每一个字都有两三个音节,语言就流畅起来,变成正常人在那里说话了。因为古人肯定不是哑巴,也可以推定上古汉字原本是多音节读音。
让我们再来看一段帝王文告。《尚书・大诰》:
王曰:“若昔朕其逝,朕言艰日思。若考作室,既底法,厥子乃弗肯堂,矧肯构?厥父菑,厥子乃弗肯播,矧肯获?厥考翼其肯曰:予有后弗弃基?肆予曷敢不越卬敉宁王大命?若兄考,乃有友伐厥子,民养其劝弗救?”
这是什么人的语言?怎会如此不堪卒读?汉民族先民曾如此这般说话吗?非也!这不可能是汉民族先民在说话,必定是当时汉字不是今天这般读音。
应知民族语言的历史所对应的是人类的历史,民族的固有语言就像一个民族的外貌特征一样是相当稳定的,语言的高度稳定性来自其无比久远的历史积淀。上面的话语如果真是汉民族先民在说话,我们不可能如此完全听不懂。
唐代韩愈有言:“(尚书中的)周浩殷盘,诘屈熬牙。”读那些古文,你的嘴巴一下子就僵硬了,难受极了。上古汉语即所谓的“雅言”为何如此艰涩难读?
152笔者以为上古汉语之所以如此“诘屈熬牙”,就是因为它原本表达的是
多音节的阿尔泰语,不是今天的单音节读音。我们看到上面的文字中几乎没有表示语法关系的虚词,其人称代词(朕、于、若)也与汉民族口语不相符。
阿尔泰语的特点是每个词汇有一个词根,词根附加一些语法成分后就能扩展成一个有特定含义,并特定语法作用的派生词,在阿尔泰语中表示语法意义的附加成分总是后缀于词根后面,就是黏着于词根后面,上面这些汉字其实是古代阿尔泰语的词根词,当操阿尔泰语的古人读上文的时候,就会根据阿尔泰语的习惯,把那些表示语法关系的后缀音以及表示语法意义的虚词,自然地、自动地附加上去,就像我们看到“CCTV”字样,在庄重的场合就会自然地读成“中国中央电视台”,或者“Chinese Central Television”,就是说上面《尚书》中的帝王律令一旦用阿尔泰语诵读时,就不再是诘屈熬牙了!
原始分布的两大语言一旦开始接触,将会怎样互相影响?笔者以为,当两种语言并存的时候,由于社会地位的不同,强势语言会对弱势语言形成吸引态势。这可以从下面一则元代“圣旨”中看出来:
延祐三年九月初七日苫思丁奏:冯少监如今教做太监,蓄同知做少监,阿的迷失,张少监他每都是先勾当来的人有4,如今递升的新人来的,要他旧勾当
的之上画字有4,我他每根底依例说4呵,他每不听有4,公道奏呵,奉圣旨,那般体
例那里有4?随朝衙门有先来后到,教递升的冯僧儿,阿的迷失之下画字者,萧
少监,张少监之下画字者,幺道,圣旨有4来。(按:重点号为引者所加)
我们知道元代的官方语言是蒙古语,蒙古语是社会的主流语言,处于强势地位,汉语处于弱势地位,由于受到蒙古语吸引,行文就会向其看齐,不由自主地向主流语言靠拢,于是弱势语言出现扭曲。上面的圣旨读起来不伦不类,就是这种扭曲的结果。从这份圣旨中我们可以看到阿尔泰语有别于汉语的语法特征:主—宾—谓结构,都是倒装句,谓语动词都在句子的末尾。圣旨里的谓语“有”都在宾语之后。汉语则是主—谓—宾结构,动词绝不会出现在最后,两者区别明显。由于元朝存续时间不长,汉语扭曲以适应强势语言的现象随着元朝的消失而消失了。
今天阿尔泰语有三大系,即蒙古语,突厥语和满洲语,他们在语法结构,即语序上完全相同,就是主—宾—谓结构,举例说明之:
维吾尔语 Tursun mu`allim-ni yoqla –p lal-di
吐尔逊 老师 看望(状态成分后缀于谓语动词之人随笔汉字与阿尔泰语渊源关系153
后)( 译文:吐尔逊看望老师了。)
蒙古语 tere tex ber –j gar-j
他 斧头 抓(状态助词后缀于动词之后)(译文:他拿起斧头出去。)
锡伯(鲜卑) bo nimxa dgave –m gene-m
我们 鱼 抓捕(状态助词后缀)(译文:我们捕鱼去。)蒙古语 bi ene mori –yi unun -ba
我 这 马 骑 去(状态成分后缀)( 译文:我骑这马吧。)
满洲语 bi mandzu xargen ara-me
我 满洲 字 写 (译文:我写满文。)
回鹘语 Tursun kitab –ni oqu-di
吐尔逊 书(有后缀)读了(有后缀)( 译文:吐尔逊读了那本书。)
从上可知,三大阿尔泰语语法特征高度一致,他们说话全都是倒装句,这种一致性显示出三者可能有共同的起源。
但我们看到,古代汉语也是这种倒置语序,古人说话也习惯把谓语放在宾语之后,例如:
殷墟卜辞:“不我杀。”(不要杀死我。)
《尚书・多士》:“无我怨。”(不要怨恨我。)
《左传・襄公》:“惟余马首是瞻。”(看我的马首。)
《孟子・梁惠王》:“他人有心,余忖度之,夫子谓也。”(即“谓夫子”,正如先生所说。)
《左传・隐公》:“我周之东迁,晋郑焉依。”(“晋郑焉依”即依靠晋国,依靠郑国。)
《孟子・离娄下》:“谏行言听。”(行谏言,听劝告。)
成语“何罪之有”就是一种古代阿尔泰语的残留,谓语“有”出现在句子末尾,这是阿尔泰语的特有表达方式,举例阿尔泰语短语如下:
menin luvitim bar(译文:我有字典)
我的 字典 有
Unibn qalimi yoq(译文:他没有铅笔)
他的 铅笔 没有
154阿尔泰语的又一特征,判断词“是”总处在句子最后:
我们是工人)
我们 工人 是(复数后缀)
Bu Menin ukam bolidu(译文:这是我的弟弟)
这 我的 弟弟 是
我们看到古代汉语通常也是这种语序:
《左传・隐公》:“制,巌邑也4。”(“制”是险要的地方。)
《史记・项羽》:“项籍者,下相人也4。”(项籍是下相人。)
《左传・隐公》:“都城过百雉,国之害也4。”(都城太大是国的隐患。)
古代汉语中常见这种不符合汉语习惯语序的现象,以先秦早期为多见,汉代以后便迅速减少并消失,这与汉民族的形成过程吻合,或者说正是这种历史过程,在汉语言文字中留下了难以磨灭的痕迹。
为了更加形象地描述华夏文明起源过程中曾经有过的特殊语言现象,需要提供一个参照系、一个标本,以便比照说明。
上海开埠的时候,黄浦江上曾有一支流,它从外滩起曲折西行,连通苏州河,这条河原本没有名,河两岸原是一片低矮黝黑的小屋,河边杂草丛生。但随着上海的开埠,这条河两岸迅速繁华起来,外国轮船驶进黄浦江到达十六铺一带停泊,外国水手们会迫不及待地沿着小河涌上岸去,因为那里有人在招揽生意,能为他们提供各种各样的服务。由于此地洋人特别多,这条河便有了“洋泾浜”的称呼,河浜里还产生出一种“洋泾浜英语”。
众多与洋人打交道的码头苦力是洋泾浜英语的发明者,由于他们长期跟随在洋人后面找活干,主要是搬运笨重的货物,如水泥,他们渐渐地熟悉了洋人的一些口语。例如英语水泥发音“水门汀”。每当轮船来到,他们便迎上去问:有水门汀装卸否?当活儿干完,他们会说向洋人说“拉斯克”(Last)。英语yes 被他们说成“来三”,“不来三”就是“不行”。
洋人的中国仆人也会说几个英语了,一天洋人回家发现玻璃打碎了,大吃一惊,仆人赶忙回复说:“in side吱吱吱,out side喵喵喵,glass 克郎当!”洋人听懂了,原来是猫抓老鼠闯了祸!
这样一些不伦不类的英语被称为洋泾浜英语,那是近代上海华洋杂处出现的奇特语言现象,许多此类语言至今留存在上海话中。
古代汉语就是两种截然不同的语言——多音节的阿尔泰语和单音节的汉语——交融演化的产物,由于开始的时候阿尔泰语则是强势语言,地位犹如上海开埠时的英语,土著民族的固有语言也就慢慢被强势语言扭曲了,甚至变得不伦不类了。人随笔汉字与阿尔泰语渊源关系
155
我们确应当思考这样一个问题:古代汉语,即所谓的“雅言”与汉民族的口头语言之间为何存在如此巨大的差异?应知这种特殊的语言现象在世界历史上也是绝无仅有的!从来没有人对这种特殊现象的产生原因做过研究说明,从来没有人给出过一种合理的解释。儒家则认为那就是雅言,因为记录着圣人们的话语,无比高雅,无比美妙,无比圣洁,应当万世不易,他们就这样虽然承认佶屈聱牙,但又津津乐道地吟诵了数千年,反对任何有关语言改革的企图。
古代汉语是汉民族形成过程中,那种特殊历史的积淀物,乃是华夏文明起源特殊历史状态的一种缩影,为了更加形象地描述古代汉语的成因,似可以作这样表述:古代汉语就是古人说的“洋泾浜英语”!
八、关于汉字与现代汉语的思考
过去也有一些学者关注过汉语与阿尔泰语历史上的互相影响,但他们的着眼点是汉语如何影响到了阿尔泰语;至于汉字起源,出于传统的文明起源观,他们不可能也不愿意把汉字读音向阿尔泰语读音溯源,从来没有人愿意迈出这一步。
汉字溯源难以突破的原因还有研究材料的制约。历史上阿尔泰游牧民族少有自己的文字传世;儒家又鄙视戎狄之语,很少去记录古代阿尔泰语,因此可供研究比对的语言材料少之又少,导致研究难以深入。汉字溯源研究的进展和突破,从根本上说,有赖于现代语言学的出现和成熟,在中国古代,在未有世界性语言系属宏观研究的过去,在未有记录语音的科学手段的时候,汉字的溯源研究其实是根本无法进行的,环境条件不具备就无法开展,就是说溯源研究其实直到今天才具备了相当的条件。
汉字必定有过漫长的“汉化”历史,可能曾历时数千年之久,汉字的汉化虽然早已完成,但留下了一些痕迹,指认这些痕迹也有助于我们理解这一过程。
这种痕迹首先在古代辞书中存在,例如:
扶摇,《尔雅・释天》云:“扶摇谓之猋(飙)。”这其实在说“飙”字原来有两个音节,读作“扶摇”,扶摇和飙同时存在,则是汉化还没有彻底完成就停止了的表现。
鶌,鸟名,又写作“鹘嘲”,《礼记・疏》云:“鶌,音九物反,音嘲,后世谓之鹘嘲。”就是说“鹘嘲”后来缩音成了一个音节“鶌”。读作两个音节的时候是
一个音节的时候是汉语。156阿尔泰语,
汉语中的双声词很可能也是阿尔泰语的残留,双声词是不能分开的,分开后便没有了意义。我们确可以把那些双声词看成没有单音节化的阿尔泰语词汇,就是说有些阿尔泰语词汇以原形残留在汉语之中,如:
“畔换”,《玉篇》:“跋扈亦作伴换。”《诗》云:“天然伴换。”伴换,跋扈也。《汉书・叙传》曰:项氏畔换,韦昭:“畔换,跋扈也。”异写说明这个双声词只是汉字注音。
又如:倘佯——尚阳——尚羊;逶迤——委蛇——委佗——郁夷——威迟,特别是“逶迤”,古代多达三十余种写法,这只能说明它不是汉语固有的,如果它出自汉语本身,就不可能出现如此众多的异写。双声词就像没有完全消化的食物,基本上以食物原形残留在汉语中。
汉语中的儿化音也是阿尔泰语的残留,阿尔泰语,特别是蒙古语有浓重的“儿”化音,即卷舌音,发音时舌头常处在卷起状态,这个特点在“普通话”中留下了深深的印记。
《魏书》称南方人“鸟声禽语”,意思是说南方人说话像鸟鸣一样不会卷舌,这是事实,也是古代百越语的共同特点。历史上阿尔泰游牧民族不断融入汉民族,中国人中的阿尔泰血缘浓度自北而南呈递减状态,语言中卷舌音多少反映这样一种血缘浓度,儿化音越重的地区阿尔泰游牧民族的血缘浓度越高。
古代音韵学家就已经发现,上古以来汉字读音变化的趋势是,“浊音”向“清音”转化,这其实就是阿尔泰语向单音节靠拢,向现代汉语发展的过程,阿尔泰语带有浓重的卷舌音,即“浊音”。卷舌音逐渐减少的过程也是汉字的汉化过程。
我们发现甲骨文能解读出来的不到一半,大多无法解读,不知所云,即使是后来的金文,很多也无法释读,这是为什么呢?一个文字体系总是慢慢丰富起来的,词汇量会有一个从少到多的过程,起先不够丰富,后来不断增多。早先产生的文字应是最基本的词汇,基础性的词汇,最有生命力的词汇,这些词汇不可能大量地死去,解读不出来,只有一种可能,就是因为它表达的原本不是汉语,这些甲骨文金文由于没有经过汉化的过程,最后无奈地完全地死去了。
从《说文》《切韵》等古代字典中也可以看到,大量先秦时代的古汉字没有被继承下来,笔者以为,就是因为它们原本表达的不是汉民族的固有语言,原本不是单音节读音,被后人强行单音节化,缺少了一个约定俗成的演变过程,导致没有被广泛接受,最后也只能消失了。人随笔汉字与阿尔泰语渊源关系157
那么,现代汉语是这样形成的?笔者以为汉字的流传和使用是现代汉语的历史成因。
可以这样说,世界上没有哪一种民族语言有过汉语这种历史成因,世界上没有哪一种民族语言像现代汉语那样年轻!
由于汉字最初的创制者和使用者是作为统治阶级的阿尔泰游牧民族,汉字随着大规模奴隶主政权的产生而产生,由阿尔泰游牧文化内在特性使然。早期汉字的主要用途是占卜祭祀,文字始终与权威相伴,与神灵有关,汉字一开始就带着神圣的光环,必然成为人们敬畏的对象,汉字读音以及由这种文字读音和记录方式形成的书面语言便有了强大的渗透力,对民族语言具有示范作用和标杆作用,必然对汉民族原始语言产生巨大的潜移默化的影响。
汉民族对于汉字的敬畏自古已然,即使在半个世纪以前,人们还可以在民间看到这种情形:大人们神情严肃地告诫小孩,写有字的纸是不可掉在地上的,因为不小心会被脚踩上;文字是很神圣的,写有字的纸绝不能带进厕所,否则就是对文字的亵渎,神灵要发怒的!我们的祖先就这样世世代代对汉字充满敬畏。
由于汉字长期笼罩着神圣的光环,人们的口头语言就会被文字语言所吸引,文字词汇会慢慢渗透到民族语言中去,最终取代汉民族口语中固有的同义词,原来的“土话”不知不觉中向“雅言”靠扰了。
可以想见远古时代土著农耕民族的语言,即百越语方言中的固有词汇大多已经被来自文字的词汇替换掉了,换言之,这种已经被替换得面目全非的古代百越语就是今天的现代汉语,从世界语言史角度去看我们的“普通话”,这种语言的历史是很短暂的。
笔者以为现代汉语就是以单音节的百越先民口语为母本,以单音节化了的汉字为父本,在象形文字神圣光环的引导下逐步形成的。在现代汉语的形成过程中汉字的作用不可低估,汉字扮演了非常特殊的角色,是汉字的长期使用造就了现代汉语。
就像冰川对于山脉的作用一样,漫长的冰川期可以极大地侵蚀山脉原有的地形地貌,但终究无法改变山脉的基本走向,冰川消退之后我们发现山脉依然存在——那就是汉民族语言的单音节特征,它坚如磐石,顽强屹立,丝毫没有改变!
在描述现代汉语成因时,我们其实可以把汉字比作化学反应中的触媒,化学反应炉子中触媒不可或缺,如果没有触媒作为介质,许多化学反应
或者难以持续发生,汉字在现代汉语形成过程中也具有如此这158不会发生,
种神奇的媒介作用。
笔者以为汉语形成时期离今天并不遥远,可能就在春秋战国时代,因为那是一个奴隶主大量没落、大量消融到社会底层去的时代,一个文字突然繁荣起来的时代。从这个时期开始,文字日益超出占卜祭祀的传统功能,成为表情达意、传递信息的工具,其时已经进入表达单音节汉语的时代了。春秋战国时期的社会大动荡、社会大变革,为汉语的形成提供了历史契机。
可以想见,经过数千年征服消融的风雨荡涤,经过数千年文字词汇的渗透,古代百越先民语言中固有的词汇已经被外来词汇替换得面目全非了。中国历史上这种由北而南的文化浸染和语言浸染,古人其实也不是毫无觉察,隋代颜之推《音辞篇》有言:“北杂夷虏,南浸吴越。”便是对这种历史趋势的生动表述,汉语即所谓的“音辞”受到阿尔泰语渗透和取代的历史已经非常久远了。当然百越语中的固有词汇并不会全都消失,今天南方偏远地区的方言中就保存了很多这种古老词汇,成为我们研究古代百越语的样本。
汉字的历史作用是不可低估的,正是因为汉字不是拼音文字,而是一种表意文字,“雅言”词汇不是汉民族先民固有的词汇,是一种外来成分,这种象形表意文字才有了读音上的可塑性,正是这种可塑性能造就出如此大范围分布着的现代汉语。
如果古代中国也流行拼音文字,那么史前时代早就存在了的众多方言即百越方言,不会以汉字为标杆慢慢趋向一致。拼音文字的不可塑性将使它难以化身进入汉民族的语言之中。因为汉字是象形表意文字,读音可塑,才使得使用这种文字的地方最终演化出一种共同语言,使得如此大范围内的原始土著方言不可抗拒地被这种文字语言所改造。
可以想见,如果古人使用的是拼音文字,体量如此巨大的汉民族不可能形成,因为共同的语言是一个民族赖以存在的基础。就是说汉字的这种特殊性还影响到了中华民族的规模以及中国的国家形态上了。为什么东方历史上总呈现大一统状况,而欧洲总是小国林立,出现大型国家的机率很小呢?可能与文字性状有关。西方人一直使用拼音文字,使用拼音文字会使一种语言长久地保持其本来的面貌;而不同语言是不同民族存在的基础。就是说那里民族众多、国家林立,可能与流行拼音文字有一定关系。
九、失传的文字
黄帝之时应已有文字,黄帝的帝国如此广大,他要发布命令,管理属国人随笔汉字与阿尔泰语渊源关系159
臣民,记载将士功过,祭祀祖先,占卜凶吉都离不开文字,文字会随着大规模政权的迫切需要而产生出来。
我们看到后世的西夏、辽、金、蒙古和满洲,他们在帝国创立前都没有文字,但创立后马上着手创制自己的文字,因为管理帝国实在离不开文字,非创制不可了,大规模国家形成确是人类文明的主要推动力,世界各地古老文明都如此,尤其表现在文字的创制中。
我们还应当看到,最需要文字的是统治者,而不是被统治者,奴隶者不需要文字,文字的创制者必定是作为统治阶级的奴隶主们。整个华夏文明形成时期阿尔泰游牧民族都扮演了统治者的角色,中国最早的文字所表达的必然是古代阿尔泰语,文字的读音必定是多音节。
考古显示,世界任何文字开始的时候都是象形文字。世界上最早的文字七千年前出现在两河流域的美索不达米亚苏美尔文明中,称之为楔形文字,早期阶段也是象形文字,图形特征很明显,但属于拼音文字,如图:
6100年前形状 4500年前形状 2700年前形状
楔形文字形状的演变
稍后出现的古埃及文字更是彻底的象形文字,画着完整的蛇、完整的鸟,但与苏美尔人的楔形文字一样是拼音文字,那蛇和鸟分别代表元音或辅音。亚楔形文字和古埃及文字有从象形到抽象符号的演变过程,只是他们始终是拼音文字而已。
黄帝时期的文字可能是模仿美索不达米亚楔形文字而来,黄河流域与两河流域相距千万里,但对于以征战掳掠为生的马背民族来说这并非难以
如果黄帝确有命仓颉造字的史实,仓颉最有可能的是借用西方已经
160跨越。
存在千年之久的楔形文字,就像元代的八思巴一样,为忽必烈编制出一套拼音符号来,以记录黄帝的语言,这倒是能一个人完成的,至于一人造出众多的象形会意字则是完全没有可能的事。
我们确可以从《史记》中解读出这样一种历史信息,就是在汉字之前,或者在汉字流行的同时,中国可能也曾有过拼音文字。《史记・五帝本纪》:
太史公曰:学者多称五帝,尚矣。然《尚书》独载尧以来,而《百家》言黄帝,其言不雅训,荐绅先生难言之。
司马迁出身于世袭太史令之家,太史令是专门为皇家管理图书档案的官职。在其父亲司马淡死后,司马迁袭任父职,故司马迁总是借其父亲“太史公”之口评说历史。祖上世代担任此官职,能见到皇家藏于“石室金匮”中的珍稀古籍,如《百家》,据说此书记载的是黄帝的事迹,但父子二人竟看不懂,这是为什么?司马迁见识广博,还交结了当时许多学识渊博的士大夫,即“缙绅先生”,竟然都不能解读古籍《百家》,这是为什么?乃是因为“其言不雅训”。
这“不雅训”可以有两种解释:一是卑俗,缙绅先生们或许不愿降低身份去引用或者去研读,但总能读懂,只是不愿而已。二是完全看不懂,不知所云,书中的文字早已失传,无人能晓了。事实上可以立即排除第一种情况,因为黄帝是圣人,与黄帝有关的书籍,岂有卑俗之嫌?可以这样推测,《百家》即使是用最早期的古汉字写成,如类似甲骨文,金文中的文字,司马迁这样的博学之士岂能不晓?于是另一种可能似乎出现了:《百家》可能是用另一种完全不同的文字写成,到司马迁之时已经谁也看不懂了,如此这般,百家》最终失传便不可避免了。
这就向我们传递了一个历史信息:司马迁看到过一本谁也看不懂的书,里面的文字没有一个人能认识。笔者以为,这种文字属于拼音文字的可能性是最大的。
中国历史上可能有过另一种文字的信息不仅出现在《史记》中,许慎《说文》有言:“五帝三王之世,改易殊体,封于泰山者七十有二代,靡有同焉。”意思是说五帝三王各有不同的文字,他们祭祀泰山刻于石头上的文字都不一样。许慎又说:“(汉初)时有六书,一曰古文,孔子壁中书也。二曰奇字,即古文而异者也。三曰篆书,即小篆,秦始皇使下杜人程邈所作也。”就是说许慎之时尚有一种“奇字”存世,只是无人能识,故称之为“奇”,如果只是书写形式特别,仍然能识读那就不“奇”了。许慎还说:“(说文)其称《易》孟氏,《书》人随笔汉字与阿尔泰语渊源关系161《
孔氏,《诗》毛氏……皆古文也,其于所不知,盖阙如也。”意思是说除了这些正统古籍之外,还有一些我“所不知”的文字,就不在收集范围之内了。由此可知,司马迁一百多年后,仍然有人看到过那种无法识读的文字。
比司马迁早五百年的孔子,不但看见过那种奇怪的文字,而且还对此研究过一番。孔子曰:“吾犹乃史之阙文,今亡也夫。”意思是说我研读过一种“阙文”,因为有些古籍用“阙文”写成,只是现在已没有人能读懂了。
先秦古籍中有众多的同名异写现象,也从另一个角度指向这种推测。这种失传的文字与象形表意汉字曾并存过一段历史时期,不同时代的译者选用不同的汉字去注音翻译那种奇文古籍,就会产生这种同名异写现象。
例如秦人的祖先名“伯翳”,但《尚书》却记作“伯益”。如果这个名字一开始就写作“伯翳”二字,就不会出现另外的异写,随便把别人数千年前的祖先名字改掉的可能性在华夏文化中是不会出现的,乃是由这种文化的特质决定了的。只有此种情形下会出现,即这个祖先名开始是用拼音文字记录的,后来那种拼音文字使用者越来越少了,于是有人用汉字去注音这个祖先名,异写就不可避免地出现了,那种“奇文”甚至可能比汉字更早出现,可能流行过很长一段历史时期。
美索不达米亚的楔形文字写在泥板上,经火烧烤后硬化了,由于埋在那片干燥的土地上,得以大量保存下来,那已是定居民族使用的文字。而三皇五帝时期的中国还迁徙不定,不可能会把文字刻写在难以搬迁的泥板上,如果黄帝把文字写在兽皮上就难以保存下来,没有考古发现也属自然。
《尚书・多士》:“夏人有典有册”,说明夏后之时就有文字典籍了,夏代应已经有比较成熟的文字系统了。蝌蚪文又称“夏篆”“峋嵝文”,一般被认为是夏代的文字,头粗尾细,委蜿曲弯,确有点像楔形文字,但一直没能解读出来,或许就是一种拼音文字。
甚至楚国的古史《祷杌》也可能是用拼音文字写成的。在古书中“祷杌”被注解成一个怪物,他所有高贵血统,出自颛顼,但听不懂人言,也不会说人话,成了一个狂暴乖戾的怪人。对此似乎应当这样解读:由于《祷杌》是用楔形文字写成,最后无人能识了,就是无法听懂“祷杌”在说什么了,一本无法读懂的书被讹传成不说人话的怪人是可能的,且楚国一向被儒家认为非正统,楚国不是周天子所封国,历史上总是与周天子作对,由此注解就不足为奇了。
楔形文字最终被淘汰可能与拼音文字表达汉民族先民的单音节语言效果不佳有关,拼音文字表达单音节语言的确没有什么优势,汉语拼音可
162以为证,
“血色曙光──华夏文明与汉字的起源”之五
汉字与阿尔泰语渊源关系
□徐江伟
一、汉字的起源
当我们在水边散步的时候,看到水底下黑黝黝的水草随水流飘动,我们可能会产生这样的遐想:水草原本生长在岸上,后来被水淹没,慢慢适应了水中的环境,最后变成水中之草……大地上草木繁多,生长丰茂,相比之下水草显得单调多了,由丰富多样变成单调稀少的原因是很容易想象出来的,也是很常见的自然现象,因此产生这种水草起源的想法是很自然的。但研究生命起源的科学家告诉我们,水草的历史比我们想象的要悠久得多了,地球上的生命包括草木都是在水下环境中产生出来,陆地上的草木原本都是水草,它们渐渐向陆地蔓延,逐步适应了陆地上无水的生存环境,才演化出今天我们看到的千姿百态的植物世界。
又如我们看到黑非洲,不管是人种还是社会都呈现出人类的原始风貌,想当然地以为他们的历史可能比较短暂,但人类学家研究表明,世界上所有人类都是从黑非洲走出来的,没有哪个民族能比他们的历史更悠久,原始风貌反而是历史更悠久的表现。
由此可见人们原来的观念可能是一种错觉!
关于汉字起源,情况正是如此,我们已经被假象迷惑了数千年!
如果回顾东方民族文字发展史,我们看到历史上阿尔泰游牧民族建立的国家,如辽、西夏、金,还有朝鲜、日本,他们的文字都是借用汉字偏旁部首创造出来,他们原本没有文字,汉字被他们借用并改造之后,适应了他们的语言环境,形成了他们自己的民族文字,这些都属于汉字的延伸应用,为此我们的观念早已固化,再也不会去做相反的推想了。【作者简介】 徐江伟, 1982年毕业于浙江师范学院中文系,曾当过教师,后从商,现为自由职业者,134并爱好历史研究。
汉字起源于阿尔泰语,这会是真的吗?是的,汉字起源于阿尔泰语,汉字最初表达的的确是多音节的古代阿尔泰语。对此笔者将从诸多方面加以论证说明,通过对汉字“基因分析”来展开讨论,这有助于我们揭开华夏文明起源的奥秘,从而描述出真实的华夏文明起源发展史。
让我们首先对两种语言中的基本词汇做一些分析考察:
水,古代突厥语读作“苏乌”suw(西文字母转写)
土,古代突厥语读作“拓”tu
木,古代突厥语读作“莫”mo
石,古代突厥语读作“它斯”tas
儿,古代突厥语读作“乌鲁儿”orul
心,古代突厥语读作“身”siin
从读音上我们很容易发现,古代突厥语发音与现代汉语十分相似。这种相似性是怎么来的呢?有人会说:这是语言的借用现象啊,借用现象在世界上各种语言之间广泛存在,有什么可奇怪的呢?那么,到底是谁借用了谁呢?
应知这样一些基本词汇,在人类出现之初就已经存在于各种语言中了,那是一些最基本的概念,那是人类认知世界的最初成果,应在人类开始说话时就形成了。可以推定说阿尔泰语的游牧民族对此早就有自己的读音,说单音节语言的汉民族先民也早就有自己的读音,而且两个读音不会相同或相似,因为两种语言不存在亲缘关系,两大族类可能在人类出现之初就分开独自发展了,他们的语言应不会出现“撞车”现象;两者之间必定有一个是借用者,借用者把自己原有的读音遗失了。
笔者的结论是,汉语借用了古代突厥语,并把自己的原有的读音遗失了。为什么这样推定?因为古代阿尔泰语游牧民族都没有自己的文字,由于没有文字,他们远古祖先遗留下来的读音就会代代相传,不会遗失;而汉民族由于早有文字,原来固有的读法就可能被文字读音取代,换言之,历史上汉民族面临过这种被取代的风险,而阿尔泰游牧民族由于没有文字,没有面临过这种风险,采用排除法可以推定汉语上述读音是借来的,这样的推定其实是一种逻辑的必然性。
请注意下面一段文字:汉民族先民奴隶出身的历史真实已经注定汉民族先民不可能是汉字最早的创造者,因为奴隶不需要文字,需要文字的是作为统治者的阿尔泰语游牧民族,汉字最初表达的必然是古代阿尔泰语,其最初的读音必定是多音节读音的。
为了形象直观地说明问题,让我们立即着手对汉字做一些本义方面的人随笔汉字与阿尔泰语渊源关系135
分析。我们可以通过考察汉字的本义来指认它最初表达的是哪一种语言:
载,古代突厥语“年”读作“支意儿”ziil,“一年”的意思,蒙古语“年”读作“恩即儿”enjil,两者读音非常近似,快读都是汉字“载”的读音。甲骨文和金文“载”的本义也是“年”。但现代汉语中这个“年”的意思早已经淡出,变成“载重”的意思了。但直到今天蒙古语读音仍然是这个汉字的古义。
树,蒙古语“尚树”的读音,专指那种对高大,高龄树木的祭祀仪式。游牧民族认为所有大树都有神灵附体,这种祭拜树木的习俗至今在延续着,他们常常在那里“尚树”,而这正是汉字“树”的本义。树,会意字,本来就指一种祭祀仪式,你看象形字“木”前面摆放一“豆”(一种祭祀器皿),上面盛有献祭物品,“寸”是手,手拿着祭品做祭拜之礼,甲骨文,金文如图:
甲骨文“树”不是指树木,树木另有“木”字,对此古人绝不会混淆。但现代汉语把“树”的本义剔除了,由此可见甲骨文“树”最初表达的是蒙古语“尚树”,后来两个音节缩成一个,多音节词汇单音节化了。
曰,古代汉语常用字,但汉语口语完全不用,古代突厥语口语“话语”读作“阿语儿”ayr,故可以推定这个象形字最初表达的是古代突厥语而不是汉语,汉字读音由突厥语单音节化而来。
坐:象形字,本义是高台上有二人,但他们不是一般的人,而是高高在上的尊者。从象形字中可以看出,这个汉字本义不是一般的行为动作,而是指一种等级地位。如图:
我们在古代突厥语中找到了这个汉字本义,古代突厥语读作“乌乍”uza。《阙特勤碑》有这样的句子:kisi orlinda uza,“众人之上(坐)有我的祖先”。坐是“在……之上”的意思。象形字“坐”本义清楚地告诉我,是说古代突厥语的人创造了这个字,本义是“尊者”,汉语把它转而用做一般的行为动词,本义已被抛弃了。但这种以“坐”来体现尊贵的习俗在阿尔泰游牧民族中始终存在。
歹,古代突厥语危险或死亡读作“阿达”ada,习惯用“歹”来表示“危险”“死亡”是古代汉语的特色,但汉语口语不用,因此可推定“歹”原来表达的是突厥语口语。
136狐,汉语读作hú。我们知道这是一个形声字,“瓜”是其声旁,
因此远古
时候可能读作“瓜”(gua)。这可以从古突厥语中得到印证,《阙特勤碑》中“狐”果然读作tilku “脱儿姑”,快读即成“瓜”音了。
陈,蒙古语“旧的”读作“呼陈”huuchin,而这正是汉字“陈”的本义,古代汉语中“旧”都写作“陈”,现代汉语中陈的本义已经被抛弃不用,但在蒙古语口语中依旧保持其本义,就是说“陈”字最初表达的是蒙古语。
妾,满洲语读作“福晋”,“妾”,会意字,意思是站立伺候的女子,刚造出来时应读作“福晋”两个音节,快读即可缩音成qie。
鬼,蒙古语读作“翁贡”,缩音后即成今天汉语普通话“鬼”的读音了。《史记》记载:“楚人读‘鬼’,越人读‘几’”,今天的吴越方言仍然读作ju,因此前者读音可能由阿尔泰语而来,后者读音可能是汉语方言固有的发音。
贷,《金史・国语解》记载“买到”女直语读作“兀带”,这应是“贷”字的本义和原始读音,因为它不见于汉语方言和口语中,可能是个外来词,来自女直语的可能性最大了。
适,《金史・国语解》曰:“安乐”女直语读作“赛里”,这可能是汉字“适”的本义以及今天读音的来源。
讼,这是“雅言”,只会出现在书面语言中,汉族口语中从不见使用,“讼”,象形会意字,意思是许多人同时在说话,引申为“争辩”“分辨”。满洲女直语读作“倍申”becen,可能就是其原始读音。
爵,古突厥语“大臣”“大官”读作“吉利”,推测其为汉字“爵”的来源。匕,象形字,古汉语中常用,意思是刀,现代汉语中已不单独使用了,汉语口语也不用,但古代突厥语“刀”确读作“毕”bi,至今如此读法,故推定是古代突厥人创造了这个字。
香,蒙古语读作“桑”,意为“熏香”,而这正是这个象形字的本义。
昆,蒙古语“高山”读作“昆”,如“额儿吉涅昆”(即“额儿古纳山”),而这正是“昆”的本义。
玉,蒙古语读作“哈须”,快读即成“玉”。
都,汗廷所在地蒙古语读作“斡儿朵”ordu,本义是可汗的宫帐,这应是“都”字读音的来源。
黑,蒙古语读作“哈拉”kara,快读即成汉字“黑”的读音了。同义字“乌”到可能是汉语方言固有的读音,今天吴越方言黑仍然都读作乌。
自,古突厥语“我”读作“乌自”oz,正是象形字“自”(象形鼻子)的本义,但现代汉语早已舍弃其本义而移作他用了,故推测“自”字由说古代突厥语的人创造出来,也就是说原来表达的是突厥语。人随笔汉字与阿尔泰语渊源关系137
技,古代突厥语“能巧的”读作“乌兹”uz,这可能就是这个汉字的原始读音。
言,古突厥语“歌曲”“说唱”读作“以尔”yir,正是象形字“言”的本义,就是说“言”原先可能读作yir。
野,古突厥语“草原”“土地”读作“以耳”yil,正是汉字“野”的本义。如“牧野之战”,这个野就是指商纣王拥有的草原。
谁,古突厥语“人们”读作“克虽”kisi,正是“谁”的本义,应知这个谁字原先确不是疑问代词,而是指称代词,指称人们,而今天的突厥语仍然用作的指称代词,故推测其为原始读音。
让我们再来看看“国粹”,十二生肖和天干地支的汉字读音,它们确实不见于汉语口语中,但古代阿尔泰语读音恰恰明白无误地指向这个汉字的本义,举例如下:
“申”(猴),这个汉字的本义是猴子,但古突厥语猴子读作“杯申”bicin,与这个“申”的读音近似。
“酉”(鸡),这个汉字的本义是鸡,但古突厥语鸡读作“泰奇区”taqiqu,与这个“酉”的读音近似。
“午”(牛?马?),这个汉字的本义有两种理解,一是牛,二是马,但今天蒙古语牛的确读作“午得”ud,与这个“午”字的读音近似,并且汉字“午”是个象形字,象形牛而非马。
天干地支中的甲,对应的古突厥语读作“甲卜”qap ;乙,读作“乙儿”ir ;丙,读作“匹”pi ;丁,读作“替”ti ;辛,读作“生”sin ;癸,读作“快”kui。所有这些读音能对应起来,这就提示我们,单音节的汉语与多音节的阿尔泰语之间存在诸多内在联系,这其实是一种历史的渊源关系。
如此国粹从何而来?似乎可以做这样的比喻:如果一个钱包有两个失主认领,一个失主能说出钱包中钱的数目,另一个却不能,那么这个钱包应判定给谁,不是很清楚了吗?笔者以为,汉字的本义犹如钱包中钱的数目。
阿尔泰语词汇中有少量单音节的,但绝大多数是多音节的。古代汉语首先是把这些读音全部继承下来,后来慢慢单音节化,以适应单音节汉语的发音习惯,方法很简单,快读即成。有些字原来可能有三个以上音节,但音节有轻重,轻音可以被人为遗失,于是全都演变成了单音节。当然这种读音的演变不会是短时间里完成的,肯定有一个漫长历史过程,笔者推测这
138一过程至少持续了上千年。
二、汉字与阿尔泰语的对应关系
汉字与阿尔泰语之间存在非常广泛的对应关系,这种对应关系,不是用偶然巧合就能解释得了的,这其实是一种渊源关系,问题是应当分别哪一个是源,哪一个又是流。
笔者发现这两种语言之间甚至有双重重合现象,汉语和阿尔泰语都有同音多义现象,但两种语言同音多义也能重合就需要特别关注了。如:
悟:古突厥语读作“吾”o,同样是“想通”的意思;寤,古代突厥语读作吾”uu,同样是“睡觉”的意思。
瘸,古突厥语读作qat,同样是“腿有病”的意思;加,古突厥语读作qat,同样是“加入”的意思。
夹,古突厥语读作qap,同样是“口袋”的意思;夹,古突厥语读作qap,同样是“抓住”的意思。
发,满洲语读作afa,同样是“出去作战”的意思;发,满洲语读作afa,同样是“交付文书”的意思。
齿,古突厥语读作tis,同样是“牙齿”的意思;雌,古突厥语读作tisi,同样是“母”的意思。
哥,古突厥语读作og,同样是“哥哥”的意思;歌,古突厥语读作og,同样是“称颂”的意思。
阳,古突厥语读作yan,同样是“太阳”的意思;样,古突厥语读作yan,同样是“样子”的意思。
域,古突厥语读作il,同样是“国家”的意思;依,古突厥语读作il,同样是附属”的意思(il-khan伊尔汗,从属的汗国)。
这种多义词双重重合现象更不会是一种偶然巧合,更能表明两者之间存在渊源关系,汉字可能起源于古代阿尔泰语,汉字最初表达的可能是多音节的匈奴语!
10世纪的《突厥语大辞典》记载了大量中古时代新疆地区的突厥语词汇,其中也有许多能与汉字读音对应起来。
上述阿尔泰语词汇都是多音节读音,但快读即可成单音节,并近似今天汉字的读音了。阿尔泰语读音,例如蒙古语,与汉字比起来颚音特别重,发音时舌头要卷起并往后缩,这对说惯了汉语的人是很不习惯的,特别是说惯了中国南方方言的人就更不习惯了。
为什么汉字读音与阿尔泰语读音存在如此广泛的对应关系?到底是单人随笔汉字与阿尔泰语渊源关系139““
音节读音变成了多音节读音,还是多音节读音变成了单音节读音呢?当然两者都有可能。但当我们发现华夏文明由北而南扩展,三皇五帝和夏商周秦的创建者是游牧民族背景的时候,合乎逻辑的判断就产生了,汉字读音有过的演变趋势应当是后者而不是前者!
阿尔泰语是一个庞大的语系,里面有许多分支,各分支间许多基本词汇也是不同的,各分支甚至有各自的数字体系,即使是同源词汇,读音也有一些差异,主要是后缀音有所不同。阿尔泰语词汇是一种黏着性词汇,由词根连接一些语法成分组成,后缀的语法成分常常会出现差异,对此中原汉人早已发现并有所记载了,明人《卢龙塞语》举例说:同样是树木的“木”,辽河三卫之人读作“抹敦”,东夷(朝鲜边境)读作“莫多”,北虏(蒙古地区)读作“末都”,但三者词根是完全一致的。
从整体上看,阿尔泰语各分支间的共同性远多于差异性,特别是句法和文化词相当统一,正因为如此,《突厥语大辞典》把南俄草原到大兴安岭以东所有族类都归入“突厥语”之中,书中对突厥语方言有如此解释:“所有突厥语在基本词汇上的差别很小,方言词汇的差别仅表现为几个字母的互相替代或脱落。”这就是一种宏观描述。
其实汉字与阿尔泰语之间不但在名词、动词、代词上存在许多对应关系,甚至在虚词上也有全面的对应关系,我们知道虚词有许多种,令人吃惊的是古代汉语中的所有虚词都能与阿尔泰语虚词对应起来,这已经不能用两种语言之间的互相影响、互相借用来解释了,而是一种明白无误的渊源关系了。
关于汉字起源的描述是一种宏观描述,既然是宏观,也就放弃了细节和局部,把古代阿尔泰语视为一个无差别整体了,就像我们把分支更多的古代百越语视为无差别整体一样,乃是由观察高度决定了的,站得很高的时候能看到全局,但已经看不清局部了,注定要舍弃细节了。
汉字起源的问题是“汉学”的核心问题,当然也是中国文明史的核心问题,这是一个涉及面很大的话题,涉及到华夏文明的方方面面,对此作者将进一步展开讨论。
三、从旦字说起解读汉字起源
汉字是怎样一种文字?如举例简要说明之,则典型莫过于旦字矣!
140汉字“旦”,一个高度象形、高度会意的文字。地平线上,更确切地说是平
坦广阔的草原上,冒出一轮太阳,即画作圆圈的“日”,于是天亮了,已经是第二天了,或曰又一天开始了,这就是旦所表达的意思,象形兼会意,一目了然。
这个汉字,实在无需冥思苦想,无需神灵指引,无需多少学问和智商,人人都能发明之。就是说被儒家说得神秘兮兮的文字缘起其实并无神秘可言,乃是一种很自然的事。为了表达一个自己能懂、别人也能理解的概念,古人自然而然就如此这般在某种物体上刻下了一个可供许多人识别的符号,汉字就这样出现了。
旦字必应是最早出现的汉字之一,因为这个概念在人类生活中最常显现,每天都要重复一次,它就可能最早被发明出来,并被那个部族的人最频繁地使用过。
令人奇怪的是这个“旦”在汉语口语中从不使用,你能找出有哪一种汉语方言把“第二天”说成“旦”的吗?实在找不出来,一个也没有!“旦”只在古代汉语中存在,在汉语书面语言中使用。因此这个旦词不会是汉语方言所固有的,发明这个字的人不太可能是说汉语方言的人。
那么什么语言把第二天说成“旦”呢?笔者在满洲女直语种中找到了答案。满族是一个极其重视祭祖的民族,这也是阿尔泰游牧民族的共同特征,游牧文化具有强烈的血缘属性。满族人每年要举行大祭,一般在三九天举行,最重要的仪式是祭拜“祖宗匣”,一个珍藏着家谱或祖先遗物匣子,里面还有一个名叫“妈妈口袋”的黄色袋子,装着有神秘故事的“子孙绳”,此外就是隆重祭拜“索罗杆”,一根高高竖起的树干,上有一锡斗,内装杂碎猪内脏和五谷,招乌鸦或喜鹊飞来啄食,满洲人把这种隆重大祭叫做“换锁”
。
在隆重繁忙的家祭中,当族人们忙碌一整天做完神糕,煮好猪肉等享神物品之后,他们就静候“乌尔顿”的到来。传说祭祀那一天,当东方破晓之时,满族的一个祖神“乌忻贝勒”(“兀颜”贝勒),就会降临到他们的神堂中来。
“乌尔顿”是满洲女直语“黎明”“天亮”的读音,重音在“顿”,这不正是汉字“旦”的原始读音吗?缩音的方法很简单,快读即成(今天蒙古语“日”“今日”读作“殴德陆”odor,读音与女直语稍有差异)。
由此可见,“旦”原本表达的是多音节的阿尔泰语,应是由古代女直先民,即“匈奴”发明创造出来,只是到后来才被说单音节语言的汉民族先民继承过来,并逐渐单音节化,先是存在于古代汉语“雅言”中,后来才扩大到汉语口语中去。由于汉字原本用于占卜祭祀,笼罩着神秘的光环,且是官方语言,即社会主流语言,拥有强大的吸引力,雅言词汇很容易进入汉语言中去。人随笔汉字与阿尔泰语渊源关系141(汉字拟音)
“旦”在阿尔泰语中原本是一个完整的词汇,在古代汉语中也是一个完整的、可单独使用,慢慢成为了单音节汉语的一个词素,词素能够组成词,如“元旦”“一旦”,但已经不能单独使用了。
这种由完整词汇演变成词素的过程在汉字发展史上如此广泛普遍地存在,几乎大多数汉字都经历了这样一种脱胎换骨的演变,以至于人们已经难以想象汉字原本表达的是多音节的阿尔泰语。而那个女直语“换锁”不正是汉字“祀”的原始读音吗?这个祀字也不能单独使用,那么旦字不是由操满洲女直语的人发明又会是谁呢?
为了更清楚地说明汉字的起源和演变,试着继续举例:
1.卉,“花草”如用满洲语读,读作“噢尔会”orho,很容易就找到了对应的汉字“卉”,但这是雅言,汉语口语不用,如果你指着公园里的花草说那是“卉”,人家不把你当作神经病才怪呢!就是说那些习惯用“卉”指称花草的人说古代女直语,不可能是汉民族先民,或者说发明这个“卉”字的人是操多音节语言的匈奴。
2.卿,卿是古代汉语中常用的人称代词,类似于现代汉语中的“您”,但不见汉语口语中有用“卿”来称呼人的。只有今天的蒙古语中“卿”仍然是最常用的指代词,如“哈布格钦”,“哈布格”意思是狩猎,“钦”是人的意思,也是你的意思,不是尊称,随便用,意思就是狩猎之人。我们发现古代汉语中的卿开始也是普通人称代词,并非尊称,只是到后来变成了尊称。因此这个汉字原本表达的应该是蒙古语。
3.册,《尚书》记载夏代即“有典有册”,就是说夏人已经使用文字并有成文法典了,可惜没有成文典籍传世。“册”是个高度象形的汉字,写有文字的木片或竹片用丝线连缀成“册”,所记载的当不是一般的东西,而是威严神圣的帝王律令。蒙古语把可汗发布的律令叫做“札撤”。从13世纪成吉思汗蒙古人开始使用古代回鹘文记载可汗“札撤”的情况看,最迫切需要文字的确是政府。
现代汉语中的册字已经没有法典的含义了,只有蒙古语的“札撤”能与册字的本义匹配,故推定“札撤”是册的原始读音,夏代的奴隶主们应是说古代蒙古语的。
4.戮,这个会意字由杀人的“戈”与两个肢体分离的人形组成,意思就是杀人,但不见于汉语口语,而古突厥语杀人读作“欧路尔”olur,能与这个读音对应起来,故推测其为原始读音。
5.霾(mai),完全是“雅言”,意思是浑浊的雾气,例如《诗经・终风》:“终
”但古突厥语浓重的雨雾读作“图埋”tuman,且是口语用词,两者142风且霾。
读音能对应起来,故推定是古代突厥人发明了这个汉字。
6.鬻(yu),古代汉语中的鬻是买卖的意思,但从不见汉语口语有此词汇,但古突厥语“买卖”倒是读作“语路尔”yulur,能与这个冷僻汉字对应起来,故推定其原来表达的是古代突厥语。
7.实,这个汉字原来指果实,如《韩非子・五蠹》:“草木之实足食也。”这个“实”也指祭祀中的素果供品,但现代汉语中果实的意思已经淡出,变成了“内容”的意思了,而古突厥语果实读作“图实”tus,可能是这个汉字的原始读音。
8.唁,属于“雅言”,意思是吊唁,不是汉语口语用词,但古突厥语吊唁读作“唁尔”yor,丧礼的意思,可能是这个汉字的原始读音。
9.浴,会意字,甲骨文中就出现了,是“洗”的意思,如《楚辞・渔父》:“新浴者必振衣。”《夏小正》:“十月黑乌浴。”但这个汉字不单独出现在汉语口语中,而古突厥语“洗”读作“浴”yu,推测其来自古代突厥语。
古代汉语中的雅言词汇有这样一个特点,越古奥的字,就越是对应着阿尔泰语口语中的常用词汇。例如这个“歼”字,本是杀死敌人的意思,但汉语口语不用“歼”来指称这个“杀死”。此外还有“殆”,也是杀死敌人的意思,如果人们在口语中用了这个词,听的人就莫名其妙了,因为它通常只出现在书面语言中。但“歼”和“殆”却是今天蒙古语口语最常用的词汇,并且蒙古人常常用之取名,许多蒙古人名叫“阿去”,意思是消灭敌人,不正是“歼”的原始读音吗?还有许多蒙古人名叫“达尔”,意思也是杀死敌人,不正是“殆”的原始读音吗?草原民族就这样用自己的名字顽强地传承着古老的游牧文化!
人类文明起源以文字的出现为标识,故本文中文明起源与汉字起源是相提并论同义互通的,当古人在龟甲或兽骨上刻下这个“旦”字的时候,华夏文明就起源了,但你万万不可把这个场景想象成温馨悦目、诗情画意的场景,其实当时既无“圣”,亦无“德”,实乃一个血腥弥漫之时代,因为其时人刚刚从动物界分离出来,所有的人还保持着浓重的兽性,那种原始兽性尚未被后来才慢慢出现的人性所覆盖,注定了这将是一个残酷无比的奴隶制时代。换言之,从这个“旦”字漾起的乃是一片令人心悸的血色曙光!
四、汉语音韵学的困境
所谓文明,就是那种能把人类与动物区别开来的东西,文明起源以什么为标识呢?文字的出现就是标识。我们可以这样理解“文明”:“文”就是文人随笔汉字与阿尔泰语渊源关系143
字,“明”就是出现,文字诞生标志着文明开始形成。
当然可以作为文明起源的标志物还有很多,如火的使用、工具的使用、陶器的出现、金属工具的使用等等,此处还可以通过一些社会现象去指认文明的起源,如社会分工的出现、贵贱等级的分化、国家的产生等等,但都不足以成为描述华夏文明起源的对象,或者说不足以成为华夏文明的象征。
为什么这样说呢?因为那些东西只能模模糊糊地把人与动物区别开来,能使用工具并不是人所特有的,动物界也存在使用工具的现象,至于火本质上也是一种工具。还有分工等级之类的社会现象,猴子、猩猩、狼都是社会性动物,其内部也是等级森严,既然有等级自然就产生了初步的分工,因此分工等级也不是人类社会所特有的现象,这些都不足以成为描述华夏文明起源的对象。
只有文字的出现才是文明起源的标识,只有文字才是人类所特有的东西,文字把人从动物界彻底区别开来;任何动物都没有文字,故描述文字的起源可以成为描述文明起源的代名词。
在描述华夏文明起源时,描述汉字的起源更具有特殊重要的意义,因为汉字的起源显示出华夏文明起源的特殊性,故华夏文明起源与汉字起源在本书中是同义互通的,换言之,本书把描述汉字起源作为描述华夏文明起源的核心内容,两者互相印证,互为表里,并以此作为本书的题目。
研究汉字字形的变化当然很重要,但笔者又以为描述出读音变化更有意义,因为汉字属于语言的范畴,文字所表达的最终仍是人类的有声语言,文字只是语言的从属物,语言的第一要素是“音”而不是“形”。
但是直到晚清才有学者开始关注起汉字读音的演变来,他们研究古代韵书,发现了一些规律性的东西。如“古无轻唇音”“古无舌上音”“古无去声”等等,在汉字读音溯源的道路上迈出了第一步。
不过在汉字读音演变研究中,真正有开拓性贡献的学者不是中国人,而是瑞典汉学家高本汉。高本汉确有语言学天赋,他十五岁时便写出了《瑞典南部方言同中部方言的分界线》论文。1910年他来到中国,专门研究汉字读音的演变规律,并为中国学界带来了西方的语言学理论和科学工具,即国际音标。
高本汉的研究极具创造性。他收集所有中国古代韵书,如宋代《广韵》等等,梳理里面的反切注音,最终编排出了汉字的音类体系,即声母和韵母体系,并用国际音标注音。他拟构出了汉字在中古时代的读音,发现了汉字读音从中古到现代的变化规律,这一研究成果就是他于1926年写成的《中
一书。144国音韵学研究》
此后高本汉决定向先秦古汉语攀登,他研究了《诗经》的韵脚、《说文》的谐音字等等,并以此拟构出“上古汉语”读音体系,这一研究成果就是《汉文典》一书。
高本汉发现汉字读音有一个从多到少的过程,越是远古,汉字的读音越宽泛,实际上有许多读音,他在《从上古汉语到中古汉语》一文中这样写道:
汉语的语音从古到今一直沿着简化的道路发展,尽管汉语原是一种单音节语言,但语音却非常丰富,有许多不同的音节(指“谐声”读音),后来经过剧烈的变化,早期区分得很清楚的音位合并了,语音变得非常贫乏,以致在现代北京话中只剩下420个不同的音节,而且这个数字也是把声调计算在内……我们发现中古汉语被大大简化了,许多声母合并了,中古12个声母只留下3个,韵母的演变也十分惊人,原来数量众多的韵母被大大地合并,精简掉了。高本汉指出,汉字曾有过许多读音,这些读音大体相同但有一些细微差异,这种差异被中国古代韵书记录下来了,差异可能出现在声母中,也可能出现在韵母中。但后来差异越变越少,众多读音好像被合并起来了。他以为古代汉字声母多达四十个,韵母多达二百九十个。
高本汉的研究意义十分巨大,他为中国引进了全新的汉字读音研究科学方法,开启了汉字读音研究的新时代,正当汉字字形研究,这门古老的
山穷水尽的时候,一个欧洲人从字音的方向上开辟出一片汉字研究的新天地。高本汉的研究极大地调动起中国学界的热情,特别是他“古音拟构”,探寻汉字源头的设想,激动着无数中国学人的心。
高本汉回国后,中国的语言学家们按照他的思路继续向前走了一程,但一程之后便再也迈不开前进的步伐了。今天离高本汉之时已过去了八十年,他提出的“古音拟构”的目标,渺茫得好像已经消失了,这又是为什么呢?
高本汉是从“反切”入手研究汉字上古音,就已经把研究对象严格地限制在了单音节范畴中,高本汉其实已经认定上古汉字是单音节读音,只是读音很不稳定,处于变化不停之中,他从来没有推测过汉字可能原本是多音节读音,更不可能把古汉字同古代阿尔泰语联系起来考察,他虽然发现了汉字读音演化的一些轨迹,但不可能发现汉字的真正源头。
中国一代代语言学家们和高本汉一样,在汉字的长河中努力探寻过,他们确可以在这条长河的中下游惬意地畅游,但一旦进入源头峡谷便显得力不从心了,他们既然止步于水诡流急的上游入口,当然见不到源头河谷人随笔汉字与阿尔泰语渊源关系145“汉学”
的奇异风光。那么到底是什么原因造成这种状态呢?原因就是他们的手脚被传统的文明起源观制约了。不要指望传统的文明起源观里会发生汉语音韵学的突破——就像在“天圆地方”传统宇宙观念中不可能产生牛顿力学一样,汉语音韵学的突破必然以旧的文明起源观被突破为前提!
高本汉树立起了古音拟构的宏伟目标,但他指明的路径从大方向上看一开始就是往死胡同里前进,中国音韵学家最后发现此路不通,乃是一种必然。
五、汉字单音节化的原因
高本汉发现先秦时代的“上古音”与隋唐时代的“中古音”相比已经有了许多变化,就是说汉字的读音竟然一直在演变之中。为描述这种现象,高本汉拟构出复辅音,他为汉字揣测出一系列的复辅音,就是复合声母,如kl-、gl-、mr-等等,有十九个之多。
笔者以为,历史上汉字读音宽泛,其实是一种读音游移不定的现象。复辅音的存在说明汉字读音曾经比较宽泛,即读音曾在两个声母间游移不定。
读音为什么会游移不定呢?音韵学家们一般用方言干扰来解释,所谓“吴音”“汉音”“中原音”“洛阳音”者是也。
但我们知道,华夏文明从肇始时期起,文明中心就没有改变过。“中国”总是在渭河流域的黄土高原上,汉字也首先出现在那里,成熟在那里,那里的“方言”会不断变动吗?显然不会。
如果用汉字的单音节化现象去解释就能说得通,读音游移不定的现象是单音节化过程中必然会出现的阶段,因为单音节化是一种约定俗成的过程,多音节的阿尔泰语词汇可以单音节成许多近似的读音,众多的读音在使用过程中约定俗成地、不知不觉地减少,最后趋于统一,那是由文字的社会功能使然,高本汉描述出来的复声母现象反过来证明汉字有过单音节化过程的推测可以成立。
一个民族的固有语言具有相当的稳定性,因为已经有过千万年的传承固化,民族语言的背景可能是整个人类的历史,文明史与之相比短暂得多了。民族语言在短短的数千年间应不会出现剧烈的变化,就是说如果汉字一开始表达的就是汉民族固有的单音节语言,就不可能出现数千年间读音剧烈变化的情形。
汉字读音之所以会变化不停,就是因为汉字一开始表达的并不是汉
它原本表达的是与这种单音节语言截然不146民族固有的单音节语言的缘故,
同,与这种单音节语言没有任何亲缘关系的古代阿尔泰语。
语言之间的根本区别是什么?根本区别不是词汇,词汇只是语言表层的东西,语言之间的根本区别是发音基础。多音节语言与单音节语言发音基础截然不同,那才是两种语言不可混淆、无法替换的东西。
因为词汇处在语言的表层,可以被轻松地替换掉,外来词汇可以大量地移植到另一种语言中去,甚至可能逐步取代那种语言的基本词汇,但发音基础无法移植,因为它处在语言的底层,它牢固地存在,犹如磐石般难以撬动。
汉字原本是匈奴创造出来,原本表达的是多音节的古代阿尔泰语,但最后竟变成了单音节读音,看似不可思议,却是规律使然,其实无可抗拒。
多音节读音向单音节汉语演变的趋势,从根本上说来是由双方人口数量决定的。在中国范围内占人口大多数的是汉民族先民,他们说单音节语言,他们虽然不是统治阶级,但人口数量上占有极大优势,汉字只有单音节化后才能根植到他们的语言中去,它别无选择。
虽然历史上北方游牧民族凭着他们的战争优势,总能以少胜多,进而成为中原农耕民族的统治者,但南方农耕人口数量远远超北方游牧人口的情况早就存在,远古时代就已经如此了。这是因为农耕有更高的土地利用率,能养活更多人口,而游牧民族以征战掳掠为生,人口在长期的杀伐中不可能很快增长,反而常常有大量的消失,他们在人口数量上从来是少数,永远是少数,他们有无法改变的“少数民族”身份。
他们成为奴隶主后养尊处优,不可避免地减少了流动性,不可避免地汉化了,于是失去一些战斗力,最后被更加原生态的游牧民族取而代之,到时一部分人必然降格成为平民甚至被统治者,慢慢消融进农耕汉民族中。沉降下来的那部分人会把他们使用过的文字带进汉民族中,最后他们连同带去的文字一起被彻底汉化,文字的读音由多音节变成了单音节,这就是汉字曾经有过的演变过程!
多音节的古代匈奴语虽然曾是那个奴隶制社会的强势语言,但终究不能取代被统治者的语言,强势语言也无法撬动有如此大基数人口的发音基础,强势语言并不具备杠杆效应,汉民族先民语言的发音基础如此深厚,无法替换,一言以蔽之,汉字单音节化乃是由人口的占比优势决定了的。
游牧文化特别强调尊卑等级,带来一种强烈的种族隔离作用,可以想见,高贵的奴隶主们不会让卑贱的耕奴们使用他们的语言;在那个社会中,奴隶也没有任何机会上升到统治阶级中去,就是说汉民族先民语言的“阿尔泰化”之所以不曾有过,乃是由游牧文化的特质注定了的,而奴隶主们不人随笔汉字与阿尔泰语渊源关系147
可阻挡地从高处沉降则是不可抗拒的自然规律决定了的。
如果你对汉字读音有过的演变仍然不能理解,如果你对“禹”的原始读音竟是“药逻”仍然心存疑虑的话,那么就让笔者再举一个时代较近,方便考证的例子来说明吧。
佛教由印度人发明并经中亚传到中国,汉民族接触佛教最早可以追溯到汉武帝时代。《史记》记载,汉武元狩年,大将霍去病出征西域,击败匈奴休屠王,“获其金人,帝(武帝)以为大神,列于甘泉宫”。《魏书・释老志》对此解释说:“金人”就是“菩萨”,汉武帝的行为便是中国“佛道流通之渐也”。在此之前,中原汉人只知有神仙,从未接触过菩萨,汉武帝也是把他当作一神仙放置于甘泉宫中。佛教真正传入中国是一百多年之后的东汉时期,汉人终于知道那个“金人”名叫“浮屠”,印度梵语的本义是“觉悟者”。
此“浮屠”后来又写作“佛陀”,原本是汉字注音,故有多种写法,梵语是多音节语言,故其读音也是多音节的。但多音节的“佛陀”来到汉语环境中后,很快便被单音节化了,最后变成一个音节“佛”。
因为汉语只允许定谓语性质的、可分割开来的多音节词组存在,如“大佛”“金佛”之类,不能容忍不可分割的多音节词汇存在,如“浮屠”,有两个音节,且不可分割,分割之后全都失去意义,这种词汇存在对汉语来说实在是太难受了。汉语仿佛存在一种非把它改造过来不可的“语言意志”,即使你是血缘高贵的“台吉”,也必须意译成可分割的“太子”才能在汉语中获得生存权。正是这种不可抗拒的语言意志促使“佛陀”读音简化,就是说对于这种“语言意志”法力无边的佛陀也无可奈何,只能“服”了,也正是这种语言意志促使原本是多音节读音的汉字全都演变成了单音节!
六、古音拟构的人类学思考
从宏观上描述,迄今为止的人类历史可分为两个阶段,或者说人类已经历过了两个时期,一曰“分”,二曰“合”。
人类在“分”化中产生,在分化中繁衍扩散开来。原始人类从非洲慢慢扩散至世界各地,在扩散中他们改变成了不同的肤色,产生出不同的语言,选择了不同的生存方式。在分化过程中逐渐出现各种民族的源头,人类在分化中崛起于蓝色地球上,其行为方式也与野兽世界渐行渐远。
人类文明则是在“合”的过程中起源的。人类分化到一定时候,不同的族
我们这个星球没有给人类148类最终会在这个不能无限扩大的大陆某处相遇,
提供无限大的生存空间,人类必然在扩散后走向汇合,不管是东方还是西方,人类文明全都在不同民族的融合中萌发出来。不同族类的征服和融合,不同文化的碰撞和吸收,乃是人类文明起源的不二途径,世界上没有一个文明是从单一民族,单一文化中产生出来的。
但东方文明确不像儒家所描述的那样在脉脉温情中产生,而是在血泪中潜行,当亚洲东部两支有着不同生存方式,操两种完全不同语言,一开始无法用语言交流的人类分支相遇的时候,他们把对方看成野兽,并不会意识到对方与自己是一样的人,当然不会施以人道,因为其时人类还不具备现代人才具有的那种人性。
考古显示人类很可能曾在长时间里把另一类族群当作猎取的对象,用作食物来源。当我们看到自然界中大猩猩以其他灵长类动物为主要肉食来源的时候,就会觉得如此推测的可能性是存在的。当远古人类发现猎获的另一种人比牛马有更好的使用价值时,才不会当作食物吃掉。就是说早期人类必定有过一段兽性大过人性的时期,有过一段兽性慢慢褪去,人性慢慢显现的时期。
考古显示,华夏文明从一种非常典型的奴隶制中起源。笔者以为,这种典型的奴隶制出现的历史条件就是当时人性尚处于蒙昧时期,奴隶主们并不觉得杀戮奴隶用以殉葬与杀戮牛羊“以为死人粮”有什么不同,不觉得使用牛马与使用奴隶有所区别,这种人性发育的低水平才是那种严酷奴隶社会存在的基础条件,而不是什么“生产力水平”,或者“经济基础”之类的东西,那种生产力水平低下会导致奴隶制的说法实在难以找到经验基础。一定是人的观念,或者说人的价值取向导致了这种社会形态的出现。
笔者进一步推测,远古东方两大民族先民在人种特征上也会比如今有更大的差别,可以肯定两大民族先民在外貌体征上的差异会在民族融合过程中变得越来越小。总之,远古时代是不可能产生圣人的时代,孔儒们杜撰出来的所有远古圣贤都是假的;而民族融合之缓慢,奴隶社会之漫长则会远远超出人们原有的想象!
关于华夏文明起源,儒家编造出来的第一个圣人是所谓的“燧人氏”,儒家认为“火为百德先”,天下文明肇始于圣人之火德,例如《太平御览》就如此说:
遂明国有大树,名遂,屈盘万顷,后世有圣人游明之外,至于其国,见此树下,有鸟啄树,粲然火出,圣人感焉,因用小枝钻火,号燧人氏。人随笔汉字与阿尔泰语渊源关系149
又曰:
上古之世,民食果蔬蚌蛤,腥臊恶臭,而伤腹胃,民多病,有圣人作钻燧取火,以化腥臊,而民悦之,使王天下,号之曰燧人氏。
儒家认为人类一开始便进入了一个“以德王天下”的高尚时代,远古时代是非有美德不能称王,先王“燧人氏”之所以有天下,乃是因为有大德于先民。
且不说“有鸟啄树,粲然火出”何等荒谬,“小枝钻火”也缺乏经验基础,笔者以为“人类文明始于用火”就是一个非常错误的观念。
人类使用火与陶器的历史已经十分久远了。火与陶乃是人类的标识而不是文明的标识,其所对应的是人类的历史而不是相对短暂的文明史。
人类的生理结构表明人只能吃比较精细的食物,且是以吃烧煮过的食物为主的一种动物。只有烧煮过的食物才适合人类的肠胃,长期吃烧煮过的食物,人类才出现了其他动物所没有的发达的大脑,人类的进化和出现都与吃烧煮食物有关。就是说火与陶在人类的进化过程中起过重要作用,人类使用火与陶历史之久远会远远超出人们原来的想象。这些都不可能是圣人教导的结果,就像汉民族先民的农耕不可能是“神农”教导的结果一样,数万年以前他们已经选择以农耕为生了。
笔者以为,历史研究者在描述华夏文明起源史的时候,一定不能离开这样一个已经被考古挖掘反复证明了的历史前提,那就是先秦时代是一个等级森严的奴隶社会,一个人道尚未萌现的时代。在那个社会里,低贱的奴隶可以像猪牛狗马一样成百上千地用于殉葬。在这个血腥弥漫的时代里不可能产生出大德之圣,就像千年沙海中不可能长出牡丹花一样,如果有,那一定是人为插上去的假货。历史研究者如果本着儒家观念一味赞美陶醉其间,蒙羞的乃是人类理性。
孔儒学说描述出来的先王时代虽然美妙但与历史真实无关,而本于孔学,源自儒术的名言“得人心者得天下”,也不应当继续成为我们描述中国历史的出发点和目的地。中华文明史其实就是一部北方游牧民族不断南侵征服农耕民族,建立起大大小小奴隶制国家的历史。征服者实在无需“人心”,要人心何用?而成为奴隶也不会是汉民族先民心之所向的事!
笔者以为,当两支人类初遇,互认对方为“野兽”的一个重要原因,就是他们说完全不同的语言,语言障碍会导致无法交流沟通而视同野兽,只有随着接触交往的增多,人性才会被慢慢唤醒并萌发,最终他们会意识到对
“人”,但那是一个十分漫长的历史过程。150方与自己是一样的
当我们思考设想华夏文明起源时期为何呈现出来的是一种典型的奴隶制的时候,最合理的解释是,奴隶和奴隶主是说两种完全不同的语言的人。
人是社会性动物的事实排除了人在同类同族中无休止残酷施暴的可能性,这一点甚至可以从动物界中得到印证,有共同语言的同类间应不会出现如此典型的奴隶制。满州女直固有的“同类不相为奴”的习俗也引导我们做这样的推测:先秦时代那种典型的奴隶制应有一种语言基础,那就是统治者与被统治者说两种完全不同的语言。
无法用语言交流的情况下,人是可能把对方视为兽类的,这甚至可以在近代找到佐证。如16世纪初,当欧洲白人侵入美洲的时候,他们确没有把见到的印弟安土著当人看待,对土著屠杀施虐的情形是随着交流接触的增多而减少的,应知其时欧洲已沐浴现代文明的霞光,且那些殖民者都是基督徒,其时仍会发生灭绝人性的行为,那么在遥远的古代,在人类刚刚从动物界分离不久的时候,奴隶主表现得全无人性就不足为奇了,其实是一种必然。
如果推定奴隶主和奴隶是说两种完全不同语言的人,那么远古时代亚洲东部可能存在哪两种完全不同的语言呢?显然只能是多音节的古代阿尔泰语和单音节的百越先民语言,前者是北方的游牧民族使用的语言,后者是南方农耕定居民族的固有语言。中国历史上游牧民族奴役农耕民族的情况不断出现,反之则难以找见。历史经验告诉我们,那些奴隶主的人选非阿尔泰游牧民族莫属,他们虽然被称为“匈奴”,从字面上看他们好像应当为奴”,其实从未被农耕汉民族奴役过。
既然汉字产生在这样一种典型的奴隶制社会中,那么汉字古音拟构的方向就明白了,只能是多音节的阿尔泰语——这便是笔者从人类学角度思考得出的结论。
人类文明进程,从本质上来说,就是人如何看待同类的观念不断演变的过程。人性最终覆盖了兽性。
现代文明的发展趋势就是在世界范围内,人开始把各种肤色、各种语言的人,都看成与自己一样的人,都有存在的价值。可以肯定,在遥远的将来,世界上所有的人最终将被相互接纳。
七、可疑的古代汉语
上古汉语中的对话简奥得令人生疑:如《诗经・郑风》:人随笔汉字与阿尔泰语渊源关系151“
溱与洧方涣涣兮,士与女方秉蕳兮,女曰:“观乎!”士曰:“既且。”
上面的男女对话只有两个音节:“观乎”—“既且”,而且只有“观”和“且”有实际含义。古人真的如此说话吗?他们为什么如此这般惜“音”如金吗?不过意思倒是大体可以理解,因为这个“且”是“祖”的原始写法,并且是个高度象形的字,象形一个男根。
又如《尙书・舜典》:
帝曰:“俞,咨!垂,汝,共工。”帝曰:“俞,往哉!汝谐。”
佥曰:“垂哉!”佥曰:“盖哉!”帝曰:“来,禹!汝亦昌言。”
禹拜曰:“都!帝,予何言?余思日孜孜。”皋陶曰:“吁,如何?”
这是谁在说话?为什么好像是哑巴的手语?!哑巴因为发声器官残疾,只会发出几个依依哑哑的声音,如果不附之以手势,就无法表情达意,古人难道都哑巴了?
非也!如果上文中每一个字都有两三个音节,语言就流畅起来,变成正常人在那里说话了。因为古人肯定不是哑巴,也可以推定上古汉字原本是多音节读音。
让我们再来看一段帝王文告。《尚书・大诰》:
王曰:“若昔朕其逝,朕言艰日思。若考作室,既底法,厥子乃弗肯堂,矧肯构?厥父菑,厥子乃弗肯播,矧肯获?厥考翼其肯曰:予有后弗弃基?肆予曷敢不越卬敉宁王大命?若兄考,乃有友伐厥子,民养其劝弗救?”
这是什么人的语言?怎会如此不堪卒读?汉民族先民曾如此这般说话吗?非也!这不可能是汉民族先民在说话,必定是当时汉字不是今天这般读音。
应知民族语言的历史所对应的是人类的历史,民族的固有语言就像一个民族的外貌特征一样是相当稳定的,语言的高度稳定性来自其无比久远的历史积淀。上面的话语如果真是汉民族先民在说话,我们不可能如此完全听不懂。
唐代韩愈有言:“(尚书中的)周浩殷盘,诘屈熬牙。”读那些古文,你的嘴巴一下子就僵硬了,难受极了。上古汉语即所谓的“雅言”为何如此艰涩难读?
152笔者以为上古汉语之所以如此“诘屈熬牙”,就是因为它原本表达的是
多音节的阿尔泰语,不是今天的单音节读音。我们看到上面的文字中几乎没有表示语法关系的虚词,其人称代词(朕、于、若)也与汉民族口语不相符。
阿尔泰语的特点是每个词汇有一个词根,词根附加一些语法成分后就能扩展成一个有特定含义,并特定语法作用的派生词,在阿尔泰语中表示语法意义的附加成分总是后缀于词根后面,就是黏着于词根后面,上面这些汉字其实是古代阿尔泰语的词根词,当操阿尔泰语的古人读上文的时候,就会根据阿尔泰语的习惯,把那些表示语法关系的后缀音以及表示语法意义的虚词,自然地、自动地附加上去,就像我们看到“CCTV”字样,在庄重的场合就会自然地读成“中国中央电视台”,或者“Chinese Central Television”,就是说上面《尚书》中的帝王律令一旦用阿尔泰语诵读时,就不再是诘屈熬牙了!
原始分布的两大语言一旦开始接触,将会怎样互相影响?笔者以为,当两种语言并存的时候,由于社会地位的不同,强势语言会对弱势语言形成吸引态势。这可以从下面一则元代“圣旨”中看出来:
延祐三年九月初七日苫思丁奏:冯少监如今教做太监,蓄同知做少监,阿的迷失,张少监他每都是先勾当来的人有4,如今递升的新人来的,要他旧勾当
的之上画字有4,我他每根底依例说4呵,他每不听有4,公道奏呵,奉圣旨,那般体
例那里有4?随朝衙门有先来后到,教递升的冯僧儿,阿的迷失之下画字者,萧
少监,张少监之下画字者,幺道,圣旨有4来。(按:重点号为引者所加)
我们知道元代的官方语言是蒙古语,蒙古语是社会的主流语言,处于强势地位,汉语处于弱势地位,由于受到蒙古语吸引,行文就会向其看齐,不由自主地向主流语言靠拢,于是弱势语言出现扭曲。上面的圣旨读起来不伦不类,就是这种扭曲的结果。从这份圣旨中我们可以看到阿尔泰语有别于汉语的语法特征:主—宾—谓结构,都是倒装句,谓语动词都在句子的末尾。圣旨里的谓语“有”都在宾语之后。汉语则是主—谓—宾结构,动词绝不会出现在最后,两者区别明显。由于元朝存续时间不长,汉语扭曲以适应强势语言的现象随着元朝的消失而消失了。
今天阿尔泰语有三大系,即蒙古语,突厥语和满洲语,他们在语法结构,即语序上完全相同,就是主—宾—谓结构,举例说明之:
维吾尔语 Tursun mu`allim-ni yoqla –p lal-di
吐尔逊 老师 看望(状态成分后缀于谓语动词之人随笔汉字与阿尔泰语渊源关系153
后)( 译文:吐尔逊看望老师了。)
蒙古语 tere tex ber –j gar-j
他 斧头 抓(状态助词后缀于动词之后)(译文:他拿起斧头出去。)
锡伯(鲜卑) bo nimxa dgave –m gene-m
我们 鱼 抓捕(状态助词后缀)(译文:我们捕鱼去。)蒙古语 bi ene mori –yi unun -ba
我 这 马 骑 去(状态成分后缀)( 译文:我骑这马吧。)
满洲语 bi mandzu xargen ara-me
我 满洲 字 写 (译文:我写满文。)
回鹘语 Tursun kitab –ni oqu-di
吐尔逊 书(有后缀)读了(有后缀)( 译文:吐尔逊读了那本书。)
从上可知,三大阿尔泰语语法特征高度一致,他们说话全都是倒装句,这种一致性显示出三者可能有共同的起源。
但我们看到,古代汉语也是这种倒置语序,古人说话也习惯把谓语放在宾语之后,例如:
殷墟卜辞:“不我杀。”(不要杀死我。)
《尚书・多士》:“无我怨。”(不要怨恨我。)
《左传・襄公》:“惟余马首是瞻。”(看我的马首。)
《孟子・梁惠王》:“他人有心,余忖度之,夫子谓也。”(即“谓夫子”,正如先生所说。)
《左传・隐公》:“我周之东迁,晋郑焉依。”(“晋郑焉依”即依靠晋国,依靠郑国。)
《孟子・离娄下》:“谏行言听。”(行谏言,听劝告。)
成语“何罪之有”就是一种古代阿尔泰语的残留,谓语“有”出现在句子末尾,这是阿尔泰语的特有表达方式,举例阿尔泰语短语如下:
menin luvitim bar(译文:我有字典)
我的 字典 有
Unibn qalimi yoq(译文:他没有铅笔)
他的 铅笔 没有
154阿尔泰语的又一特征,判断词“是”总处在句子最后:
我们是工人)
我们 工人 是(复数后缀)
Bu Menin ukam bolidu(译文:这是我的弟弟)
这 我的 弟弟 是
我们看到古代汉语通常也是这种语序:
《左传・隐公》:“制,巌邑也4。”(“制”是险要的地方。)
《史记・项羽》:“项籍者,下相人也4。”(项籍是下相人。)
《左传・隐公》:“都城过百雉,国之害也4。”(都城太大是国的隐患。)
古代汉语中常见这种不符合汉语习惯语序的现象,以先秦早期为多见,汉代以后便迅速减少并消失,这与汉民族的形成过程吻合,或者说正是这种历史过程,在汉语言文字中留下了难以磨灭的痕迹。
为了更加形象地描述华夏文明起源过程中曾经有过的特殊语言现象,需要提供一个参照系、一个标本,以便比照说明。
上海开埠的时候,黄浦江上曾有一支流,它从外滩起曲折西行,连通苏州河,这条河原本没有名,河两岸原是一片低矮黝黑的小屋,河边杂草丛生。但随着上海的开埠,这条河两岸迅速繁华起来,外国轮船驶进黄浦江到达十六铺一带停泊,外国水手们会迫不及待地沿着小河涌上岸去,因为那里有人在招揽生意,能为他们提供各种各样的服务。由于此地洋人特别多,这条河便有了“洋泾浜”的称呼,河浜里还产生出一种“洋泾浜英语”。
众多与洋人打交道的码头苦力是洋泾浜英语的发明者,由于他们长期跟随在洋人后面找活干,主要是搬运笨重的货物,如水泥,他们渐渐地熟悉了洋人的一些口语。例如英语水泥发音“水门汀”。每当轮船来到,他们便迎上去问:有水门汀装卸否?当活儿干完,他们会说向洋人说“拉斯克”(Last)。英语yes 被他们说成“来三”,“不来三”就是“不行”。
洋人的中国仆人也会说几个英语了,一天洋人回家发现玻璃打碎了,大吃一惊,仆人赶忙回复说:“in side吱吱吱,out side喵喵喵,glass 克郎当!”洋人听懂了,原来是猫抓老鼠闯了祸!
这样一些不伦不类的英语被称为洋泾浜英语,那是近代上海华洋杂处出现的奇特语言现象,许多此类语言至今留存在上海话中。
古代汉语就是两种截然不同的语言——多音节的阿尔泰语和单音节的汉语——交融演化的产物,由于开始的时候阿尔泰语则是强势语言,地位犹如上海开埠时的英语,土著民族的固有语言也就慢慢被强势语言扭曲了,甚至变得不伦不类了。人随笔汉字与阿尔泰语渊源关系
155
我们确应当思考这样一个问题:古代汉语,即所谓的“雅言”与汉民族的口头语言之间为何存在如此巨大的差异?应知这种特殊的语言现象在世界历史上也是绝无仅有的!从来没有人对这种特殊现象的产生原因做过研究说明,从来没有人给出过一种合理的解释。儒家则认为那就是雅言,因为记录着圣人们的话语,无比高雅,无比美妙,无比圣洁,应当万世不易,他们就这样虽然承认佶屈聱牙,但又津津乐道地吟诵了数千年,反对任何有关语言改革的企图。
古代汉语是汉民族形成过程中,那种特殊历史的积淀物,乃是华夏文明起源特殊历史状态的一种缩影,为了更加形象地描述古代汉语的成因,似可以作这样表述:古代汉语就是古人说的“洋泾浜英语”!
八、关于汉字与现代汉语的思考
过去也有一些学者关注过汉语与阿尔泰语历史上的互相影响,但他们的着眼点是汉语如何影响到了阿尔泰语;至于汉字起源,出于传统的文明起源观,他们不可能也不愿意把汉字读音向阿尔泰语读音溯源,从来没有人愿意迈出这一步。
汉字溯源难以突破的原因还有研究材料的制约。历史上阿尔泰游牧民族少有自己的文字传世;儒家又鄙视戎狄之语,很少去记录古代阿尔泰语,因此可供研究比对的语言材料少之又少,导致研究难以深入。汉字溯源研究的进展和突破,从根本上说,有赖于现代语言学的出现和成熟,在中国古代,在未有世界性语言系属宏观研究的过去,在未有记录语音的科学手段的时候,汉字的溯源研究其实是根本无法进行的,环境条件不具备就无法开展,就是说溯源研究其实直到今天才具备了相当的条件。
汉字必定有过漫长的“汉化”历史,可能曾历时数千年之久,汉字的汉化虽然早已完成,但留下了一些痕迹,指认这些痕迹也有助于我们理解这一过程。
这种痕迹首先在古代辞书中存在,例如:
扶摇,《尔雅・释天》云:“扶摇谓之猋(飙)。”这其实在说“飙”字原来有两个音节,读作“扶摇”,扶摇和飙同时存在,则是汉化还没有彻底完成就停止了的表现。
鶌,鸟名,又写作“鹘嘲”,《礼记・疏》云:“鶌,音九物反,音嘲,后世谓之鹘嘲。”就是说“鹘嘲”后来缩音成了一个音节“鶌”。读作两个音节的时候是
一个音节的时候是汉语。156阿尔泰语,
汉语中的双声词很可能也是阿尔泰语的残留,双声词是不能分开的,分开后便没有了意义。我们确可以把那些双声词看成没有单音节化的阿尔泰语词汇,就是说有些阿尔泰语词汇以原形残留在汉语之中,如:
“畔换”,《玉篇》:“跋扈亦作伴换。”《诗》云:“天然伴换。”伴换,跋扈也。《汉书・叙传》曰:项氏畔换,韦昭:“畔换,跋扈也。”异写说明这个双声词只是汉字注音。
又如:倘佯——尚阳——尚羊;逶迤——委蛇——委佗——郁夷——威迟,特别是“逶迤”,古代多达三十余种写法,这只能说明它不是汉语固有的,如果它出自汉语本身,就不可能出现如此众多的异写。双声词就像没有完全消化的食物,基本上以食物原形残留在汉语中。
汉语中的儿化音也是阿尔泰语的残留,阿尔泰语,特别是蒙古语有浓重的“儿”化音,即卷舌音,发音时舌头常处在卷起状态,这个特点在“普通话”中留下了深深的印记。
《魏书》称南方人“鸟声禽语”,意思是说南方人说话像鸟鸣一样不会卷舌,这是事实,也是古代百越语的共同特点。历史上阿尔泰游牧民族不断融入汉民族,中国人中的阿尔泰血缘浓度自北而南呈递减状态,语言中卷舌音多少反映这样一种血缘浓度,儿化音越重的地区阿尔泰游牧民族的血缘浓度越高。
古代音韵学家就已经发现,上古以来汉字读音变化的趋势是,“浊音”向“清音”转化,这其实就是阿尔泰语向单音节靠拢,向现代汉语发展的过程,阿尔泰语带有浓重的卷舌音,即“浊音”。卷舌音逐渐减少的过程也是汉字的汉化过程。
我们发现甲骨文能解读出来的不到一半,大多无法解读,不知所云,即使是后来的金文,很多也无法释读,这是为什么呢?一个文字体系总是慢慢丰富起来的,词汇量会有一个从少到多的过程,起先不够丰富,后来不断增多。早先产生的文字应是最基本的词汇,基础性的词汇,最有生命力的词汇,这些词汇不可能大量地死去,解读不出来,只有一种可能,就是因为它表达的原本不是汉语,这些甲骨文金文由于没有经过汉化的过程,最后无奈地完全地死去了。
从《说文》《切韵》等古代字典中也可以看到,大量先秦时代的古汉字没有被继承下来,笔者以为,就是因为它们原本表达的不是汉民族的固有语言,原本不是单音节读音,被后人强行单音节化,缺少了一个约定俗成的演变过程,导致没有被广泛接受,最后也只能消失了。人随笔汉字与阿尔泰语渊源关系157
那么,现代汉语是这样形成的?笔者以为汉字的流传和使用是现代汉语的历史成因。
可以这样说,世界上没有哪一种民族语言有过汉语这种历史成因,世界上没有哪一种民族语言像现代汉语那样年轻!
由于汉字最初的创制者和使用者是作为统治阶级的阿尔泰游牧民族,汉字随着大规模奴隶主政权的产生而产生,由阿尔泰游牧文化内在特性使然。早期汉字的主要用途是占卜祭祀,文字始终与权威相伴,与神灵有关,汉字一开始就带着神圣的光环,必然成为人们敬畏的对象,汉字读音以及由这种文字读音和记录方式形成的书面语言便有了强大的渗透力,对民族语言具有示范作用和标杆作用,必然对汉民族原始语言产生巨大的潜移默化的影响。
汉民族对于汉字的敬畏自古已然,即使在半个世纪以前,人们还可以在民间看到这种情形:大人们神情严肃地告诫小孩,写有字的纸是不可掉在地上的,因为不小心会被脚踩上;文字是很神圣的,写有字的纸绝不能带进厕所,否则就是对文字的亵渎,神灵要发怒的!我们的祖先就这样世世代代对汉字充满敬畏。
由于汉字长期笼罩着神圣的光环,人们的口头语言就会被文字语言所吸引,文字词汇会慢慢渗透到民族语言中去,最终取代汉民族口语中固有的同义词,原来的“土话”不知不觉中向“雅言”靠扰了。
可以想见远古时代土著农耕民族的语言,即百越语方言中的固有词汇大多已经被来自文字的词汇替换掉了,换言之,这种已经被替换得面目全非的古代百越语就是今天的现代汉语,从世界语言史角度去看我们的“普通话”,这种语言的历史是很短暂的。
笔者以为现代汉语就是以单音节的百越先民口语为母本,以单音节化了的汉字为父本,在象形文字神圣光环的引导下逐步形成的。在现代汉语的形成过程中汉字的作用不可低估,汉字扮演了非常特殊的角色,是汉字的长期使用造就了现代汉语。
就像冰川对于山脉的作用一样,漫长的冰川期可以极大地侵蚀山脉原有的地形地貌,但终究无法改变山脉的基本走向,冰川消退之后我们发现山脉依然存在——那就是汉民族语言的单音节特征,它坚如磐石,顽强屹立,丝毫没有改变!
在描述现代汉语成因时,我们其实可以把汉字比作化学反应中的触媒,化学反应炉子中触媒不可或缺,如果没有触媒作为介质,许多化学反应
或者难以持续发生,汉字在现代汉语形成过程中也具有如此这158不会发生,
种神奇的媒介作用。
笔者以为汉语形成时期离今天并不遥远,可能就在春秋战国时代,因为那是一个奴隶主大量没落、大量消融到社会底层去的时代,一个文字突然繁荣起来的时代。从这个时期开始,文字日益超出占卜祭祀的传统功能,成为表情达意、传递信息的工具,其时已经进入表达单音节汉语的时代了。春秋战国时期的社会大动荡、社会大变革,为汉语的形成提供了历史契机。
可以想见,经过数千年征服消融的风雨荡涤,经过数千年文字词汇的渗透,古代百越先民语言中固有的词汇已经被外来词汇替换得面目全非了。中国历史上这种由北而南的文化浸染和语言浸染,古人其实也不是毫无觉察,隋代颜之推《音辞篇》有言:“北杂夷虏,南浸吴越。”便是对这种历史趋势的生动表述,汉语即所谓的“音辞”受到阿尔泰语渗透和取代的历史已经非常久远了。当然百越语中的固有词汇并不会全都消失,今天南方偏远地区的方言中就保存了很多这种古老词汇,成为我们研究古代百越语的样本。
汉字的历史作用是不可低估的,正是因为汉字不是拼音文字,而是一种表意文字,“雅言”词汇不是汉民族先民固有的词汇,是一种外来成分,这种象形表意文字才有了读音上的可塑性,正是这种可塑性能造就出如此大范围分布着的现代汉语。
如果古代中国也流行拼音文字,那么史前时代早就存在了的众多方言即百越方言,不会以汉字为标杆慢慢趋向一致。拼音文字的不可塑性将使它难以化身进入汉民族的语言之中。因为汉字是象形表意文字,读音可塑,才使得使用这种文字的地方最终演化出一种共同语言,使得如此大范围内的原始土著方言不可抗拒地被这种文字语言所改造。
可以想见,如果古人使用的是拼音文字,体量如此巨大的汉民族不可能形成,因为共同的语言是一个民族赖以存在的基础。就是说汉字的这种特殊性还影响到了中华民族的规模以及中国的国家形态上了。为什么东方历史上总呈现大一统状况,而欧洲总是小国林立,出现大型国家的机率很小呢?可能与文字性状有关。西方人一直使用拼音文字,使用拼音文字会使一种语言长久地保持其本来的面貌;而不同语言是不同民族存在的基础。就是说那里民族众多、国家林立,可能与流行拼音文字有一定关系。
九、失传的文字
黄帝之时应已有文字,黄帝的帝国如此广大,他要发布命令,管理属国人随笔汉字与阿尔泰语渊源关系159
臣民,记载将士功过,祭祀祖先,占卜凶吉都离不开文字,文字会随着大规模政权的迫切需要而产生出来。
我们看到后世的西夏、辽、金、蒙古和满洲,他们在帝国创立前都没有文字,但创立后马上着手创制自己的文字,因为管理帝国实在离不开文字,非创制不可了,大规模国家形成确是人类文明的主要推动力,世界各地古老文明都如此,尤其表现在文字的创制中。
我们还应当看到,最需要文字的是统治者,而不是被统治者,奴隶者不需要文字,文字的创制者必定是作为统治阶级的奴隶主们。整个华夏文明形成时期阿尔泰游牧民族都扮演了统治者的角色,中国最早的文字所表达的必然是古代阿尔泰语,文字的读音必定是多音节。
考古显示,世界任何文字开始的时候都是象形文字。世界上最早的文字七千年前出现在两河流域的美索不达米亚苏美尔文明中,称之为楔形文字,早期阶段也是象形文字,图形特征很明显,但属于拼音文字,如图:
6100年前形状 4500年前形状 2700年前形状
楔形文字形状的演变
稍后出现的古埃及文字更是彻底的象形文字,画着完整的蛇、完整的鸟,但与苏美尔人的楔形文字一样是拼音文字,那蛇和鸟分别代表元音或辅音。亚楔形文字和古埃及文字有从象形到抽象符号的演变过程,只是他们始终是拼音文字而已。
黄帝时期的文字可能是模仿美索不达米亚楔形文字而来,黄河流域与两河流域相距千万里,但对于以征战掳掠为生的马背民族来说这并非难以
如果黄帝确有命仓颉造字的史实,仓颉最有可能的是借用西方已经
160跨越。
存在千年之久的楔形文字,就像元代的八思巴一样,为忽必烈编制出一套拼音符号来,以记录黄帝的语言,这倒是能一个人完成的,至于一人造出众多的象形会意字则是完全没有可能的事。
我们确可以从《史记》中解读出这样一种历史信息,就是在汉字之前,或者在汉字流行的同时,中国可能也曾有过拼音文字。《史记・五帝本纪》:
太史公曰:学者多称五帝,尚矣。然《尚书》独载尧以来,而《百家》言黄帝,其言不雅训,荐绅先生难言之。
司马迁出身于世袭太史令之家,太史令是专门为皇家管理图书档案的官职。在其父亲司马淡死后,司马迁袭任父职,故司马迁总是借其父亲“太史公”之口评说历史。祖上世代担任此官职,能见到皇家藏于“石室金匮”中的珍稀古籍,如《百家》,据说此书记载的是黄帝的事迹,但父子二人竟看不懂,这是为什么?司马迁见识广博,还交结了当时许多学识渊博的士大夫,即“缙绅先生”,竟然都不能解读古籍《百家》,这是为什么?乃是因为“其言不雅训”。
这“不雅训”可以有两种解释:一是卑俗,缙绅先生们或许不愿降低身份去引用或者去研读,但总能读懂,只是不愿而已。二是完全看不懂,不知所云,书中的文字早已失传,无人能晓了。事实上可以立即排除第一种情况,因为黄帝是圣人,与黄帝有关的书籍,岂有卑俗之嫌?可以这样推测,《百家》即使是用最早期的古汉字写成,如类似甲骨文,金文中的文字,司马迁这样的博学之士岂能不晓?于是另一种可能似乎出现了:《百家》可能是用另一种完全不同的文字写成,到司马迁之时已经谁也看不懂了,如此这般,百家》最终失传便不可避免了。
这就向我们传递了一个历史信息:司马迁看到过一本谁也看不懂的书,里面的文字没有一个人能认识。笔者以为,这种文字属于拼音文字的可能性是最大的。
中国历史上可能有过另一种文字的信息不仅出现在《史记》中,许慎《说文》有言:“五帝三王之世,改易殊体,封于泰山者七十有二代,靡有同焉。”意思是说五帝三王各有不同的文字,他们祭祀泰山刻于石头上的文字都不一样。许慎又说:“(汉初)时有六书,一曰古文,孔子壁中书也。二曰奇字,即古文而异者也。三曰篆书,即小篆,秦始皇使下杜人程邈所作也。”就是说许慎之时尚有一种“奇字”存世,只是无人能识,故称之为“奇”,如果只是书写形式特别,仍然能识读那就不“奇”了。许慎还说:“(说文)其称《易》孟氏,《书》人随笔汉字与阿尔泰语渊源关系161《
孔氏,《诗》毛氏……皆古文也,其于所不知,盖阙如也。”意思是说除了这些正统古籍之外,还有一些我“所不知”的文字,就不在收集范围之内了。由此可知,司马迁一百多年后,仍然有人看到过那种无法识读的文字。
比司马迁早五百年的孔子,不但看见过那种奇怪的文字,而且还对此研究过一番。孔子曰:“吾犹乃史之阙文,今亡也夫。”意思是说我研读过一种“阙文”,因为有些古籍用“阙文”写成,只是现在已没有人能读懂了。
先秦古籍中有众多的同名异写现象,也从另一个角度指向这种推测。这种失传的文字与象形表意汉字曾并存过一段历史时期,不同时代的译者选用不同的汉字去注音翻译那种奇文古籍,就会产生这种同名异写现象。
例如秦人的祖先名“伯翳”,但《尚书》却记作“伯益”。如果这个名字一开始就写作“伯翳”二字,就不会出现另外的异写,随便把别人数千年前的祖先名字改掉的可能性在华夏文化中是不会出现的,乃是由这种文化的特质决定了的。只有此种情形下会出现,即这个祖先名开始是用拼音文字记录的,后来那种拼音文字使用者越来越少了,于是有人用汉字去注音这个祖先名,异写就不可避免地出现了,那种“奇文”甚至可能比汉字更早出现,可能流行过很长一段历史时期。
美索不达米亚的楔形文字写在泥板上,经火烧烤后硬化了,由于埋在那片干燥的土地上,得以大量保存下来,那已是定居民族使用的文字。而三皇五帝时期的中国还迁徙不定,不可能会把文字刻写在难以搬迁的泥板上,如果黄帝把文字写在兽皮上就难以保存下来,没有考古发现也属自然。
《尚书・多士》:“夏人有典有册”,说明夏后之时就有文字典籍了,夏代应已经有比较成熟的文字系统了。蝌蚪文又称“夏篆”“峋嵝文”,一般被认为是夏代的文字,头粗尾细,委蜿曲弯,确有点像楔形文字,但一直没能解读出来,或许就是一种拼音文字。
甚至楚国的古史《祷杌》也可能是用拼音文字写成的。在古书中“祷杌”被注解成一个怪物,他所有高贵血统,出自颛顼,但听不懂人言,也不会说人话,成了一个狂暴乖戾的怪人。对此似乎应当这样解读:由于《祷杌》是用楔形文字写成,最后无人能识了,就是无法听懂“祷杌”在说什么了,一本无法读懂的书被讹传成不说人话的怪人是可能的,且楚国一向被儒家认为非正统,楚国不是周天子所封国,历史上总是与周天子作对,由此注解就不足为奇了。
楔形文字最终被淘汰可能与拼音文字表达汉民族先民的单音节语言效果不佳有关,拼音文字表达单音节语言的确没有什么优势,汉语拼音可
162以为证,