汉语语法研究的问题和方法上海师范大学对外汉语学院齐沪扬2007年4月 面向21世纪的 汉语语法研究的状况 汉语语法研究中的一些问题 语法研究中采用的方法 面向21世纪的汉语语法研究的状况 经过整整一个世纪,汉语语法研究无论在理论体系的构建上,还是在语言事实的描写上,或者在研究方法以及研究手段的运用上,都有了很大的发展. 80年代以来,国外语言理论的介绍和运用,对汉语语法研究起到了极大的推动作用,语法研究的深度与广度都有很大的突破.过去的深厚基础与发展态势,为21世纪的现代汉语语法研究的发展营建了一个良好的环境. 面向21世纪的汉语语法研究的状况 但是,发展势必会遇到新的困难,21世纪汉语语法研究将会受到极为严峻的考验,这种考验究竟是什么呢?我们认为主要是理论上的合理解释和应用上的直接服务.正如陆俭明、郭锐两位先生所说的"汉语语法研究所面临的挑战主要来自理论和应用两个方面" . 面向21世纪的汉语语法研究的状况 21世纪的汉语语法研究,应该摆脱过去某一种语言理论一统天下的局面.寻找语法形式与语法意义之间的对应关系,是语法研究的终极目的,探讨这种对应关系背后的认知心理机制则是21世纪汉语语法研究的中心课题.我们认为可以从以下两个方面做起: 1、建立功能范畴观 2、对语用因素进行句法处理 面向21世纪的汉语语法研究的状况 就目前情况看,基础研究与应用研究的脱节依然是比较突出的现象.这种脱节现象的产生有多方面的原因,如语法研究的水平、计算机技术的状况等,但目的性不明确也是形成这种现象的原因之一.这一问题的解决有待于两个学科甚至更多学科研究者的深层次的合作与沟通.应用需要语法理论的支撑,但更应该强调可操作性,另外还要清楚地了解到两种应用对语法理论和语法知识的要求是不一样的.从语法研究的应用角度看,在为对外汉语教学和汉语信息处理服务上,还可以考虑以下两个问题. 面向21世纪的汉语语法研究的状况 在对外汉语教学上,要打破共时现象与历时现象、共同语与方言、本族语与外族语之间的界限,关注语言共性、类型学研究的人将会增加. 面向21世纪的汉语语法研究的状况 面向汉语信息处理的语法研究,其特点是更加注重语法规则的形式化和精密化,更加注重从计算机自动理解和自动生成句子的角度来提取语法规则,换一句话说,研究的重点和方法应该是:抓住计算机可以理解的"形式标记",对显示句法结构功能类别的标记词(语)、功能词(语)进行语法属性的精细描写,对由这些功能词(语)构成的语法结构框架进行精细描写. 汉语语法研究中的一些问题 一、与信息处理有关的问题 1、什么是自然语言和人工语言 自然语言是人类历史长期发展而约定俗成的产物,是人类区别于其他动物的重要标志之一.人借助于自然语言交流思想,达到互相了解,组成人类社会生活;人还借助于自然语言进行思维活动,认识事物的本质和规律,创造了人类的物质文明和精神文明.与此同时,自然语言又是人脑的高级功能之一,是人类特有的一种最重要的智能. 汉语语法研究中的一些问题 在电子计算机软件中,早已设计了许多人工语言,例如BASIC、PASCAL、COBOL、LISP等程序设计语言.人工语言的设计原理应该说与自然语言是一致的,是遵循着形式语言的规律和法则的. 汉语语法研究中的一些问题 2、自然语言与人工语言的区别 由于形式语言的理论既适合于自然语言,又适合于人工语言,而人工语言的设计又是遵循着形式语言的规律和法则的,所以,在形式描述方面,这两种语言之间,确实存在着某些共同的性质.但是,自然语言毕竟是人类社会中活动着的语言,比人工语言自然要复杂得多.自然语言与人工语言在以下四个方面是存在着十分明显的差异的. 汉语语法研究中的一些问题 (1)自然语言中充满着歧义,而人工语言中的歧义则是可以加以控制的; (2)自然语言的结构复杂得多,而人工语言的结构则要相对简单一些; (3)自然语言的语义表达千变万化,至今还没有一种简单而通用的途径来描述它,而人工语言的语义则可以由人来直接定义; (4)自然语言的结构与语义之间有着错综复杂的关系,一般不存在一一对应的同构关系,而人工语言的结构和语义之间有着一一对应的同构关系. 汉语语法研究中的一些问题 3、自然语言处理的研究 自然语言是人类特有的一种最重要的智能,智能化电子计算机不可能只研究人工语言,更重要的是研究自然语言处理.自然语言处理研究的早期,人们只是把机器翻译作为研究的中心课题;近三四十年以来,人们开始转入对自然语言的语法、语义、语用等基本问题的研究,并尝试着让计算机来理解自然语言,这就是"人机对话"的研究.自然语言处理除了机器翻译与自然语言理解之外,研究领域还扩展到情报检索、语料库、言语统计、词典编纂,语音自动识别与合成等方面,可以这么说,自然语言处理已经成为现代科学技术的一个研究热点. 汉语语法研究中的一些问题 汉语的自然语言处理中面临不少问题. 语言信息处理研究的实践表明,汉语分析碰到的问题要比印欧语系的语言,如英语、俄语等要多一些,主要的原因在于同汉语的语法特点有密切的联系.汉语的自然语言理解还有许多特殊的困难与问题. 汉语语法研究中的一些问题 (1)汉语的语序和虚词的问题 汉语的句法主要靠语序和虚词表示,但语序和虚词往往有其灵活的一面.这样,要把语序和虚词所带来的语法信息以形式化的方式提供给计算机,就变成一件十分困难的,要由语言学方面提供解决方法的研究工作了. 汉语语法研究中的一些问题 从语序方面说,汉语的句子普遍存在着"话题化"的现象,即不仅语义上的施事,而且语义上的受事、工具、处所、时间、方式、目的等,都可以提到句首充当句子的话题: 我昨天在家里用这把刀切肉→昨天我在家里用这把刀切肉→在家里我昨天用这把刀切肉→这把刀我昨天在家里用来切肉→肉我昨天在家里是用这把刀切的 因此,仅仅根据语序就很不容易判断语言成分的句法功能,给汉语句子的分析造成很大的困难. 汉语语法研究中的一些问题 从虚词方面说,存在着两方面的问题. 一是汉语的句子里,虚词常常可以不用,吕叔湘曾指出过下列句子中虚词都省略了: 路不好走,(因为)最近下了几天雨./我(在)前头带路. 一是同一个虚词,往往可以表示不同的概念.如: 他从日本来(介词)/他从不抽烟(副词) 我和小张说了这件事(介词)/我和小张都去过北京(连词) 虚词的问题给句子的分析,特别对文本的自动词性标注带来了很大的困难. 汉语语法研究中的一些问题 (2)汉语的书面形式的问题 汉语的书面形式是不实行连写法的,即是连续书写的,这样,词和词之间没有自然的界限.对于汉语的自然语言理解来说,首先遇到的就是要解决词的自动切分问题.然而,汉语又是一种缺乏严格的形态标志的语言,自动切词的难度无疑会增大.如下列句子中的切分就有两种不同的结果: 学生/会/很/兴奋----学生会/很/兴奋 上海市/中药材/商店----上海/市中/药材/商店 解放 大道 路面 积水问题 合法 政党 参与 国家 政治 生活 汉语语法研究中的一些问题 (3)汉语的词类与句子成分不对应的问题 计算机程序可以从词语的的形态变化中找到句法分析的依据和线索,例如英语往往可以根据形态来确定句子中的主要谓语动词.汉语的形态变化不丰富,词类与句子成分之间又缺乏一一对应的关系,给计算机处理带来问题.特别是即便在同一个词类里,还会有许多差异.例如形容词一般来说都可以作谓语和定语,但有许多形容词不能做谓语,有些形容词又不能直接作定语,这样就必须具体地说明不同的形容词作谓语和定语的条件.因此,形容词的句法功能问题就不能笼统地进行分析,因为计算机缺乏人那样对词类多功能性的理解能力,缺乏相应的背景知识和语言经验,靠语法公式来分析汉语对计算机来说是十分困难的. 汉语语法研究中的一些问题 (4)特殊的句式和句型问题 汉语中有许多自己特有的常见句式或句型,其中的语义关系比较复杂,给计算机自动句法分析带来许多困难. 汉语语法研究中的一些问题 "NP+VP+VP"是汉语的常见句式,是由一个名词短语带上多个动词短语构成的.由于动词或动词短语相互连接时没有明显的形态标志,计算机往往难以确定其中的主要动词,而如果主要动词判断失误,整个结构的分析就会失败.例如: 海外片商找刘晓庆谈版权/海外片商找刘晓庆买版权上述句子的不同在于VP2"谈"和"买"上,而不在VP1"找"上,"谈"具有[+协同]的语义特征,"买"具有[-协同]的语义特征,这种不同造成了两个句子及物性语义关系的差异.前句"谈"的施事是"海外片商"和"刘晓庆",后句"买"的施事是"海外片商".这说明即便是同样的句式,如果不能确定主要的动词,句法分析就有问题. 汉语语法研究中的一些问题 "NP+NP+NP"也是汉语的常见的句式,要搞清楚其中的各个NP之间的语义关系,必须研究它们与其他句式之间的转换关系.如: 眼镜的框子和镜片→(眼镜的框子)和(镜片)→(眼镜)的(框子和镜片)分析的不同,主要和连词"和"的辖域有关.又如: 昨天的小王的故事→(昨天的小王)的(故事)→(昨天)的(小王的故事)分析的不同,主要与切分的层次和"小王"这个NP的语义角色有关,而"小王的故事"又是有歧义的,"小王"可以表示施事,即"小王说的故事","小王"也可以表示领属,即"是关于小王的故事". 汉语语法研究中的一些问题 二、与对外汉语教学有关的问题: 对外汉语教学上有与自然语言处理相同的问题.例如NP1+被+NP2+VP1+VP2: 他被交通警叫去罚了一百块钱/他被交通警叫去写了一个检查像这样的句子,有汉语背景的人一下子也很难说清楚其中的差别,何况教外国学生识别,计算机处理时自然也有问题.其实主要的问题是介词结构"被交通警"的管辖范围有大有小: 他被交通警叫去罚了一百块钱——他被交通警叫去/他被交通警罚了一百块钱 他被交通警叫去写了一个检查——他被交通警叫去/他被交通警写了一个检查 汉语语法研究中的一些问题 对外汉语教学中的问题还在于: 1、母语教学中的规则在对外汉语教学中会遇到困难 母语教学中,谈到动宾结构的语义关系时,我们都知道是十分复杂的,例如"写诗/打毛衣"是表示结果的,"吃食堂/去上海"是表示处所的,"写钢笔/跳绳"是表示工具的.但是,外国学生就会造出这样的句子: 我们今天晚上吃南京路的馆子. 我写美国钢笔. 我跳荷兰进口的尼龙绳. 汉语语法研究中的一些问题 这种情况促使我们重新思考:A、在"吃食堂/去上海"、"写钢笔/跳绳"这类说法中,对充任宾语的词语有没有限制?B、"吃食堂/去上海"、"写钢笔/跳绳"这类说法在什么语境下才能使用?外国人学习汉语,要受到母语语法和目的语语法的负迁移.受母语语法负迁移所造成的语法错误容易纠正,如日本、韩国学生的"SOV"语序到汉语"SVO"语序的过程.受目的语语法的负迁移所造成的语法错误,则要经过深入的思考和研究后才能有效地改正. 汉语语法研究中的一些问题 2、尚未进行语言规范的现象如何对待 汉语语法中尚有许多未进行规范的现象,在对外汉语教学中也是很难克服的问题. 这样做难免不犯错误./这样做难免犯错误. 他没出国前一直在出版社工作./他出国前一直在出版社工作. 李涛,小心别摔交!/李涛,小心摔交! 他干了一晚上差点没累死./他干了一晚上差点累死. 程强弄了不一会儿就把电脑修好了./程强弄了一会儿就把电脑修好了. 除非张经理来请,他不去./除非张经理来请,他才去. 语法研究中采用的方法 20世纪语言研究形成了两大阵营:结构主义和功能主义. 结构主义认为研究语言就是研究语法或语法知识,句法是语法的基石,句法的解释基本上是建立在具有普遍有效的规则之上的.追求语言描写的形式化,对语言的实际运用和社会功能则较少考虑.而且由于规则的抽象性,难以从正面来证明规则的存在. 语法研究中采用的方法 功能主义认为语言研究的中心问题是透过语境和功能来解释形式,句法不是自足的系统,而是由语义、语用、篇章、功能等因素构成,并可从这些因素中推导出来.但功能与形式之间的关系很难建立,功能解释中涉及到的许多概念也常常会有不同的解释. 语法研究中采用的方法 总之,结构主义和功能主义在理论上都不是完美的,它们所提出的普遍原则其适用性都是有限的,即只具有相对的普遍性,不具有绝对的有效性,很难经得起语料的检验. 语法研究中采用的方法 西方现代语言学所确定的理论目标,是建立一个完整的具有普遍语法属性的语言系统,以保证生成所有语言中的所有可能的合乎语法的句子,使理想的理论模型得以实现.为了追求这个理论目标,西方现代语言学家采用的是一种"逼近法"(approximation)的研究方法. 语法研究中采用的方法 首先对部分语言事实进行观察,从中概括出最简的规则或规则系统,称作为第一理论逼近,然后再把第一理论逼近放在另一些相关事实中去检验,看规则是否可行,当第一理论逼近与某些语言事实发生矛盾的时候,不能"另起炉灶"再并列提出另外一套理论规则,而应主动积极地研究矛盾发生的情况,在事实与第一逼近之间找出规则条件限制上的不充分性(往往是条件限制过松),对已有的规则进行修改,进一步限制理论逼近中的条件,把第一理论逼近提升为第二理论逼近,从而使第二理论逼近不但能概括描述第一理论逼近所覆盖的事实,而且能同时覆盖与第一理论逼近相抵触的新的语言事实.依此类推,得出第三理论逼近、第四理论逼近……以至最后逼近"真理".下面通过一些实例,考察理论逼近法的具体应用. 语法研究中采用的方法 现代汉语中有这样一种句式"多+形容词(多+A)",例如: 这间屋子多大?/这儿到学校多远?/这口井有多深?于是,我们可以将这种句式表述为Ⅰ,作为第一理论逼近: Ⅰ、在询问程度时,可以使用"多+A"句式. 语法研究中采用的方法 但是,使用"多+A"句式询问程度时,会遇见下面例外:他说的话多真?/这种方法多对?按照理论逼近的方法论思想,当这种理论逼近与语言事实发生矛盾时,必须进一步限定理论逼近中的条件:我们发现,现代汉语形容词往往是成组成对的,也就是说,形容词经常处于对立的状态,但是对立的形容词会出现两种情况,一种是二项对立,如真/假、对/错、正/反等等,这种对立是非此即彼的对立;另一种是多项对立,如大/小、高/低、深/浅等等,这种对立的两项之间还能插入第三项、第四项……如"大/小"之间有"中","高/低"之间有"半高"、"半低"等等,询问程度的"多+A"不能用二项对立的形容词.因此,第一理论逼近应改成第二理论逼近: Ⅱ、在询问程度时,可以使用"多+A"句式,其中的"A",不能用二项对立的形容词. 语法研究中采用的方法 但是,第二理论逼近仍然不是完美的解释,因为我们还是遇到了如下的例外: 这间屋子多小?/这儿到学校多近?/这口井有多浅?在人们的意识中,还会把形容词分成积极意义的形容词和消极意义的形容词两大类,往往把"高、大、深、多"等看成是积极的,把与此相反的"低、小、浅、少"看成是消极的,除了不能说"多多"外,用"多+A"询问程度,只能用积极意义的形容词,这样,Ⅱ必须在作修改: Ⅲ、在询问程度时,可以使用"多+A"句式,其中的"A",必须用多项对立的且表示积极意义的形容词. 语法研究中采用的方法 有了第三理论逼近,是否意味着完全充分地解释了"多+A"这个句式在询问程度时的限定条件,也就是说已达到了理论的终点了呢?还不行,在下面的语言事实中我们又遇到了麻烦:这间屋子多宽敞?/这儿到学校多遥远?形容词的使用还会受到音节的影响:用"多+A"询问程度,双音节的形容词不能够进入这个句式,如果用了双音节的形容词,"多+A"就变成了一种感叹:这间屋子多宽敞!/这儿到学校多遥远!可见,我们还得对Ⅲ进行修改,从而得出第四理论逼近: Ⅳ、在询问程度时,可以使用"多+A"句式,其中的"A",必须用多项对立的且表示积极意义的单音节形容词. 语法研究中采用的方法 西方现代语言学在对待"例外"(exception)和"反例"(counterexample)的问题上,采取了与传统语言理论不同的态度:西方现代理论十分欢迎"例外"和"反例",认为与已有规则相矛盾的"例外"与"反例"是推动理论发展的动力,是进行理论逼近的依据,从不采取为维护已有理论规则,把"例外"和"反例"拒之门外的方法,而是主动积极地寻找"例外",把已有理论放在"例外"和"反例"面前,接纳它们,研究它们,从中找出理论上的不足,长期不懈地在下面这种理论建立模式中追求理论上的更大完美: 立论--例外/反例n-→理论n--例外/反例n+1-→理论n+1…… 语法研究中采用的方法 语法研究中的定性分析定量分析 现代语言学的产生使实验方法越来越受到重视现代语言学诞生的标志是结构语言学即描写语言学的出现,这种理论受美国心理学中的行为主义的影响很深.尽管六十年代以后Chomsky的转换生成语法打破了结构语言学的一统天下,出现了很多语言学流派,但仍然在不同程度上继承了结构语言学的方法:在研究中强调的是语言形式,关心的是语言的普遍规则,而对语言差异不感兴趣. 语法研究中采用的方法 功能语言学即社会语言学的出现开拓了语言学的视野,把语言学研究的对象延伸到了句子以外的领域.可以这么说,功能语言学对语言学的发展在某种程度上是方法论的发展.而近些年认知科学的发展,特别是认知心理学研究方法上的突破,使实验方法在语言学研究中越来越得到重视,成为现代语言学的分支学科如应用语言学、心理语言学、认知语言学等最常使用的研究方法. 语法研究中采用的方法 数学的方法为语法研究所欢迎 定量方法也就是计量方法.科学的本质可以说就是数学.现代科学如力学、天文学、化学等在发展自己的理论时广泛地运用了数学这个工具,以一些公式来表示自己的定率;在社会科学和人文科学领域里,也引人了数学的方法,如经济计量学、历史计量学等等;在语言学研究中也已经使用定量方法,例如语料库语言学就是计量语言学的一个分支,其他诸如自然语言处理、机器翻译、语言教学、信息检索等方面,人们对定量方法的兴趣也越来越高,数学的方法已经成为语言已经中不可缺少的部分. 语法研究中采用的方法 定量方法和定性方法的比较 从方法论角度看,定量方法和定性方法可以说是完全不同的两种研究方法,有人甚至把这两种研究方法看成是不容易调和的"两种文化";其实这两种方法所得出的结果往往互相补充.定量研究也可以称作为实验性研究,定量方法也就是实验方法. 语法研究中采用的方法 研究基础定性方法:现象学观点:1、强调亲身参与活动以获得经验;2、只有通过个人主观经验才能认识人类行为;3、了解就是移情;4、依赖定性数据?定量方法:逻辑实证主义观点:1、强调用实验方法来获取数据;2、只有摆脱主观状态才能了解社会现象的因果关系;3、了解要保持距离;4、依赖定量数据 语法研究中采用的方法 研究手段定性方法:自然观察:1、观察面广,但分散;2、?变量不加控制,有利于了解它们的复杂关系,但容易顾此失彼;3、?注意内容,但容易忽略形式;4、?解释力强,但容易主观;?5、接近现实,但时间长?定量方法:操纵和控制:1、观察面窄,但集中;2、变量有所控制,有利于了解它们的因果关系,但容易简单化;3、注意形式,但容易忽略内容;4、客观性强,但解释力弱;5、时间短,但人为的成分大 语法研究中采用的方法 研究方法定性方法:归纳法:1、以数据为出发点;2、?没有事先形成的概念;?3、可生成假设;4、?研究成果:描述或假设定量方法:演绎法:1、以假设为出发点;2、进行预测;3、检验假设;4、研究成果:理论? 语法研究中采用的方法 研究过程定性方法:综合过程:1、从分体到整体;2、全面观?;3、面向内部结构;4、?了解过程?定量方法:分析过程:1、从整体到分体;2、特殊观;、面向外部结构;4、了解结果 语法研究中采用的方法 研究特点定性方法:描写性特点:1、无控制的自然观察;?2、归纳与描写数据;3、?旨在发现形式;4、?效度高、信度低;5、?概括程度低:个案研究;?6、强调动态性?定量研究:推断性特点:1、有控制的实验;2、归纳数据进行推断;3、旨在验证假设;4、信度高、效度低;5、概括程度高:多元观察;6、强调稳定性 语法研究中采用的方法 定量方法和定性方法都是科学研究的方法,在语言学研究中不能只局限于一种方法.一般来说,从事社会科学和人文科学的人比较熟悉定性方法,但在社会科学和人文科学中引进数学的方法更体现了当前科学发展中的文理渗透、学科渗透的特点,是有广阔的前景的. 语法研究中采用的方法 一些边缘语言科学的产生会使定量方法成为不可缺少的部分.而脱胎于定性研究的描述性研究,如结构语言学、功能语言学、人类语言学等不同的流派,它们采用的描述性研究方法实际上是一种介于定性研究和定量研究之间的方法.例如描述性研究虽然也强调自然观察,但它不像定性研究那样在调查前不带任何框框,不提出假设,而主张可以根据现存的数据或现象事先提出假设,作为考察的基础;描述性研究也主张归纳法,但不排除使用演绎的方法;描述性研究不像定性研究那样,在可能的范围内也使用定量的手段.