时间:2024-08-31
朱乐亚
(湘潭大学碧泉书院,湖南 湘潭 411105)
组合范畴语法(以下简称CCG)是因为范畴类型逻辑在自然语言理解(NLU)中的应用而发展起来的,CCG 作为计算机科学领域与人工智能领域中的一个重要研究方向,其目的是使理论尽可能地接近心理和计算机制。这样的机制可将语句映射为意义,再将意义映射成语句,并且能够使儿童或计算机程序通过接触文本中有意义的语句而学习任何人类语言的语法,进而实现人与计算机之间的有效交流。CCG 又给表层句法和底层语义之间提供了一个完全透明的接口,每一个接口直接对应了一个解释结构,这就允许CCG 为人类语言处理的递增本质提供一个说明。
CCG 的句法规则基于组合逻辑以及范畴演算,使用CCG 进行语法分析的魅力在于它便于恢复在提取、并列组合、控制和提升等结构中涉及的非局部依存关系,从而实现自然语言的机器理解,因此CCG 的研究也就成了NLU 的先导性工作。因此,自Ades & Steedman 提出CCG 以来,CCG 已经成为最直接面向NLU 的逻辑理论[1]。但是在自然语言中,尤其是在汉语这种意合型语言中,我们难以准确地刻画其表层句法形式和语义描述之间完整的关系模式。正是从这一个角度考虑,我们从语义的形式化入手,为CCG 构建配套的汉语形式语义系统。
我们选择汉语动趋式为突破口,一个重要的原因在于目前汉语动趋势的组合性探讨并不多,而动趋势之间的对比研究和推演问题又是汉语句式所关注的热点[2-6]。与现有的CCG 强调的“句法-语义”并行推演不同,本研究更加侧重汉语部分动趋式的句法和语义对比研究。在句法方面,本研究旨在尝试通过CCG 的组合性原则导出汉语动趋式的合法范畴并进行解析,归纳两类汉语动趋式的异同。在语义层面,本研究将基于会话语境,从而借助CCG 析出两类汉语动趋式的话语信息结构,并探究其是否总是遵循“焦点居尾”原则;然后分别系统地陈述趋向动词主观和客观范畴的具体使用情况。
Steedman 通过扩张范畴语法(CG)的规则,使CG 成为一种具有更充分推理能力的逻辑体系,形成了CCG 理论[7]。按照邹崇理的介绍,CCG 出现的最重要的特征是在CG 系统中增加了不同的组合算子[8]。引入这些新算子,必然导致了新规则的引入,而所有的规则都要服从Steedman 所述的组合类型透明原则(The Principle of Type Transparency)[9];使用这些组合规则就有可能对提取和并列组合结构涉及的长距离依存关系作一个简洁的分析。与传统的逻辑学研究有所不同,CCG 以“认知=计算;语法=逻辑;分析=演绎”为核心思想[10]。因此,CCG 通过引入这些算子和规则来扩张CG 是基于语言学实际需求,而非出于逻辑性质的考虑。这是一种以问题为导向的扩张,即规则的扩张主要是以找出适于计算机处理自然语言的实际办法为目标。正是这种实用主义导向使得CCG 成为与NLU 结合最为紧密的一种逻辑理论。
尤其是汉语这样的意合型语言,句法结构与语义结构难以截然分开。相应的,在对自然语言做形式化解析时,“句法-语义”互动推演也应该成为CCG 需要考虑的问题。为了使语法的生成力和解析力保持在可控的范围内,Steedman 提出了组合性规则必须遵守以下原则[11]:a. 毗连性原则,即组合性规则(词法规则和句法规则)只能应用于有穷多个语音上表现出来的字串邻接实体;b. 一致性原则,也就是说,所有的句法组合规则一定要与主函子的方向一致;c. 继承性原则,如果运用组合性规则生成了一个函项范畴,那么在那个范畴中定义一个已知论元的方向性斜线同于在输入范畴中定义相对应的论元的方向性斜线。
CCG 主要采取词汇主义路线,通过为词汇指派相应的范畴类型,据此决定不同的句法解析路径,从而一步到位地得到语句的表层结构和相应的语义表征。也就是说,同一个词汇可能具有不同的范畴,而不同范畴参与句法运算,就会产生不同的句法结构,同时也获得了相应的语义结构。近年来,Steedman 将CCG 运用到话语信息结构,从而更好地解释说话者传达的信息在会话语境中的含义[11]。Steedman 分别使用“θ”和“p”两个维度进一步区分“主位”和“述位”,其依据是听话者是否有效地回答说话者的问话,或者听话者自身对说话者预设听话者所回答内容的立场表决。
试看以下两种动趋式。
表1 汉语动趋势分类
CCG 的优势就是将丰富的组合信息编码到词条信息中,那么A 式和B 式的词项范畴对于整个语句的组合性推演就十分重要,基于CCG 可进一步给出A 式和B 式在会话语境下的组合性解释。据此,本文将分别给出A 式和B 式的CCG 推演。AI 的隐性主语“e”用范畴S/IV 表示;“拿出来”作为中补短语用范畴IV/NUMP 表示;“一本”作为度量词用范畴NUMP/NP 表示。具体来说,AI 可以重构为:
H①“H 表示说话人”,“S表示听话人”,“*”表示新信息和焦点,“ㄒ”表示完全肯定,“⊥”表示立场否定。:拿出来什么?
S:我拿出来一本书。
ㄒ(p(*一本书)S)
“话语者认为他拿出的是一本书。”(蕴含:肯定)
在CCG 框架内先给出AI 的主要词条,如下所示:
词条1
e(我):=S/IV:λp.p 我';拿出来:=IV/NUMP:λxλy.拿出来'xy
一本书:=NUMPT,p:λq.q(*skolem'书')
根据词条范畴可组合性地推演出AI,见图1。
图1 “拿出来一本书”的CCG 推演图
AII 可还原为目的语句:(e)拿出一本书(e)来(看),其中“拿出”这个动作是先于“来(看)”之前,因此“拿出”是过去体标记,而“出”作为体态助词且视为动作完成的标记词。AII 是分别由“(e)拿出一本书”和“(e)来(看)”两个小句构成,从而可得到图2。
图2 “拿出一本书来”的范畴生成推演树一
AII 也可以用另一种方式推导,见图3。其中,“来”的范畴为SS,很明显,“来”理应作副词从而修饰整个语句,而此处“来”是趋向动词,在词性上与副词属性不兼容,故这种组合方式不可取。
图3 “拿出一本书来”的范畴生成推演树二
AII 可重构为:
H:你拿出一本书干什么?
S:我拿出一本书来看。
ㄒ(p(*来看)S)
“话语者认为他的目的是看书。”(蕴含:肯定)
AII 的主要词条如下所示:
词条2
e(我):=NP1:λp.p 我';拿出:=(S1NP1)/NP2:λxλy.拿出'xy
一本书:=NP2:λq.q(*skolem'书');然后:=CONJ:and'
来(看):=S2,T,pNP1,T,p:λw.purpuse'(*来(看)')w
根据词条2 和图2 的组合方式,可进而得到图4。
图4 “拿出一本书来”的CCG 推演图
AIII 可解读为:(e)拿一本书(书)出来,其中“出来”的主语是“书”而不是“e”,AIII 由“(e)拿一本书”和“(书)出来”两个小句构成,AIII 的词条指派与AII 除两个小句的主语不一致外,其余词条指派一致。
词条3
e(我):=NP1:λp.p 我';
拿:=(S1NP1)/NP2:λxλy.拿'xy
一本书:=NP2,T,p:λq.q(*skolem'书')
导致:=CONJ:and';出来:=S2NP2:λw.appear'(出来')w
从而AIII 的推演结果如图5 所示。
图5 “拿一本书出来”的CCG 推演图
BI 中“一只鸟”做“飞进来”的施事宾语,也就是说,“飞进来”的主语不是空的而是其宾语“一只鸟”。
基于词条4,可得到图6。
图6 “飞进来一只鸟”的CCG 推演图
词条4
一只鸟:=NPT,p:λp.p(*skolem'鸟');飞进来:=VP/NP:λy.飞进来'y
BII 可解读为:(e1)飞进一只鸟来(e2),“飞进……来”表示一只鸟位移的起始,“飞进”的前面表示一只鸟位移的起点,比如:(窗外)飞进一只鸟。趋向动词“来”表示位移的终点,比如:(窗外)飞进一只鸟来(屋里)。“飞进……来”同时也指涉“一只鸟”发出动作的先后顺序。
BII 的词条指派见词条5,进而生成图7。
图7 “飞进一只鸟来”的CCG 推演图
BII 可重构如下:
H:窗外飞进一只蜜蜂来(屋里)?
S:窗外飞进来一只鸟来(屋里)。
⊥(p(*一只鸟)H)
“话语者认为飞进来的对象不是蜜蜂而是鸟。” (蕴含:否定)
词条5
(窗外)e1:=NP1:λq.q 窗外';飞进:=(S1NP1)/NP2:λxλy.飞进'xy
然后:=CONJ:and';一只鸟:=NP2,T,p:λp.p(*skolem'鸟')
来e2(屋里):=S2NP2:λw.来'屋里'w
在BIII 中,“飞”是不及物动词,“一只鸟进来”是完整的语句S,若“飞一只鸟进来”是个合法的语句,其范畴指派应为S,那么“一只鸟进来”的范畴应指派为S/IV,这与“一只鸟进来”的范畴S 不符合,所以BIII 违背CCG 的组合性规则。符号“*”表示该范畴无法和其他范畴进行兼容运算,具体分析见图(8)。
如上所述,A 式和B 式在句法推演过程中都遵循CCG 的组合规则而生成合法语句,A式和B 式相比,A 式组合性强,句式灵活;B 式组合性弱而导致衍生语句的不合法性。而在不同的会话语境下,A 式和B 式的焦点信息分布也不一样,故未完全遵循“焦点居尾”原则。因而可得:A 式[+强组合性,±焦点居尾];B 式[+弱组合性,±焦点居尾]。
A 式是典型的动作句,表明施事者通过施加某个动作“拿”从而导致“一本书”出来(呈现结果)。A 式强调客观叙述某个“动作”所带来的结果,然而这个“动作”是真实存在的。A 式客观语义可用图9 表示。
图9 “A 式”的客观语义图
B 式是典型的存在句,B 式的侧重点在于某个物体(一只鸟)。BI 式侧重描述“一只鸟”飞进来的过程,视角点在于描写“一只鸟”飞的过程,然而这个过程是持续的;BII 式描述了“一只鸟”位移的终点,这个过程是有限的。B 式的描述都是根据观察者的主观意识来刻画“一只鸟”这个物体。BI 式的语义解析可通过图10 表示,其中,灰色阴影部分表示“一只鸟”飞入的空间,黑色的球体表示“一只鸟”,实线箭头表示“一只鸟”位移的时长,虚线箭头表示“一只鸟”位移的过程。由此,我们可以清楚地发现BI 式侧重描写物体的位移过程。
图10 “BI 式”的客观语义图
BII 式的语义解析如图11,与BI 不同的是,BII 式完整地刻画了“一只鸟”位移的整个过程(起点和终点)。由于视线范围的描述取决于观察者,因而B 式有强主观性。综上,A 式[+客观性];B 式[+主观性]。
图11 “BII 式”的客观语义图
再基于A 式和B 式的结构分析,我们可明显地发现宾语“一本书”在A 式中做受事宾语;而“一只鸟”在类型B 中做施事宾语。BIII 和BIV 不合法,故不再做分析。A 式是典型的动作句,表明“一本书”是某人施加动作而得以显现,所以A 式的宾语又是动作对象。B 式是以观察者为切入视角而发现的结果,所以在B 式中宾语侧重描写出乎意料和引人注目的事情,B 式的宾语又是描写对象。与B 式相同类型的语句如下:
a.从那灰棕色汽车里跳出几个暴徒,把杨林生捆绑起来,打了几拳,把他的皮包抢走了。
b.刘宽听见陌生人冒出这番话,神经如同被烙铁烫了一下,脸色陡变,立即转过脸来,喝问:“你是什么意思……你……你是谁?”
c.后台门口忽然跑进一个略带紧张神色的军官。
如以上例句所示,“几个暴徒”“这番话”和“一个略带紧张神色的军官”都是动作主体所描述的场景,而且这些描述性宾语往往有出乎意料之意。语句a 对“暴徒”所做的事情作出了描述,语句b 对“这番话”说出的结果产生了“神经如同被烙铁烫了一下”和“脸色陡变”等反应;语句c 用“忽然”来形容描述对象所出现的场景。所以B 式更加侧重描述出乎意料的事情。基于以上分析,最终可得:A 式宾语[+客观动作义];B 式宾语[+主观描述义]。
若A 式和B 式删除量词后,其结果见表2。
表2 无量词式汉语动趋势分类
沈家煊认为某些句法组合没有数量短语就不能成立[12]。其中A 类语句没有数量短语的限制,A 句仍然合法,而B 句若是删去数量短语,B 句的语义就会发生变化甚至不成立。也就是说,A 类语句不受数量短语语义制约,A 句具有稳定性;而B 句的语义和结构却因数量短语而产生了变异或者结构成分缺失。但是,若在B 句中增添“这/那只”则形成C 句。即使B 句有数量短语修饰名词,但是B 句仍然不能够生成合法的句子,只有当B 句中的量词以“无定”形式且修饰可数名词的时候才视为合法的句子,因而量词对B 句的影响是不完全的。
Bach[13]曾以集合的概念,来说明普通名词的语义指涉,比如:B 句中,“鸟”作为普通名词,可以用来指一个集合,而这个集合中,含有的是所有具有“鸟”特性的个体。正如Bach所解释的,普通名词的指涉与集合关系,以及动词组的时间指涉语义,与Montague[14]所谈及的种类与个体之间的特性关联,来解释B 类动趋式结构和名词组间的语义互动,从而了解B 类动趋式结构中名词组的语言形式所带来的语义变化。Montague 称“一”表达的是某一的意思,即“一”具有任意性。从集合的观点来看,“一只鸟”是同种类的一个个体而不是整个种类,因而无法从单一个体特性推至种类中全部个体,所以“一只鸟”描绘的是状态性或者短暂性,这与“飞进来”所指涉的时间语境相符合,因而当B 式使用“一只”作为度量词修饰名词时最为合适。
但A 式无论删减量词与否,都不影响A 式的语义,沈家煊认为“有界”与“无界”的区分主要以人的感知和认识为准。进而,人的感知和认知是有差异性的,“书”对于使用的人而言是具有熟知度的,因为使用者知道自己该拿书做什么(目的性),这种目的性在A 式中的含义是隐性的,所以无论A 式是否使用量词,这些都不会干扰使用者的确认度(使用者知道拿书做什么)。
这也同样蕴含观察者非常熟悉“这只/那只鸟”,但如果在“飞进来”所指涉的短暂语境里,观察者是无法识别“这只/那只鸟”就是自己见过的“鸟”,这具有不确定性,因此,C 类根本不成立,除非观察者给“鸟”做了特殊记号。BIII 中,“飞鸟”具有歧义性,在语法方面,“飞鸟”要么做主语,表示飞鸟这类动物;要么做宾语,表达外面飞了鸟进来。然而,“飞鸟”从形式上来看:∃x(鸟'(x)∧飞'(x)),意思指存在“飞鸟”这类动物,但“飞鸟”是文学概念,并无法在现实生活中找到“飞鸟”,故BIII 在现实中不成立。基于以上分析:可得,A 式宾语[±数量短语];B 式[+无定性]。
CCG 是一种强词汇化语法理论,其中A 式和B 式的动趋势语法范畴包括“句法类型所确定的价数”(论元的数量和相应类型)以及组合后结果的类型、论元的线性排列、论元组合的先后次序以及逻辑形式和语音形式。语类词库用来存储动趋势的特定信息,一些通用的类型驱动组合句法规则将这种特定语言词库的语音和语义映射到相对应的句子中。
动趋势所有的范畴都是肯定极性词,并坚守极性词保存原则,因而暂时不考虑所有的句法和语义相关的极性标记。CCG 是裹携式结构纳入语法内,然后根据词元关系进行组合性运算,而不是纯粹的句法组合规则,CCG 处理动趋势在句法上仅通过组合性规则而消去毗连成分。若将A 式和B 式的“量词”全作“逆向辖域解读”处理,那么A 式可解读为“一本书被人拿出来了”。与A 式不同的是,B 式却解读为“一只鸟被飞进来了”,显然该解读的可接受性低,“飞进来”是不及物动词,而B 式的逆向辖域解读却作及物动词,这是不合理的。无论是量词逆向还是表层辖域解读,A 式的可接受性更具优势,故:A 式[+强描述力];B 式[+弱描述力]。
汉语是一种意合型语言,形式句法标记贫乏,“句法-语义”不对称的现象比比皆是。句法的推演不是仅仅由句法标记和语序决定的,词汇本身所携带的语义信息对句法推演起到了很大的支配作用,这是CCG 理论的最大特色。我们借助CCG 探讨了两类汉语动趋式的异同,研究结果有以下几方面。一方面,A 式和B 式在句法和语义方面都严格遵守了组合性原则,且A 式的描述力更强,A 式侧重客观地叙述动作的实施,B 式侧重主观地描写在观察者视角下物体的位移过程,由此可见,汉语动趋式句并不一定存在主观范畴,也有客观范畴。另一方面,在数量短语修饰方面,A 式不受数量短语的严格约束,有无数量短语修饰都不影响A 式,B 式只能够相容无定形式的量词。此外,A 式和B 式在会话语境中都并未严格遵守“汉语焦点居尾”原则。即:
A 式:[+强组合性,+客观动作义,±数量短语,±焦点居尾,+强描述力]
B 式:[+弱组合性,+主观描述义,+无定性,±焦点居尾,+弱描述力]
尽管CCG 以实现自然语言“句法-语义”并行推演为特色,但是面对棘手的语义问题,也不得不有所放手,优先实现句法的解析。由于汉语动趋势形式语义多变,因而扩充CCG的语义标注和推演是十分必要的。因本文篇幅有限,故未探讨动趋势句的虚词化研究。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!