动趋式的语言学特征分析
动趋式指动词带趋向动词作补语。如:“趴下”“坐下去”和“走出办公大楼”等。本文主要对动趋式进行了语言学特征考察。本文所使用的语料是1998年1月份《人民日报》经过分词和词性标注的语料。我们对文中的动趋式进行了标注。具体语料样例如下:
随着/p 1998年/t 春节/t 的/u 临近/v,/w 一些/m 地方/n 和/c 部门/n 也/d 开始/v 【忙碌/a 起来/v 】,/w 准备/v 一年一度/i 和/c“/w 老/a 关系户/n”/w 礼尚往来/i,/w 来去/v 拜年/v。/w 如今/t,/w 这些/r 单位/n 间/f 的/u 拜年/v 已经/d 完全/ad 变/v 了/u 味/Ng。/w 主要/d 表现/v 在/p 重/v“/w 礼/n”/w 轻/a“/w 情/n”/w。/w 去/v 拜年/v 时/Ng,/w 要么/c 【捎/v 上/v】 几/m 种/q 本地/r 的/u 土特产品/n,/w 要么/c 【带/v 去/v】 名牌/n 烟酒/n,/w 否则/c 面子/n 上/f 【过不去/v】。 一、内部构成和用字情况 这24个词除了具有趋向动词的用法外,还有其它的用法,例如:“上、下”等词还可以作方位词,“过去”可以作时间名词。简单趋向动词和复合趋向动词作不同兼类的比例也有所不同。其中,复合趋向动词“开来”不能单说,也不能作别的句法成分,只能作补语;其余13个复合词相比较“来、去、上”等10个单音节词作趋向动词的比例也较高。换句话说,在识别动趋式时,如果出现这14个复合词时,基本上可以确定它们就是动趋式的右边界。而“来、去、上”等单音节词作趋向动词的频率差异较大。我们对1998年1月《人民日报》的语料进行了统计,具体数据如下: 表1:简单趋向动词用字频率表 词 作为趋向动词的频率 具体例子 出 75% 营造/v 出/v 过 69% 走过/v 起 30% 树立/v 起/v 来 29% 拿/v 来/v 进 16% 推进/v 开 10% 裂开/v 下 8% 按/v 下/v 回 7% 捧/v 回/v 上 6% 捎/v 上/v 去 6% 望/v 去/v 根据对《人民日报》的统计,还可以发现下列问题: 1.简单趋向动词兼类问题。这10个单音节词兼类现象比较复杂。虽然有的词性比较单一,作为趋向动词的比例比较高,如:“出”;但多数功能多样化,除了可以放在动词后充当趋向补语,还可能充当谓语中心、连动谓语的后项。 2.动词和趋向动词结合起来是词还是词组问题。有些动词后的趋向动词意义虚化,读起来与前面的动词更接近,如:“放下”;有的因为常用,因而与动词结合更紧密已经凝固成了一个词,如:“推进”;不过大多数动词都可和趋向动词构成词组。 趋向动词用字的兼类现象为动趋式的识别带来了较大的难度,但在识别动趋式时,我们仍可以将这些词作为动趋式识别的右边界,以提高识别的召回率,然后再通过统计和规则的方法进行过滤,排除误识别的词语,来提高正确率。 二、趋向动词和宾语的位置我们来看看具体的实例:
A.动+趋+宾 B.动+宾+趋 C.动+趋1+宾+趋2 1.跑上楼 *跑楼上① —— 2.带来一本字典 带一本字典来 —— 3.*剥来一个桔子 剥一个桔子来 —— 4.送上一束花 *送一束花上 —— 5.*倒来杯咖啡 倒杯咖啡来 —— 6.拿出来一个手机 拿一个手机出来 拿出一个手机来 7.*爬上来山 *爬山上来 爬上山来 8.走进去两个学生 *走两个学生进去 *走进两个学生去 9.*拿进去卧室 *拿卧室进去 拿进卧室去 10.跑出去一只狮子 *跑一只狮子出去 *跑出一只狮子去 从上面的例子可以看出,这三种格式分布具有不平衡性。主要表现在以下几个方面: (一)C式的数量比其它两种句式的数量少。简单趋向动词只能出现在A、B式里,如:“喝上一杯酒”和“坐火车来”;而复合趋向动词既可以出现在A、B两式里,也可以出现在C式里,如:“走进来了一个警察”“走了一个警察进来”和“走进了一个警察来”。当趋向动词所带的宾语为小句或复句时,一般采用A式。例如:可以说“看出来屋里的空气有点不大对”,但不能说“看屋里的空气有点不大对出来”。(二)无定宾语的位置比有定宾语自由,不论充任述语的动词是及物的还是不及物的,A、B、C三种句式都成立,有定宾语只能在述语是及物动词的格式里出现,这时只能用B式和C式,而不能用A式。
(三)当动词带简单趋向动词时(“来”“去”除外),不管动词的性质如何,也不管宾语的性质如何,一律只能采用A式,不能采用B式。例如:我们可以说“拿出一支笔”,但不能说“拿一支笔出”。 (五)复合趋向动词句中宾语的位置:1.C式为复合趋向动词的常见格式,不受宾语确指与否的限制。2.当复合趋向动词带处所宾语时一般只能采取C式,不能用A式和B式。例如:我们可以说“跑进病房来”,但不能说“跑进来病房”和“跑病房进来”。3.“开来”作趋向动词时跟宾语共现的情况比较特别,“开来”这一趋向动词跟受事宾语共现时只能采用C格式。例如:可以说“翻开一本书来”,但不可以说“翻开来一本书”和“翻一本书开来”。4.A式及B式通常不用于确指宾语,目前在普通话里使用频率很低。 总之,通过统计不难发现:简单趋向动词出现的频率要高于复合趋向动词;在复合趋向动词带宾语时,C式使用频率最高,A式次之,B式出现频次最低;而在所有动趋式带宾语的情况中,A式出现频率最高,B式次之,C式出现频率最低。从以上这些可以看出来:A、B、C三种格式在语言中分布具有不均衡性。这种不均衡性增加了计算机识别动趋式的难度,但我们可以根据以上观察,制定相应的规则进行限定。 本文重在从计算语言学的角度,对动趋式的内部结构、用字情况和外部与宾语的位置关系进行初步分析,旨在为计算机识别动趋式提供语言学依据。因此,没有对其中具体问题做理论上的深入分析。