摘 要:基于自建的中国学者学术语篇语料库和美国当代英语语料库,对比了定义性动词在中国学者与本族语学者学术语篇中的分布及其搭配型式。通过比较“define”等四个典型定义性动词的标准频数、搭配词的型/次比以及典型搭配词中立场标记语所占比例,得出结论:中国学者对于虚化的定义性动词不熟悉,存在明显少用的情况。在使用定义性动词时,中国学者并不存在中间语搭配和异常搭配,但搭配词多样性较差。相较本族语学者,中国学者不善于使用立场标记语表达自己对于所定义术语的态度和判断。
关键词:定义性动词 学术语篇 搭配
一、引言
鉴于定义这一言语行为的重要性,对其在学术语篇中的使用特征进行描述分析很有必要。特别是对于二语习得者,研究他们在学术语篇中定义的言语行为,将其与本族语者的使用习惯进行对比,可以为学术英语的教学提供有益的指导。但目前,国内学术界对于定义性语言的研究著述寥寥,仅有桂诗春曾对英语语言学学术语篇的定义性语言进行研究[4],以及谢韶亮对中美英语社论中定义性语言进行比较研究[5](P54)。对于学术语篇中的科技文本,特别是中国学者撰写的学术论文中对定义性语言的使用情况还没有涉及。
定义性动词是定义性语言的主要组成部分,承担着连接被定义项和定义项的任务。本文从定义性动词入手,基于自建的中国学者学术语篇语料库(Chinese Scholars Academic English Corpus,简称“CSAEC”),研究其使用情况和搭配型式,并与本族语学者的定义性动词使用情况进行对比,旨在描述中国学者学术语篇中定义性动词搭配型式的特征,并分析影响词语搭配的因素。
二、研究背景
(一)学术语篇研究回顾
对学术语篇的语言学研究始于上世纪80年代,目前比较主流的研究方法包括以Biber(1988)为代表的对学术语篇进行“多维分析”(multi-dimensional analysis),以Swales(1990)为代表的“体裁分析”(genre analysis),以及以Halliday的系统功能语法为出发点的分析方法[6](P1)。从微观的词汇、语法、文体特征到宏观的语篇的某一特定部分(如摘要、引言等)甚至整个语篇,从具体的语言特征描写,到抽象的语言功能、语篇模式推进方式研究,语言学家们对于学术语篇的研究积累了大量的成果。
自上世纪90年代以来,国内学术界对学术语篇的研究取得了较大的进展。现有的研究主要从系统功能语法和体裁分析理论两个研究视角展开[7](P21)。基于体裁分析理论,通过对学术语篇的摘要、引言、结论等部分的步骤(step)、语步(move)进行分析、描述,构建了学术语篇的结构范式,为学术语篇的写作提供了可操作性较强的框架。基于系统功能语法的学术语篇研究,包括对模糊限制语、多声协商、评论附加语的研究等诸多方面。值得注意的是,目前国内对于学术语篇中定义、分类等言语行为的研究明显不足。特别是基于中国学者学术语篇的语料,研究其言语行为与本族语学者的异同,正是本研究与以往研究的不同之处。
(二)词语搭配的界定
从Firth提出“结伴说”,到Halliday指出搭配是“体现词项在某种显著的临近范围内组合关系的线性共现”[8](P75),语言学家们一直致力于对词语搭配进行界定。词语搭配的核心理念是典型搭配中各词项之间的相互预见(mutual expectancy),一个词项出现,搭配伙伴在临近语境中出现的概率也很高。
词语搭配在一定程度上反映了语言的地道性与自然性。是否能够使用典型搭配、是否存在大量的中间语搭配和异常搭配,成为评估二语习得者语言质量的重要考量。所谓的异常搭配是指学习者的英语词语行为与给定节点词的语义韵相冲突;中间语搭配并不破坏给定节点词的语义韵,但搭配词与本族语的情况差异较大;而典型搭配是指语言交际中高频出现的词语组合[9](P212)。使用词项之间的“相互吸引值”(Mutual Information Value,简称MI值)进一步界定搭配的典型性,一般认为MI值大于等于3即为典型搭配。本研究将围绕定义性动词评估中国学者学术语篇中是否存在中间语搭配和异常搭配,是否能够熟练使用典型搭配陈述命题、表达观点。
三、研究设计
(一)语料来源与处理
根据研究的需要,我们建立了一个小型中国学者学术语篇语料库(CSAEC),该语料库的语料来自在中国出版的被SCI(Science Citation Index,科学引文索引)收录的期刊。SCI由美国科学情报研究所(ISI)编制,是世界著名的期刊文献检索工具,被广泛应用于学术评价的各个方面。根据中国知网的统计,目前中国出版的期刊被SCI收录的有123种,其中有中国学者发表的大量学术论文。这些文献也代表了中国学者学术写作的较高水准。 本研究拟将中国学者学术语篇中定义性动词的使用及搭配型式与本族语学者进行比较,因此研究中引入美国当代英语语料库(Corpus of Contemporary American English,简称COCA),进行对比。为增加可比性,在构建中国学者学术语篇语料库时,参照COCA“学术英语”(Academy)的“科学技术”(Sci/Tech)子库的语体,选择“数学、物理、生物、机械、通讯、信息、计算机”七门学科。每门学科选取该领域影响因子较高的被SCI收录的国内期刊,随机抽取10篇中国学者撰写的学术论文。选取学科和文献来源期刊如下表所列:
表1:中国学者学术语篇语料库学科分布及来源期刊
学科 期刊名称 篇数
数学 Science China Mathematics 10
物理 Chinese Physics B 10
生命科学 Science China Life Sciences 10
机械 Chinese Journal of Mechanical Engineering 10
信息 Science China Information Sciences 10
计算机 Journal of Computer Science and Technology 10
通讯 China Communications 10
科学语篇中存在大量的数字、符号、图表,这对于基于语料库的语言统计分析并无实际意义,反而会对统计结果产生干扰,因此需要在语料清理过程中删除公式、演算及图表,得到较为“清洁”的文字语料。两个用于对比研究的语料库形符数如下:
表2:对比语料库形符数
语料库 语体 形符数
中国学者学术语篇语料库(CSAEC) 科技文献 241351
美国当代英语语料库科学技术子库(COCA) 科技文献 13879631
(二)研究问题
本研究的目的是分析定义性动词在中国学者学术语篇中的总体分布,以及它们的搭配型式特征。为弥补小型语料库在代表性与说服力方面的不足,研究引入本族语学者的学术语篇作为参照,对比两者在定义性动词的使用与搭配方面的异同。具体而言,本研究主要针对以下三个问题:
1.定义性动词在中国学者学术语篇中有何分布规律,与本族语学者撰写的学术语篇相比,是否存在超用或少用?
2.中国学者学术语篇定义性动词的搭配型式与本族语学者相比有何特征,是否存在中间语搭配和异常搭配?
3.中国学者的定义性动词典型搭配与本族语学者相比有哪些异同?
(三)研究方法
以国内出版的被SCI收录的期刊为语料来源,对随机选取的中国学者撰写的科技语篇进行文本清理,构建中国学者学术语篇语料库(CSAEC)。本研究使用的语料库分析软件是AntConc和Collocation Extract。选取美国当代英语语料库“学术英语”“科学技术”子库作为对比研究的对象。本研究分三步对研究所需数据进行收集。第一步,使用AntConc软件在两个对比语料库中对“call,mean,know,define”这四个典型的定义性动词进行搜索,同时抽取跨距5:5范围内的搭配词(collocates)。因两个语料库在规模方面存在较大差异,需对频数进行标准化,并使用对数似然比计算工具检验词项在两个语料库中差异的显著性。第二步,提取两个语料库中四个定义性动词的所有搭配词,计算搭配词的型/次比,比较搭配词的多样性。第三步,提取两个语料库中定义性动词的典型搭配词,在典型搭配词中进一步筛选可以表达作者立场、态度的词,对比立场标记语在中国学者与本族语学者定义言语行为中的分布差异。
四、结果与讨论
(一)定义性动词的标准频数比较
表3:四个定义性动词频数及标准频数(频数/1000)比较
CSAEC频数 CSAEC标准频数 COCA频数 COCA标准频数
call 73 0.302 7036 0.506
mean 153 0.634 6774 0.488
本研究统计的定义性动词的频数均为语料库中该动词及其屈折形式出现的频数。如表3所示,与本族语学者相比,中国学者使用“mean”和“define”两个定义性动词的频数偏高,使用“call”和“know”的频数偏低。但仅以频数无法判断是否存在显著的超用或少用,还需引入对数似然比计算工具,对显著性差异进行判断。
表4:四个定义性动词频数差异显著性
定义性动词 CSAEC频数 COCA频数 对数似然比 显著性 超用(+)/少用(-)
call 73 7036 22.96 0.000 *** -
表中“*”“**”和“***”表明该对数似然比在0.0
5、0.01和0.001的显著性水平上是有统计学意义的。+表明该动词在CSAEC中使用的频数显著多于其在COCA中的使用频数,即“超用”(overuse);相反,“-”表明使用显著不足,即“少用”(underuse)。如表4所示,与本族语学者相比,中国学者在对某概念进行定义的时候,更倾向使用“mean”和“define”;而对于另外两个典型的定义性动词则明显少用。究其原因,中国学者可能因为对于某些词汇熟悉而大量甚至过度使用。另一方面,对一些词和搭配的某些特定用法不熟悉可能导致中国学者选择回避使用这些词。中国学者对于“mean”和“define”的超用可能受母语的影响。这两个词的本身的词义即为“定义”“意思是”。而“call”和“know”最为二语习得者熟知的意义与“定义”关系不大;这两个词存在一定程度的“虚化”,通过与某些词搭配或是某种特定结构,起到定义词的作用。中国学者显然对这样的“虚化”定义性动词使用不够熟练。
(二)定义性动词的搭配型式比较
要深入了解定义性动词的使用,就有必要观察定义性动词的搭配,即在一定跨距内与其他词汇的线性共现关系。这里依然考查上述四个典型定义性动词。假定“call”在CSAEC出现的频数是A次,而它的搭配词有B个,则其型/次比,也即B/A在一定程度上反映了该词在定义言语行为中应用范围的大小。
研究方法是使用Collocation Extract软件,生成这四个定义性动词在CSAEC中的搭配词表。以这四个词为节点,左右跨距设定为5,只取频率大于等于5的词。COCA语料库本身带有搭配词提取统计功能,跨距及最低频率也设定为5,生成这四个词在“科学技术”子库中的搭配词表。对比两个语料库搭配词的型/次比,目的是比较定义性动词在两个对比语料库中搭配词的多样性。
表5:定义性动词搭配词型/次比比较
CSAEC COCA *=有显著差别
词次 词型 型/次比 词次 词型 型/次比
(三)立场标记语在定义性言语行为中的分布
在深入分析本族语学者定义性动词的典型搭配时,可以看到COCA“科学技术”子库中围绕“define”等定义性动词,出现大量表达作者态度的立场标记语。如此高频出现的语言现象,有必要对其进行研究和解释。特别是在对比研究中,分析这样的语言现象是否也存在于中国学者学术语篇中,对描述中国学者学术语篇定义性语言的使用特征以及学术写作的教学都存在指导意义。
立场的表达是学术语篇极为重要的部分。作者的立场表达是指学术语篇中作者利用多种语言资源对文中命题意义或其他研究者表达的态度、情感和判断[10](P44)。立场标记语通过修饰定义性动词,使作者在定义中表达对该术语的判断和态度,从而影响读者的学术思想,这是作者试图与读者建立联系、说服读者的手段。
表6:立场标记语在典型搭配词中的比例对照
CSAEC COCA
立场标记语 典型搭配词 百分比 立场标记语 典型搭配词 百分比
call 1 53 1.8% 3 35 8.6%
mean 1 66 1.5% 3 49 6.1%
know 0 28 0 16 48 33.3%
define 7 39 17.9% 18 33 54.5%
如表6所示,中国学者使用立场标记语对定义性动词进行修饰,表达个人立场的能力要远远弱于本族语学者。这意味着中国学者在学术语篇写作过程中忽视了对个人态度、判断的表达,这可能与中国特有的文化背景有关。中国人的价值观念、行为规范和话语模式与英语中强调学术批评的观念不同[10](P46)。中庸的儒家思想强调自我约束、自我管理,这可能使得中国学者在表达自己的立场时更为审慎,更乐于做隐身的作者,尽量以客观的语气表述命题信息。但这样的“置身事外”实际上使作者丧失了与读者建立联系的机会,影响了学术论文的“人际性”和“交互性”。
五、结语
本研究选择了“call,mean,know,define”四个典型的定义性动词作为切入点,通过基于语料库的实证研究发现,相较本族语学者,中国学者对“mean”和“define”两个词存在超用,而“call”和“know”存在少用的情况。这可能是受到语内的影响,“call”和“know”都存在某种程度的虚化,中国学者对这两个词的定义性功能不够熟悉,从而导致使用受限。
通过比较搭配词的型/次比,我们发现中国学者在使用定义性动词时所选择的搭配词多样性较差,即便是超用的“mean”和“define”也存在搭配词频次高、品种少的情况。在中国学者已经使用的搭配中并不存在中间语搭配和异常搭配的情况,但对于很多典型搭配中国学者似乎并不能熟练使用。 我们在两个语料库中定义性动词的典型搭配词中提取立场标记语。通过对比发现,本族语学者立场标记语的使用要远远多于中国学者。这说明中国学者还不习惯在学术语篇中对定义进行描述时表达自己的态度和判断,从而对读者产生影响;或者认为这种立场的表达并不重要,对其不够重视。
反思我们的学术英语写作教学,很多中国学者仍然以“说清楚、不犯错”为标准进行学术英语写作,对于语言的多样性、生动性、影响力没有给予足够的重视。这就要求学术英语写作教师在教学过程中,特别是在教授定义等一些关键的言语行为的语言表述时,丰富学生的词语搭配,尤其关注典型搭配;向学生灌输立场表达的重要性,引导学生通过这样的语言手段与读者建立联系。