当前位置: 查字典论文网 >> 基于条件随机场方法的汉语专利文本介词短语识别

基于条件随机场方法的汉语专利文本介词短语识别

格式:DOC 上传日期:2023-02-18 01:31:58
基于条件随机场方法的汉语专利文本介词短语识别
时间:2023-02-18 01:31:58     小编:

摘 要:介词短语作为一种重要的短语类型在汉语中分布广泛,正确自动识别介词短语在自然语言处理的应用领域具有重要意义和积极影响。本文尝试利用目前比较流行的条件随机场模型,主要面向汉语专利文本,对其中的介词短语进行识别研究。首先在分词和词性标注的基础上对语料进行序列特征标注,然后利用条件随机场工具包训练了识别介词短语的模型,最后设计相关实验来验证方法的效果,实验准确率达到90%以上。

关键词:介词短语 条件随机场 识别

一、引言

专利文献在国家经济发展和科技交流中发挥着十分重要的作用。近年来,中国专利的申请数量涨速飞快。面向专利领域的文本信息处理(如专利文本机器翻译)逐渐成为自然语言处理的重要应用领域之一,并引起了学术界和业界的广泛关注。

为了满足专利文本特定的表述需要,介词短语作为一种重要的短语类型,在汉语专利文本中分布广泛。据统计,在随机抽取的500句汉语专利语料中,包含介词短语的句子有226句,占到了样本总量的45.2%。[1]可见介词短语的出现比例非常高。汉语介词短语的自动识别具有较大的难度,主要表现在以下几点:

1.介词短语的内部构成相当复杂。介词短语可以由介词与其他词语和短语(动宾短语、名词短语、方位短语、时间短语等)构成,甚至可以由整个句子构成。复杂的内部结构很容易形成远距离的搭配关系。

2.兼类介词的存在。在一定的语境下,介词还可以兼做名词、量词、形容词、连词和动词等,必须结合上下文语境才能判断具体词性。

3.在同一个句子中经常会出现多个并列的介词短语,或者会出现复杂的嵌套介词短语。

下面是一个包含介词短语的真实专利语句示例:

(1)本发明【在条件允许的情况下】【通过[为一个宏块中的不同区域]提供不同的预测信息】而提出了许多更加准确的结果。

从例句可以明显地看出,专利文本中的介词短语通常具有更多的字数和更为复杂的结构。例句中用括号标示出了两个并列的介词短语结构,其中一个的内部还有另外一个介词短语,属于嵌套结构的介词短语。正确识别这些短语就比较困难了。

考虑到介词短语分布的广泛性和对专利文本处理的影响,本文尝试利用条件随机场模型(Conditional Random Field,即CRF),主要对大规模专利语料中位于同一分句内部的介词短语进行自动识别研究,希望能做出一些有益的探索。

二、相关研究

三、CRF模型介绍

作为一种基于统计的判别式学习模型,CRF模型最早由Lafferty等人在2001年提出。该模型来源于最大熵模型。CRF通过计算和统计已知元素推理计算未知元素的条件概率。与隐马尔可夫模型不同,CRF可以利用上下文信息,而不需要严格的独立性假设,因此在序列标注问题中表现出很好的性能。此外,CRFs还解决了最大熵马尔可夫模型(MEMM)中的标注偏置问题。CRFs被广泛应用于自然语言处理领域的句法分析、命名实体识、词性标注等方面,并取得了很好的效果。CRFs是一种以给定的输入序列X为条件来预测输出序列Y概率的无向图(undirected graphical)结构模型。(X,Y)就是一个以观察序列为条件的随机域。概率计算可以通过如下公式得到:

其中,Z(X)是归一化因子,是特征集合,代表相应的权值。

四、基于CRF的介词短语识别

国外学者已经开发了完整的CRF模型工具包,利用工具包可以快速地训练模型并得到相应的结果。在本文中,将使用CRF++0.53版本的工具包①对中国专利信息中心提供的专利语料进行训练。

(一)序列标注

很多基于CRF模型的语块识别任务通常可以转化为序列标注问题。在识别介词短语的过程中,首先对包含介词短语的句子进行分词处理,然后对每个词语进行标注,确定介词短语的边界。我们采用{B, I, E, O}标记集进行标记。其中B表示介词短语的前界,I表示介词短语的内部成分,E表示介词短语的后界,O表示不属于介词短语的部分。

(2)本发明通过采用有效的方法提高汽车产量。

对于这个例句,可以做出如下标记:

本发明O通过B采用I有效的I方法E提高O汽车O产量O。O

将其反映到序列标注问题上,则可以认为:

输入序列X={本发明 通过 采用 有效的 方法 提高 汽车 产量 。}

相应地,输出标注序列Y={O B I I E O O O O }

(二)特征选择

特征是训练CRF模型必需的。在CRF中,特征选择是一个非常重要的问题,选择合适的特征对模型训练和测试都将十分有益。尽管可以不加限制地定义标记序列的特征,但不代表特征越多就越好。通过考察大规模语料中介词短语的特点,初步确定了以下五个特征及其属性值:

1.词特征。词作为句子的基本构成单元,是最基本的特征,模型可以通过词之间的差异性来寻找词本身的内部特征。

2.词性特征。通过分析发现,词性特征对边界的识别具有很大的提示作用。因此需要标记序列中词语的词性。本文采用北京大学《现代汉语语法信息词典》中的词性标记集进行标记。

3.候选前界特征。从当前词位置开始向前查找,查找位于同一分句中的介词。如果该介词存在,则该特征值为介词本身;否则特征值为“N”。

4.候选后界特征。如果认为当前词语可以作为介词短语的后界,则特征值记为“Y”,否则记为“N”。

5.候选后词特征。后词对介词短语的正确识别也起到了很大的提示作用,判断当前词是否是候选后词也能减小后界的选择范围。如果认为当前词语可以作为介词短语的后词,则特征值记为“Y”,否则记为“N”。

下表是例句2的标注实例:

词语 词性 是否

候选后界 是否

候选后词 候选

前界 介词短语

标记

本发明 n N N N O

通过 prep. N N 通过 B

采用 v N N 通过 I

有效的 a N N 通过 I

方法 n Y N 通过 E

提高 v N Y 通过 O

汽车 n N N 通过 O

产量 n N N 通过 O

。* p N N 通过 O

* 注:分词序列中所有的标点符号均标注为“p”。

将以上五个特征分为五列,对分词处理后含有介词短语的每一句语料进行标注,同时在最后一列加入{B, I, E, O}标记集,以确定介词短语的边界,以此形成训练语料和测试语料。

(三)特征模板

对于CRFs模型而言,根据选择的特征设计出不同的特征模板,根据特征模板系统生成不同的特征函数,会影响系统的性能。因此,特征模板选择的好坏将直接影响CRFs模型的效果。所以,特征模板的选择也是CRFs模型在介词短语识别中的重要问题之一。

CRFs模型的特征模板一般包括原子特征模板和复合特征模板。单独使用原子特征模板,只能表现出单个位置的特征信息,容易造成期望值和实际结果的偏差较大,导致参数的估计不准确。可以对原子特征进行组合,构成复合特征模板,通过定义各特征的窗口来描述标注单元和上下文之间的关系。本文将窗口大小定义为2。即分别考虑当前词、当前词前面两个词及后面两个词的五项特征。

当完成了序列特征标注任务,就可以利用CRF工具包对模型进行训练并识别介词短语了。

五、实验及分析

(一)实验结果

在这一部分,设计实验测试CRF模型识别介词短语的效果。从中国专利信息中心提供的专利语料中随机选择了1000句含有介词短语的句子作为测试集进行序列标注。实验采用四倍交叉验证方法,即将测试集按照数量均分为4等份,其中的3份语料作为训练语料,另一份作为测试语料,共进行四次实验,分别计算实验的三个评价指标:准确率(P)、召回率(R)和F1值,并将实验的平均值作为最终的参考结果。评价指标计算公式如下:

表2:实验数据结果

实验 P (%) R (%) F1 (%)

实验2 91.41 88.73 90.05

平均 92.65 90.07 91.33

(二)实验分析

从上表可以看出,实验的整体评价指标都达到了90%以上,表明CRF模型对于识别介词短语的有效性。

通过分析识别错误的结果,初步认为分析错误的原因可能有以下几点:

1.有的介词在训练集中出现次数很少或者几乎没有出现,因此CRF模型无法有效学习到这些介词的特征,当它们出现在测试集中,模型就难以正确识别。

2.有些介词短语具有歧义,模型不容易判断短语的右边界位置。例如:通过墨水着色剂可以有效地使染布上色。这句话中,两个名词“墨水”和“着色剂”挨在一起,不确定二者是否可以组成复合名词,不容易判断到底哪个名词才是介词短语真正的右边界。 3.CRF模型对于序列的标注特征比较敏感。在人工标注的过程中一些难以避免的标注失误或错误也会导致识别错误的现象。

六、结语

本文利用条件随机场模型尝试对汉语专利语料中的介词短语进行了识别研究。在分析大规模语料的基础上,选择了合适的特征,对语料进行序列标注,同时利用CRF工具包训练了识别短语的模型,最后设计了实验检验识别效果。实验整体的准确率达到了90%以上,表明提出的方法对于识别介词短语是有效的。

未来将加强对歧义介词短语的研究,考察更多语料,争取发现更多有效的特征,同时扩大测试规模,希望进一步提高识别的效果与性能。

(本文得到了“国家高技术研究发展计划”[863课题,项目编号2012AA011104],中央高校基本科研业务专项资金以及中国博士后科学基金资助项目的资助,特此表示感谢!)

注释:

①http://crfpp.googlecode.com/

参考文献:

[1]Li Hongzheng,Zhu Yun,Yangyang,Jin Yaohong.Reordering

Adverbial Chunks in Chinese-English Patent Machine Translation[A].Proceedings of CCIS2014.

[2]梁猛杰,宋玉,韩英杰等.基于规则排序的介词用法自动识别研

究[J].河南师范大学学报(自然科学版),2013,41

(3).

[3]黄曾阳.HNC(概念层次网络)理论[M].北京:清华大学出版

社,1998.

[4]朱筠.基本句群处理及其在汉英专利机器翻译中的应用[D].北

京:北京师范大学汉语文化学院博士学位论文,2013.

[5]胡韧奋.面向汉英专利机器翻译的介词短语自动识别策略[J].

语言文字应用,2015,1.

[6]于浚涛.基于最大熵的汉语介词短语自动识别[D].大连:大连理

工大学硕士学位论文,2006.

[7]奚建清,罗强.基于HMM的汉语介词短语自动识别研究[J].计算

机工程,2007,33

(2).

[8]胡思磊.基于CRF模型的汉语介词短语识别[D].大连:大连理工大

学硕士学位论文,2008.

[9]宋贵哲.汉语介词短语识别研究[D].大连:大连理工大学硕士学

位论文,2011.

[10]张杰.基于多层CRFs的汉语介词短语识别研究[D].大连:大连

理工大学硕士学位论文,2013.

[11]干俊伟,黄德根.汉语介词短语的自动识别[J].中文信息学

报,2005,

(4).

[12]昝红英,张腾飞,张坤丽.规则与统计相结合的介词用法自动

识别研究[J].计算机工程与设计,2013,

(6).

[13]Lafferty J.,Mccallum A.,Pereira F.Conditional

random fields:probabilistic models for segmenting and labeling sequence data[A].Proceedings of the International Conference on Machine Learning[C].2001.

全文阅读已结束,如果需要下载本文请点击

下载此文档

相关推荐 更多

现代汉语造词方法探析(1)
发布时间:2013-12-18
一、“修辞学造词法”诠释 词汇就其本身而言是一个开放的系统,而新词的产生概括的说不外乎两条途径:一是构造新词,二是吸收外来词。当今时代是一个信息爆炸的时代,各种新的事物、新的现象不断出现,由此导致了人们的新观念、新感受的......
评《现代汉语词典》语言学条目释义
发布时间:2023-01-02
评《现代汉语词典》语言学条目释义 《现代汉语词典》(http://wWw.LWlM.cOM以下简称《现汉》)以其规范性、科学性、准确性和实用性为突出特点,在海内外享有盛誉。2005年推出的第5版,又使该书的内容更趋赅博,字形与词形更规范,注音与......
别随便插!USB3.1简介
发布时间:2022-10-13
10Gbps频宽 三种连接介面要分清 USB 3.1有三种连接界面,分别为Type-A(Standard-A)、Type-B(Micro-B)以及Type-C,标准的Type-A是目前应用最广泛的界面方式,Micro-B则主要应用于智能手机和平板电脑等设备,而新定义的Type-C主......
《汉语大词典》“封望”条释义辨正
发布时间:2023-04-07
封望”是与中国古代封爵制度密切相关的一个词,《汉语大词典》(以下简称《汉大》)解释为“谓以封地为籍贯”,并举两例: (1)宋欧阳修《欧阳氏图谱序》:“询之子通,仕于唐,尤显,皆为名臣。其世居长沙,犹以渤海为封望。” ......
通用英汉谓词语法标注方案
发布时间:2023-07-08
摘要:经过语法标注的语料对语言的研究、教学、测试、词典编撰等各领域都具有重要意义。国内外语法标注的体系存在四个主要问题:(1)标注的重点各不相同,有的侧重结构,有的侧重功能,有的侧重语义;(2)标注的层次深浅不一;(3)在语法范畴的划分和术语的使用上各行其是;(4)国内树库的建设原创性不足,标注不够深入。本文作者从语言共性的角度出发,建立了一套通用的英汉谓词语法标注方案,区分语法形位和词汇形位,对.........
汉语基础词汇与汉越词的对比研究
发布时间:2023-03-20
摘要:语言是不断发展变化的。汉语词进入越南语后,成为越南语词汇系统中的一个组成部分,并在越南语的语音、语义、语法规律的作用下发生很大变化,形成一个独特的词汇体系――汉越词。在越南语内部规律的作用下,与现代汉语中相对应的词比较,许多汉越词在形式或意义上都有一定的变化。有些词的词义在现代汉语里已经不再使用或很少使用,但借入越南语后却一直保留原义,沿用至今。为了进一步了解越南语中的“汉越词”在词义、用法.........
浅析汉语新词语修辞造词法考察
发布时间:2023-02-03
摘 要:修辞造词法是汉语新词语造词法的一种,是指修辞方法介入造词过程,组织语素从无到有地造出新词语的一种方法。修辞方法不只是指修辞格,而是一种广义的修辞手法。本文从汉字修辞和修辞格两个方面来考察修辞手法在当代汉语新词语造词中......
英语学习者学习汉语介词“在”的偏误分析
发布时间:2023-01-02
汉语是有别于印欧语系的表意体系的文字,对于印欧语系学习者来说有一定难度。汉语的词汇分为实词和虚词两大类,实词数量多,意义实在,学习起来相对比较容易;而虚词虽然数量少,因为没有实在意义,位置不固定,用法也比较复杂,所以......
新疆汉语方言词语义探源
发布时间:2023-07-24
摘 要:本文拟从语音、语义演变方面对新疆汉语方言中普遍使用的“谝传”“骗腿儿”进行考释,以确定方言本字,既为了正本清源,也便于人们更好地了解新疆方言词的特点。 关键词:新疆 汉语方言词 “谝” “骗腿” 语义 汉语方言是......
汉语短语的分类问题
发布时间:2013-12-18
一 汉语短语结构类型的分析1.1 自《马氏文通》问世以来,有关汉语语法的论著对短语的分类基本上是按外部功能和内部结构这两个标准来进行的,其中以内部结构为标准的分类占有更重要的地位。其实,汉语短语分类中的“功能说”和“结构说......
浅谈对外汉语词汇教学方法
发布时间:2023-07-17
随着汉语热在世界各地的兴起,关于如何提高词汇教学的效果越来越成为对外汉语教学研究的重点。词汇教学是对外汉语教学中的重要根基。词汇教学的目的不仅是让学生正确认识、理解和记忆,而且能熟练运用所学的词汇进行日常会话交际。本文......
基于相关系数法的直线识别方法
发布时间:2023-04-15
摘要:本文简述了相关系数检验法,以及基于此方法的直线识别法。通过摄像头抓取物体图像,进行初步处理以后,利用此直线识别方法,可以准确的判断图像上的一条线是否为直线,并将结果输出。详细介绍了直线识别法的运算过程,并分别对抓取直线图像和曲线图像两种情况进行了实例分析。通过对直线、曲线两图像的实例分析,说明了基于相关系数法的直线识别法的可行性及精确性。关键词:相关系数直线识别法matlab中图分类号:TP.........
汉语新词语词典的语素释义
发布时间:2023-06-03
摘 要 汉语新词语词典的语素释义具有心理学与语言学依据。通过整词拆解的方式分析语素义不仅符合绝大多数复合词的内部语义联系,还与对外汉语教学中语素教学法的理念相契合。新词语词典的语素释义既要与词典用户的语言能力或学习阶段......
基于云与语音识别的手机智能通话系统——SkyTalk
发布时间:2023-04-17
基于云与语音识别的手机智能通话系统——SkyTalk 简介 本项目提出一种手机智能通话系统(SkyTalk),能够方便人们在双方通话中简单、快捷、实时地通过语音获取信息、完成用户指定任务,从而避免大量复杂、耗时的操作。在拨出SkyTalk智......
初探汉语构词方式对汉语习得的影响
发布时间:2023-01-09
编辑。 摘要 汉语构词方式的复杂性使得外国学生的学习汉语难度增加,汉语词汇难写、难记、难背已经成为很多外国留学生所公认的问题。本文旨在通过分析汉语词汇的构词方式,对汉语习得产生的影响,提醒广大学习汉语的学生应注意这些方面的......
汉语教学中识字教学的方法
发布时间:2013-12-19
汉语教学中识字教学的方法 http://WwW.LWlM.cOm写字是一项重要的语言基本功,写字和写字能力的培养,是第一学段汉语教学的一个重点。第一学段的写字要求:“书写规范、端正、整洁”,同时,要求写字姿势“正确”。要想达到以上要求,一......
汉英翻译过程中汉语动词的翻译方法探究论文
发布时间:2022-11-10
随着四六级考试对汉英翻译分值的增加,越来越多的教师和学生开始重视汉英翻译技巧,但受其母语迁移的影响,学生在做汉英翻译试题时对汉语句子中存在的诸多动词不知如何翻译。导致了所译出的句子中动词太多,不符合英语语法,如例1的译文1和译文2所示。例1:希腊神话是古希腊人的神话和教义的总和,内容涉及神和英雄,世界的性质,以及古希腊人的宗教和仪式的起源与意义等故事。译文1:GreekMythologyisasu.........
浅论跨文体交际中外来语词汉语翻译方法的演化
发布时间:2013-12-18
论文关键词: 字母词 必然性 跨交际 论文摘要:本文从跨文化交际翻译理论的角度出发,结合外来语词翻译方法的演化,探讨现代汉语字母词现象,并指出现代汉语字母词现象出现的必然性。 汉语字母词的出现丰富了现代汉语词汇系统......
简述对外汉语近义词辨析方法
发布时间:2022-11-27
简述对外汉语近义词辨析方法 http://WwW.LWlM.cOm随着全世界风行的汉语热,汉语已逐渐追赶上英语在全球普及的步伐。汉语语音优美,语义丰富,更有许多近义词同义词等,使得汉语的内容及其丰满,由此受到了很多外国朋友的喜爱。但也正是......
汉语宾语位置上的主谓短语
发布时间:2023-07-22
[ 论文 关键词]小句 主谓短语 小句宾语 小句的内涵 小句的外延 [论文摘要]本文从小句的判断标准入手,讨论了处于宾语位置上的主谓短语是否小句,分析了宾语位置上一部分主谓短语能够成为小句的原因,探讨了影响宾语结构类型的......
古汉语和汉语言基础知识在《方剂学》教学中的应用
发布时间:2023-07-27
古汉语和汉语言基础知识在《方剂学》教学中的应用 一 古汉语分为书面语和http://WWw.LWlm.cOM口头语两种形式。由于古代人民的口头语言,现在已经无法听到,我们常说的古代汉语只是指书面语言。现存的最古可识并用于文献记录的文字是三......
汉语论文《“字”和汉语研究的方法论 》(1)
发布时间:2013-12-18
语义型语言和语法型语言在结构原则上的差异,我们曾进行过一些具体的讨论(徐通锵,1991),但 要真正弄清楚每一种类型的语言结构,还需要弄清楚语言结构单位的性质,因为它凝聚着语言结构的基本特点 。汉语是语义型语言,它的基本结......
从《实用汉语课本(法文译注)》看对法汉语语音教学
发布时间:2023-01-15
从《实用汉语课本(法文译注)》看对法汉语语音教学 摘 要:中国经济的增长,促进了对外汉语教育事业的发展,同时也带动了与对外汉语教学的相关研究,其中语音教学是难点。《实用汉语课本》是北京语言学院教师编著的针对外国人学习汉语的课......
关于ERP条件下成本控制方法的探讨
发布时间:2023-01-10
三、ABC法下 成本 计算方法 作业成本法是利用单项成本改进基础上的作业成本核算信息,将“作业”作为核算对象,通过成本动因来确认和计量作业量,然后将间接费用按作业量进行分配的一种成本计算方法。其计算过程有两个基本步骤: ......
汉语与朝鲜语无条件让步句对比研究
发布时间:2022-10-14
汉语与朝鲜语无条件让步句对比研究随着世界经济文化的交流,国际间语言文化渐趋融合的发展趋势下,规范民族语言文化,实践留学生教学的成果,必须对语言的句法进行相关的对比研究。在日前的实践中,汉语与朝鲜语的无条件让步句,在日常的教学活动中,存在着一些使用误区,迫切需要对双方的语言句法进行相应的对比研究,以纠正教学和学习环节的缺点和不足。一、汉语无条件让步句汉语的复句包括:因果类复句、并列类复句和转折类复句.........
浅谈对外汉语词汇教学方法初探
发布时间:2013-12-17
" 论文关键词:对外汉语 词汇教学 方法 论文摘要:介绍四种对外汉语词汇教学方法:结合语境讲解词汇;结合语素和构词法讲解词汇;结合词的组合关系和聚合关系讲解词汇;结合近义词或反义词对比分析讲解词汇。 词汇是语言系统的......
汉语方言中的指示叹词(1)
发布时间:2013-12-18
【内容提要】不少汉语方言中都能找到一两个既有叹词的特征又有指示功能的词,本文称之为“指示叹词”,如粤方言的“呢”和“嗱”、吴方言的“喏”、长沙话的“喋”等。跟其他叹词一样,它们能在句首出现,可以独立成句,但同时又有明显的......
《汉语构词法和造词法研究》评析
发布时间:2022-12-26
《汉语构词法和造词法研究》评析 布龙菲尔德说过:“各种语言的区别,在词法上比在句法上更大。”马建忠的《马氏文通》(1898)首开构词法研究的http://WWw.LWlm.cOM先河,孙常绪的《汉语词汇》(1956)首次进行造词法研究,尔后越来越......
英汉习语的文化差别
发布时间:2023-03-12
英汉习语的文化差别 英汉习语的文化差别 英汉习语的文化差别 中文摘要 习语通常包括成语(idioms)、谚语(proverbs)、俗语(colloquialisms)、俚语(slang)以及典故(allusions)等。英汉习语源于生活,纷繁浩瀚,源远流......
关于汉语词汇层的研究
发布时间:2013-12-18
词汇是个系统,而词汇层则是词汇系统的构成要素因其所表现出的种种差别而在地位与作用、结构与功能上构成一定的等级秩序的具体体现,是词汇系统内部由其构成要素之间具有的相对固定的关系而形成的相对稳定的层级组织结构,是各个词汇成分......
论汉语宾语位置上的主谓短语
发布时间:2013-12-18
[论文关键词]小句 主谓短语 小句宾语 小句的内涵 小句的外延 [论文摘要]本文从小句的判断标准入手,讨论了处于宾语位置上的主谓短语是否小句,分析了宾语位置上一部分主谓短语能够成为小句的原因,探讨了影响宾语结构类型的动词语......
现代汉语立法语言用词浅议
发布时间:2023-01-19
现代汉语立法语言用词浅议 立法语言是立法主体按照一定的规则表述立法意图、设定法的规范、形成规范性文件的一种专门语言文字,是一定的意志或利益得以表现为成文法或法的规范的专门载体。[1](P35)在立法表述中,运用怎样的表达方式......
针对汉语词汇和语法特点谈对外汉语教学
发布时间:2022-10-09
针对汉语词汇和语法特点谈对外汉语教学 谈到一个事物的特点,首先应考察它的比较对象是什么,这里是将汉语同英语相比较的。主要从以下三个方面进行探讨: 一、汉外词汇对比 比如探讨汉外词汇的民族性差异时,称谓词的用法就有很大差......
汉语成语翻译的方法
发布时间:2023-07-25
汉语成语翻译的方法 汉语成语翻译的方法 汉语成语翻译的方法 【摘 要】 汉语成语承载着中华五千年的文化特色和文化信息.而翻译并非只是两种语言之间的一种简单的对应转换过程,而是一种文化的交流和传递。 因此,......
“炳人识字法”与汉语语文教育体系
发布时间:2013-12-17
摘要:几千年的实践所造就的汉语语文教育体系,是我们无比宝贵的文化财富。“五四”以来在汉语语文教育上弃中学洋,是盲目、 机械、 草率的。“繁难的象形字”也有它超过拼音文字的形、音优势,古人利用韵文集中识字的做法,正是利用了......
我国将禁止汉语出版物随意夹带使用外文单词
发布时间:2023-02-21
新闻出版总署日前下发通知,要求进一步规范出版物。通知要求,在汉语出版物中,禁止出现随意夹带使用英文单词或字母缩写等外国文字;禁止生造非中非外、含义不清的词语;禁止任意增减外文字母、颠倒词序等违反语言规范的现象。 据新闻出......
汉语称谓词语与对外汉语教学
发布时间:2022-10-17
汉语称谓词语与对外汉语教学 汉语http://wWw.LWlM.cOM称谓词语是一个庞大复杂的系统,不同的研究者从不同的角度出发对汉语称谓系统的划分略有不同。崔希亮先生(1996)从称谓词语的交际功能上,对汉语的称谓词语做了细致地划分,分为九个......
古汉语虚词专书研究的创始
发布时间:2023-07-10
古汉语虚词专书研究的创始 摘要 汉语虚词研究隶属于传统训诂学的范畴,直到元代,出现了第一部集中汇释虚词的专著,即卢以纬的《语助》一书。它运用的虚词训释方法,对后代虚词研究产生了深远的影响。 关键词:虚词 《语助》 研究成就......
韩国学生习得汉语介词“在”偏误分析
发布时间:2023-02-05
韩国学生习得汉语介词“在”偏误分析 一、引言http://WWw.LWlm.cOM 韩国学生在学习汉语介词时常常受到母语韩语的影响,出现一些汉语介词使用上的偏误。目前研究韩国学生汉语偏误现象的大都是中国人,韩国人对这方面的研究很少。一些中国......
短语动词与动词词组考点一览
发布时间:2023-04-02
短语动词和动词词组一直是高考考查的一个热点,几乎每套题中都要设置2~3个考查动词短语的。修改后的牛津英语教程中11个模块共有短语动词和动词词组179个,其他词组166个。从设题上看,高考题大部分考查其中179个短语动词和动词词组,......
谈汉语中的日语借词
发布时间:2023-03-06
本论文是国家科技支撑计划―汉语言教学及文化展示应用示范(2012BAH16F04)资助项目。 【文章摘要】 本文简要梳理了汉语中日语借词的发展过程,并分析了日语借词能在汉语中大量存在的历史原因和语言原因。 【关键词】 日语借......
关于汉语领有名词提升的句法分析
发布时间:2013-12-18
[论文关键词] 领有名词移位 语类特征 核查理论 格理论 功能语类 [论文摘要] Haebedi语类特征核 (eategorial feature checking)对领有名词提升(Possessor陆她 )提出了一种新的分析方案 ,文章论证用 Haeberli提出的分类特征核查这......
《现代汉语词典》第6版科技条目的修订
发布时间:2023-03-08
摘要文章阐述了《现代汉语词典》第6版科技条目修订的思路与实践:加强规范性、确保科学性、完善系统性、补充知识性、体现时代性。在修订中,力求做到这五个方面的完美结合,使科技条目与时俱进、日臻完善。 关键词《现代汉语词典》......
基于Kinect的指尖检测与手势识别方法
发布时间:2015-09-11
关键词:Kinect;肤色模型;开源计算机视觉库;指尖检测;手势识别 中图分类号: TP391.41 文献标志码:A 英文摘要 英文关键词 Key words:Kinect; skin color model; Open Source Computer Vision Library (OPENCV); fi......
基于投影特征的简谱数字识别方法
发布时间:2023-05-21
摘要:简谱数字识别是光学乐谱识别中的一个重要分支,传统的识别方法是模板匹配,该方法计算量大,且对模板的依赖性很强,导致其鲁棒性较弱,对图像的噪声和位移敏感。考虑到简谱数字识别规模较小,通过分析数字对噪声较为稳定的几何......
对外汉语词汇教学法文献综述
发布时间:2022-12-01
摘 要 随着对外汉语教学该学科体系的不断发展完善,有关对外汉语教学法的探讨也方兴未艾。本文主要关注2000年以后学者们有关对外汉语词汇教学的研究,针对所选取的文献内容进行深入分析,从对外汉语词汇教学法的重要性、理论基础、具......
论英汉语文词典中习语的处理
发布时间:2022-11-08
" 论文关键词:习语 英汉语文词典 宏观 微观 论文摘要:习语是一个民族语言词汇中最为丰富,最为闪光的部分。习语的处理是否得当,直接影响着词典编纂的质量。但在一些英汉语文词典中并未对其引起重视,忽略了习语的细致处理。本文从......
关于汉语新词日译的探讨
发布时间:2023-02-04
汉语新词是为了表达新事物、新形象以及新的概念而逐渐出现在人们的生活中的,汉语新词的内容新、形式新,属于原来的词汇系统中没有或者有但是内容是全新的词语。汉语新词通常具备以下特点:1.新,汉语新词通常都是近一段时间才产生的词......
《现代汉语规范词典》(2004)和《现代汉语词典》(2005)
发布时间:2013-12-19
《现代汉语规范词典》(2004)和《现代汉语词典》(2005) 一、引言 给汉语词典中的词目标注词类,一方面可以使词类标注与汉语语法研究相互辉映,另一方面有利于外来汉语学习者更好地掌握汉语。众所周知,汉语的词类问题一直是个老大......
市场化时代人文理论的危机——基本问题随想
发布时间:2013-12-17
" 二十多年来中国人文学界正在不断拓宽视野,新的问题领域既超过了任何传统专科学术范围,也超越了国学和西学的固有范围。学术视界的超越性使得在单学科领域内成为权威的学者并不一定能胜任于判断一般人文理论问题上的是是非非。符号学和......
关于汉语词汇层的研究(1)
发布时间:2013-12-18
词汇是个系统,而词汇层则是词汇系统的构成要素因其所表现出的种种差别而在地位与作用、结构与功能上构成一定的等级秩序的具体体现,是词汇系统内部由其构成要素之间具有的相对固定的关系而形成的相对稳定的层级组织结构,是各个词汇成分......
汉语译本的语法衔接手段
发布时间:2023-02-24
汉语译本的语法衔接手段 汉语译本的语法衔接手段 汉语译本的语法衔接手段 更多内容源自 幼 儿 一、引 言 二、语法衔接与译文连贯的再现 衔接与连贯是相互关联,相互影响的。衔接体现在语篇的表层结构上,是语篇的......
浅析对外汉语教学中词汇教学方法
发布时间:2023-05-11
[摘要]随着“汉语热”的发展,学习汉语的留学生日益增加,词汇作为汉语的基石,是留学生必须要重视的。由此而来,在对外汉语教学中,词汇教学就尤为重要,目前在对外汉语教学中,以语法教学方法的研究最多,词汇教学方法很少,本文从词汇的本身特点出发,研究实词和虚词的词汇教学方法,以期望对对外汉语词汇教学有所助益。[关键词]词汇;对外汉语;教学方法汉语不同于其他民族的语言,汉语词汇有其特殊性,衡量一个汉语学习者.........
浅析训诂学在汉语虚词语法化机制分析中的作用
发布时间:2022-11-06
摘 要:结合国内语言学界已初步形成的语法化研究的学术体系以及西方语言学研究成果中具有普遍性意义的词义虚化机制,运用训诂学方法,对汉语中具有代表性的常用虚词“在”的语法化过程进行科学追溯和分析,并根据过程中的机制和规律对......
民族学生写作中介词和量词汉语转换的偏误分析
发布时间:2023-01-30
内容摘要:受母语的影响,民族学生汉语写作中在将母语转换成汉语时,常常出现介词、量词等偏误现象。教学中教师应明确告诉学生民汉语言的不同,有针对性的引导学生纠正偏误。 关键词:介词 量词 偏误 写作中,民族学生由于受到母......
关于日语终助词的汉译研究
发布时间:2015-08-06
摘 要:终助词在口语中使用频繁,能否正确的使用终助词是日语口语水平高低的一个重要标志,但是终助词种类繁多,用法也复杂,对日语学习者来说又是学习的一个难点。本文以日常会话中使用频率最高的“ね”为对象,试图考察其与汉语的语......
基于文化因素下对外汉语词汇偏误的解决措施
发布时间:2023-01-12
一、偏误分析的概念 说到偏误分析,本文不得不提及与之相并论的对比分析。对比分析是将两种语言的系统进行共时比较,以揭示相同点和不同点的一种语言分析方法。对比分析通过对比两种语言的语言结构来预测学生在第二语言学习中可能出现......
基于语料库语言学的英语词汇教学
发布时间:2022-11-01
传统的语言学把词汇分成可以借助语法规则进行自由组合的单词和不能用语法规则解释的固定短语,因此传统上的词汇教学即指单词教学(蒋利,2003)。我国传统的词汇教学主要以词义驱动为主,学生往往只通过机械记忆单词或短语的形式及与其......
汉语外来词的方言标注研究
发布时间:2022-11-28
摘要外来词兼具外来语言文化因素和固有语言文化因素,是我们观察借出语和输入语两种语言文化的窗口。通过考察音译外来词的方言特征,我们可以发现中外文化交流的历史轨迹,进一步认识不同的方言群体或社区在文化交流中的历史地位和作......
汉语新词语在对外汉语教学中的实践
发布时间:2022-10-09
汉语新词语在对外汉语教学中的实践 一、现http://wWw.LWlM.cOM代汉语新词语的发展现状 (一)新词语的含义 (二)新词语的来源和产生方式 新词语的产生途径主要有:新造词语、旧词新用、缩略语、外来词语、方言进入普通话等。 当前......
基于专利分析的多点触控手势识别技术研究
发布时间:2015-12-11
摘 要:随着现代经济的发展,多点触控手势识别技术在实现人机互换的过程中占据着越来越重要的作用。其中,通过先进的技术手段,逐渐脱离了传统中的键盘、包括鼠标等。本文主要以专利数据为分析样本,从专利文献的视角对多点触控手势识......
基于伪随机点的混合图像融合加密方法
发布时间:2019-11-05
摘要:图像数据在网上传输需要经过加密处理,而现在很多加密算法都遵循动力学的衰退原理,会退化成具有周期性的算法,而会导致图像信息的泄漏等问题。提出一种基于伪随机点的混合图像融合算法,它先把图像分成8×8的小块,然后对每块图像进行变换,产生一个伪随机序列,将图像块内的像素值和按伪随机序列所对应的像素值相融合进行一次置乱,然后对EZW编码后的图像用混沌序列再一次置乱。试验结果表明,该算法具有很好的安全性.........
基于词汇分析现代汉语言时代下的变迁
发布时间:2023-02-06
摘 要:随着时代的不断发展和进步,语言也发生了很多的变化,时代对于语言的变化而言虽然不能起到决定性的变更作用,但是也绝对是它变化的一个重要影响因素。目前,我国的社会呈现出多元化的发展情况,语言的发展也受到了一定的促进和......
中学语文中现代汉语语法知识的重要性分析
发布时间:2023-03-19
中学语文中现代汉语语法知识的重要性分析 一、学习语法知识的重要性 1. 语法知识能理性地指导我们修改病句。从小学到初、高中的语文考试,都有病句修改的题型,病句修改自然离不开语法知识。比如常见的病句类型“成分残缺”、“语序不......
水语与汉语量词的比较
发布时间:2023-07-08
水语与汉语量词的比较由于受汉语的影响,人们可能会认为水语在量词的分类、名量词的语法功能等都跟汉语一样,事实上,水语量词虽在某些方面与汉语相同,但在使用上水语有自己不同特点。水语语料主要来自作者母语三洞土语。一、水语量词的类型1.水语的名量词①个体量词?ai3(个/位,用于人)to2(只、头、匹,用于动物)lam?(个/根,用于水果/植物)ni4(颗,用于植物)tiu2(根/条,用于植物)va5(张.........
古汉语中词的兼类与活用的联系和区别
发布时间:2023-02-11
" 内容提要:古代汉语中的词类转换情况多而复杂,目前基本上大都看作“活用”。这既不符合古代汉语的语言实际,又不利于教学。“兼类”和“活用”并存,既有必要,又有可能。 关键词:古代汉语 词类转换 兼类活用并存 古代汉语中......
汉语词汇特点与对外汉语教学
发布时间:2023-05-18
汉语词汇特点与对外汉语教学 一、汉语词汇的特点 汉语的词汇有以下特点: 1.以单音节语素为基本形式 语素是语言的最小单位,也是构词的最小单位。以单音节语素构词是现代汉语词汇的突出特点。口头上,一个单音节语素指的是一个带声......
基于知网义原信息量的词语相似度计算方法
发布时间:2015-09-11
摘要:国内利用知网计算中文词语相似度通常采用基于义原距离的方法,这些方法依赖于公式设计和参数选取。根据信息论中计算两个事物相似度的思想,利用知网的分类体系来计算词语所包含的义原信息量,将义原及其角色关系的信息量作为词......
越化汉语词之越化方式分析
发布时间:2023-05-09
摘 要 中越两国历史关系及文化交流极为密切。在接触与交流过程中,中国文化对越南具有很大的影响,大量的汉语词汇也陆续输入越南语。在整套汉越语传入之后,汉越词与越南语进一步融合,并逐渐被越化,又形成了一种新的词――越化汉语......
谈谈英语写作的基本方法
发布时间:2023-02-22
" 有人说,写作是将其内在思维组织成文,再用语言外化表达的复杂过程,大致分为三个阶段: 1.构思:构思是写作的起始酝酿阶段,是动笔成文前的准备阶段,也是写作成功的重要阶段。考虑写作的目的、内容、方法: 2.表述:表述是写作具体......
汉语习语英译方法研究
发布时间:2023-07-15
汉语习语英译方法研究 汉语http://WwW.LWlM.cOm习语又可称为熟语,就其广义而言,包括成语,谚语,俗语和歇后语,典故等(张培基,1979:9)。习语在英语中相当于idiom,Longman Dictionary of Language Teaching&Applied Linguistics一书中是......
名词短语的内部结构及其句法实现
发布时间:2023-01-30
名词短语的内部结构及其句法实现 名词短语的内部结构及其句法实现 名词短语的内部结构及其句法实现 关键词: 简明短语结构;名词短语;线性化;论元 摘 要: 简明短语结构下线性化的要求取消了名词短语结构中的中间投......
浅谈新时期汉语新词语
发布时间:2023-02-28
【摘要】进入新时期以后,汉语新词语大量涌现,出现了现代汉语词汇发展的第三次高峰。这一时期词汇的发展是由社会因素、心理因素以及词汇结构本身的因素三方面所决定的。其主要来源是旧词、方言词、外来词及新造词。其构词方式有一定的......
基于汉语韵母与日语汉字的音读浅议
发布时间:2023-05-09
摘要:由于古代中国强大的文化影响力,随之汉字也传入到了日本,经过不断的吸收、演变形成了现代日语。而对于日语学习者来说,要掌握到汉语中的读音有一定的难度。基于此,本文从日语汉字音读的来源作为切入点,并试着从现代汉语角度直......
成语里的古汉语知识
发布时间:2023-04-13
成语里的古汉语知识 成语一般来自古代文学作品,保留了许多古代汉语方面的知识,主要有: 一、 通假 成语里的通假现象(成语中加点字通括号中的字,读本字音,即读括号里的字音),如:图穷匕见(现),一暴十寒(曝),厉兵秣马(砺......
关于汉英基本颜色词文化内涵对比研究
发布时间:2022-10-24
" 论文关键词:基本颜色 文化特征 对比 交际 论文摘要:语言是文化的载体,词汇是语言中最为活跃的元素,而颜 色词更与我们人类密切相关,体现不同地区和民族的文化特征。本文就汉英两种语言中基本颜色词汇的不同文化内涵进行了对......
词语的误解误用义与汉语词汇教学
发布时间:2022-12-01
引发词义引申演变的机制多种多样,常见的有词义感染、词义渗透、相因生义、组合同化、类同引申等。这些转变主要基于词汇的组合与聚合关系,是语言内部力量引起的。除此之外,还有一种特殊的、源于语言外部的力量也会促发词义的转变,那......
基于声音信号的结构损伤识别方法分析
发布时间:2016-09-05
道岔转换设备外锁闭装置及安装装置是保证提速和重载线路运输安全的重要设备,外锁闭装置及安装装置通过电动转辙机的牵引来实现道岔的解锁和锁闭。如果转辙机中重要结构出现损伤,将会直接影响转辙机的工作,甚至会导致转辙机失效而引发......
基于二维条码的身份识别系统解码研究
发布时间:2019-12-09
摘要:二维条码已经运用到身份识别中。将个人信息和照片编在二维条码中,不但可以实现身份的自动识读,而且可以有效防止伪造和使用假冒证件。探讨了PDF417二维条码的识别与解码算法及在身份识别上的应用。分析了多种图像处理方法,针对条码图片的特点,采取特定的图像处理方法以得到最佳效果。在.Net平台开发环境下,用C#语言首先对各种图像预处理方法进行分析和对比,然后在图像识别时对图片进行预处理。对处理后的图.........
介词框架“在……之上”概念整合机制及语法化考察
发布时间:2015-08-19
摘 要:介词框架是现代汉语中出现频次很高,分布率也非常高的一种框式结构,其形成经历了长时间的历时演变,介词框架的形式和意义形成符合认知语义学中概念整合的机制,通过对“在……之上”语法化轨迹的阐释,以此为线索例证前领式“......
汉语流行语的日译方法探究
发布时间:2023-02-17
汉语流行语的日译方法探究 http://WwW.LWlM.cOm 一 随着时代的进步,互联网不断普及,现代汉语流行语发展迅猛。这些铺天盖地、令人眼花缭乱的流行语,其产生途径是多种多样的。 1.源于仿拟词 仿拟即模仿现有的语言材料进行创新,包括......
汉语反义词研究与对外汉语教学
发布时间:2022-12-15
汉语反义词研究与对外汉语教学摘要:分析对外汉语教学中所涉及到的反义词问题,提出对外汉语教学和语言学的多个有待研究的课题,对对外汉语的反义词教学提出建议。 关键词:反义词 对外汉语教学 偏误 对外汉语教学中,同义词、近义词......
英语中的汉语借词及其社会文化功能
发布时间:2023-02-05
一、相关概念(1)中国英语(China English)中国英语的概念,由葛传槼先生1980 年在《翻译通讯》首次提出,以区别于不规范的中式英语(Chingl.........
从汉俄量词的比较谈汉语量词教学
发布时间:2023-01-12
摘 要:量词是汉语中非常重要的词类,而俄语中没有明确地划分出量词这一词类,因此量词成为以俄语为母语的学习者掌握汉语的难点之一。本文通过对汉俄语量词的初步比较,梳理了两种语言中量词使用的异同,并在此基础上提出针对母语为俄......
从汉俄量词的比较谈汉语量词教学
发布时间:2022-09-06
一、引言 具有丰富的量词是汉语的特点之一,也是留学生学习汉语的重点和难点之一。由于现代汉语中量词特别丰富,使用频率较高,分类也比较细,而汉语与俄语的量词存在很多差异,给母语为俄语的学生学习掌握汉语量词造成了一定困难。 ......
基于DXF文件的石材桥切机自动编程方法
发布时间:2022-08-04
随着社会的不断发展,人们对于石材制品的要求更加复杂化、多样化。然而,目前国内石材加工装备的技术水平总体较低,难以满足现代石材制品高质量、高效率的加工要求。国外进口设备价格高昂,也无法完全满足市场的需求。因此,结合市场的......
论市场经济条件下地方文献的收集、开发和利用
发布时间:2013-12-18
论市场经济条件下地方文献的收集、开发和利用 论市场经济条件下地方文献的收集、开发和利用 地方文献论文 更新:2006-4-8 阅读: 论市场经济条件下地方文献的收集、开发和利用 ......
论模糊词语的释义方法
发布时间:2023-03-19
" 摘要 语文辞典所收的词语基本上可以分为两大类:明晰词语和模糊词语,即通常所说的明晰语言和模糊语言。对于明晰词语,可以运用明晰语言来揭示其本质特征,从而达到释义的准确;而对于模糊词语,还得运用模糊理论及模糊语言来加以解释......
关于《现代汉语词典》释义的讨论
发布时间:2022-11-14
摘要对《现代汉语词典》释义的探讨能积极促进释义的改进。几篇对具有某种语法特征的词释义提出质疑和改进意见的文章,表现出对一般语文词典释义的性质、释义的应用认识片面,文章就此做出具体分析。 关键词语文词典释义语义特征 ......
试析现代汉语方言拟声词研究
发布时间:2022-12-03
" [论文关 键 词] 方言;拟声词;构词法;词汇化;语音韵律。 [论文内容摘要] 本文从现代汉语方言拟声词研究的三大方面:构词法、词汇化及语音韵律对近几十年汉语方言拟声词研究进行归纳与评述,揭示历史研究、语音研究及类型学......