基于语料库的同义词“持续”、“连续”的辨析

时间:2020-09-14 19:48:51 语言文学毕业论文 我要投稿

基于语料库的同义词“持续”、“连续”的辨析

  摘 要:文章以同义词“持续”和“连续”为例,通过使用语料库,运用搭配理论和语义韵理论,展示了语料库技术在同义词辨析方面的重要作用。

基于语料库的同义词“持续”、“连续”的辨析

  关键词:语料库;持续;同义词辨析;连续

  关于同义词辨析,传统方法是借助于“同义词辨析词典”等参考书,这一方法的缺点在于:举例不充分,阐述难理解。随着计算机技术的突飞猛进,大型语料库的建立为同义词辨析提供了新的方法和途径。

  一、语料库在词汇研究中的运用

  (一)语料库的运用

  语料库就是一定规模的真实语言样本的集合,有三个特性:一是收入语料库的语言材料应当取自真实文本;二是语料库应是机器可识别和读取的;三是语言材料经过适当标注和加工处理。通过对语料库检索统计,可以发现同义词在不同语域中的词频分布差异,计算出词语搭配的相互信息值,通过观察检索行中所呈现的同义词搭配特征,就能揭示出它们不同的类联结、搭配关系和语义韵等语言特征。

  (二)相关理论

  1、搭配理论

  “所谓搭配关系,就是指词与词之间的横组合关系,即什么词经常与什么词组合在一起。词的意义在特定的搭配关系中常常具有特定的意义。”搭配指个别词项之间习惯性的同现。例如“布”作名词时与“匹”、“料”搭配,作动词时与“置”、“分”搭配。搭配通常分为词汇搭配和语法搭配。词汇搭配存在于名词、动词、形容词和副词之间的搭配关系中,如我们常说“吃面”,而不说“喝面”,因为根据“面”的词义,与“吃”特征比较匹配。

  2、语义韵理论

  一定的词项会习惯性地吸引某一类具有相同语义特点的词项,构成搭配。由于这些具有相同语义特点的词项与关键词项在文本中高频共现,后者就被“传染”上了有关的语义特点,整个语境内就因此弥漫了某种语义氛围,这就是语义韵。

  二、“持续”在语料库中的搭配考察

  选定国家语委现代汉语语料库作为考察数据,因为它语料规模很大,时间跨度大,语料收录广泛,是一个大型通用的现代汉语平衡语料库;同时在数据处理功能上,完成了词语切分和词性标注。

  (一)“持续”的搭配情况

  在语料库中收集并整理得到有效语料700例,“持续”后面的搭配词语可分为三类:形容词、动词和名词,另有个别词项为副词和助词以及零搭配等。这样得到“持续”的搭配情况:“持续+VP”、“持续+NP”和“持续+AP”。

  1、持续+VP

  在这一情况中,“VP”主要有性状动词、动作动词、趋向动词和关系动词。其中性状动词所占比例最高,出现频率最高的是“发展”一词,其他如“增长、不降、不退、振兴、好转、贬值”等表事物变化或消失义的动词。其次是动作动词,如及物动词“开发、保护”等,不及物动词“循环、创新”等。

  2、持续+NP

  在这一情况中,“持续”与表时间的名词的搭配占绝对比例,高达77%。如“持续(一定/很长/的/一段)时间”、“持续时间+(为/可达)+数量时间名词”、“持续时间+(比较/最/越/也)+长/短”等等。

  3、持续+AP

  在这一情况中,“持续” 借助其他成分限制或修饰后面的词语,如“持续(偏/走)+高”,这类词语大多是性质形容词,如“高涨、异常”等。

  (二)“持续”搭配词的语义色彩倾向

  通过研究发现,“持续”的语义韵呈现中性倾向。其搭配词语多表示中性色彩和积极色彩。在VP类词语中,语义韵呈现积极倾向,如“振兴、发展”等;在NP类词语中,语义韵呈现中性倾向,因为NP中占绝对比例的表示时间类的词都是中性词,属于客观反映。

  三、“连续”的语料库考察

  (一)“连续”的`搭配情况

  在语料库中收集并经过整理得到有效语料771例。“连续”的搭配词语主要是动词和名词,形容词只有4例。另有个别搭配词项为助词、零搭配和后接成分等。这样得到“连续”的搭配情况:“连续+VP”、“连续+NP”。

  1、连续+VP

  在这一搭配中,“VP”主要有性状动词、动作动词和关系动词等几类。其中动作动词所占比例最高,以及物动词为主,如“观测、出现”等。

  2、连续+NP

  在这一搭配中,名词性成分可以分为三类:时间类、专名类、普通类。时间类NP可做状语、定语或谓语,如“连续几天、连续多年”等。专名类主要是指“连续”后接名词属于专业术语,如“~函数、~点”属于数学术语,“~介质”属于物理术语等。普通类NP以抽象名词为典型搭配,如“低温、生活”等。

  (二)“连续”搭配词的语义色彩倾向

  经研究,在VP类词语中,语义韵呈现中性倾向,如“观测、出现”;在NP类词语中,语义韵亦然,因为NP中占绝大多数的时间类和专名类词全部为中性词,属于客观反映。总的看来,在“连续”的搭配情况中,近绝大部分的词都呈中性色彩。

  四、结语

  用语料库进行搭配分析提供了一种新颖直观的同义词辨析方法,经研究,“持续”和“连续”在搭配形式和语义韵特征上都存在差异。“持续”可以搭配动词性、名词性和形容词性成分,而“连续”后面却不能搭配形容词性成分;与“持续”搭配的词语有中性倾向和积极倾向,而与“连续”搭配的词语只有中性倾向。

  参考文献:

  [1] 杨节之.语料库搭配检索与英语同义词辨析[J].外语电化教学,2007(116)

  [2] 翟红华,方红秀.国内语义韵研究综述[J].山东外语教学,2009(2)

  [3] 杨岩勇.基于语料库的同义词辨析[D].广州:暨南大学硕士学位论文,2007(5)

  [4] 王文斌.英语词汇语义学[M].杭州:浙江教育出版社,2001

  [5] 卫乃兴.语料库数据驱动的专业文本语义韵研究[J].现代外语,2002(2)

【基于语料库的同义词“持续”、“连续”的辨析】相关文章:

1.基于语料库英语“心”的研究论文

2.基于语料库的“比较级”英语语法课堂展示

3.基于IT技术的持续审计的内部审计中的实现论文

4.基于语料库的中国英语学习者增强程度副词使用研究论文

5.基于联结主义的连续记分IRT模型的项目参数和被试能力估计

6.2021年成人高考英语的同义词辨析方法

7.《持续的幸福》推荐

8.日语助词的辨析