机器翻译中汉语动结式生成的过程和困难

时间:2023-03-18 14:35:30 计算机毕业论文 我要投稿
  • 相关推荐

机器翻译中汉语动结式生成的过程和困难

1.引言
  当电子计算机1946年问世的时候,人们就提出了机器翻译的想法,并且在1954年进行了第一次机器翻译试验。然而与后来的各种语言信息处理研究和应用(语言信息检索、文本自动分类、自动文摘、信息提取等等)相比,机器翻译却是进展最慢的。学者们倾其大半生精力、商家投入为数可观的资金,经历五十多年不懈的研究和开发,得到的成果或者产品却常常不能令人满意。
  原因是什么呢?从语言研究的角度来说,机器翻译系统分析、理解和生成自然语言的能力都还不到位,处理不了的语言现象很多:有的是句子结构层次弄错了,有的是结构关系弄错了,有的是成分之间的语义关系弄错了,有的是词义辨识错了,还有的错误是源语和目标语之间的对比差异造成的。下面是机器翻译处理汉语动结式不成功的几个例子(来自三个机器翻译系统)。
  先看生成的情况,机器翻译目前还很难生成汉语的动结式,所以我们很少在汉语译文里见到含有动结式的句子。对于下面这个英译汉的例子,三个系统都不能翻译成“他把地扫干净了”:
He swept the floor clean.  * 他干净地扫地了。
             * 他清扫清洁的地板。
             * 他清扫地板干净。
  
  再看汉语动结式翻译成英语的例子,它们可以说明目前机器翻译系统分析和理解汉语动结式的能力:
他踢坏了三双鞋。 *He plays three pairs of evil shoes.
        *He kicked three pairs of shoes bad.
        *Him kick spoil 3 pairs of shoes.
这段路把妈妈走累了。*The way make mother tired after the walk.
      *This section of way was walked mother tired(ly).
         *This road mother walk tired.
大家吃腻了剩菜。*Everybody has fedded up with the leftovers.
      *That everybody ate greasy(ly)surplus vegetable.
      *All eat,is loathe to leave vegetable.
  
  下面我们只讨论动结式的生成问题,其中不包括以下三种情况:1)补语用“得”字连接的;2)补语虚化的,如:“抓住”、“买着”、“看完”、“办成”等;3)补语和动结式的宾语有固定搭配关系的,如:“说走了板”、“看愣了神”、“苦出了头”等等。
    2.机器翻译中的动结式问题
  为了说明机器翻译如何处理动结式述语结构,我们需要先看看机器翻译的过程。下图说明了机器翻译的原理,也是机器翻译的整个过程。
  附图
    图1 机器翻译的过程
  显然,这是一个理想化的机器翻译过程。从S到I再到T的过程是中介语言的翻译策略,中介语言通常是某种独立于源语和目标语的逻辑表达式。如果是英译汉,对英语的分析和理解要从表层深入到底层,得到描述句子意义的中介语言逻辑表达式。同样地,汉语也要从底层到表层一步一步生成。分析时从表层到底层走得越深,生成时从底层回到表层的过程也就越复杂。因此,需要分别对这两种语言的句法和语义系统作深入的研究。实际上目前大部分机器翻译系统都作不到这个程度,常见的翻译策略是直接法或转换法,或直接和转换相结合的混合方法。我们可以通过一个英译汉的例子对直接法、转换法和中介语言法这三种翻译策略作一个比较:
  You get good reception on your radio.(摘自某产品说明书)
  译句1 你得到好的接收在你的收音机上。
  译句2 你用你的收音机得到好的接收。
  译句3 你的收音机接收情况良好。
  在机器翻译系统中,用直接法可以得到译句1;用基于句法的转换法,再加上一些语义关系的分析,能得到译句2;译句3是基于理解的,用中介语言法有可能作到。显然,前一节关于动结式英译汉和汉译英的例子,都不是基于理解的翻译。
  动结式的结构形式简洁,语义关系复杂,在汉语里是很有特点的一种结构。吕叔湘先生(1986)曾用它说明汉语句法的灵活性。人们在从各种角度论述动结式述补结构的时候,常常会提到它在对外汉语教学当中是个难点。同样,在机器翻译中它也是个难题。在汉语翻译成外语的系统里,难的是如何分析和理解动结式述补结构。在外语翻译成汉语的系统里,难的是如何生成含有动结式的句子。

  我们在这里只讨论生成的情况。在这种情况下,源语(例如英语)往往没有相当于汉语动结式的结构形式,也很难用转换规则把英语的某些结构形式与汉语动结式联系起来。所以除非用个别处理的办法,采用直接法和转换法翻译策略的系统很难生成汉语的动结式译文。要让系统有生成动结式的能力,就要按中介语言法的思路,增加分析的深度,理解源语句子要表达的意思(各个成分的概念意义、成分之间的关系意义,句子的句式意义,等等),然后根据意义表达的需要,选择动结式的一种结构形式,再生成表层的句子。目前我们对汉语的研究还不足以支持这样的生成过程。所以在现有的机器翻译系统输出的汉语译文当中,很难找到地道的含有动结式述补结构的句子。于是就有了下面的译文:
  He has made the question complicated.他已使问题复杂化。(他把问题搞复杂了。)
  The children have had enough to eat.孩子们已吃了足够。(孩子们吃饱了。)
  这样的译文对机器翻译来说就算不错了,只是念起来有些别扭,有点“机器味儿”。
    3.动结式的生成过程
  机器翻译译文生成的任务是从要表达

【机器翻译中汉语动结式生成的过程和困难】相关文章:

平衡结果和过程指标06-02

SCI论文发表过程中的几种状态02-02

word自动生成目录和参考文献的技巧04-19

浅谈对外汉语教学中的词汇教学04-20

浅谈数学教学中过程及方法目标的落实论文04-22

飞机起降过程中机场道面的动力响应05-11

微型粉末注射成型:加工过程的描述和模拟(一)08-11

流动儿童接受城市教育过程中存在的问题研究的论文10-01

对外汉语教学中的中西文化交际08-29

城市规划建设过程中应保护利用城市文化05-06