汉英双向时间数字和数量词的识别与翻译技术

汉英双向时间数字和数量词的识别与翻译技术

论文摘要

命名实体识别与翻译是机器翻译的重要组成部分。本文使用基于语料库的方法,挖掘提取语料库中数字、时间日期、数量词的表达模式,并由此转换为规则,实现了中英数字、时间日期、数量词这几种命名实体的识别与双向翻译。本文的研究内容主要包括四部分:(1)介绍了自动机理论,为后文的规则提取与利用作理论铺垫,并阐述了有限状态自动机、非有限状态自动机和正则表达式之间在正则语言表达上的等价关系。本文先从大量的语料中挖掘出中英命名实体的表达模式,再将这些表达模式转化为规则,也就是以正则表达式的形式给出。(2)采用同步上下文无关文法来解析和翻译时间日期。同步上下文无关文法在上下文无关文法的基础上,给每条文法增加翻译文法规则,从而把解析的过程与翻译的过程同步起来。而对于同步上下文无关文法的解析,采用了CYK+算法。(3)本文将数量词定义为:数字+量词+名词。“数字”部分直接将前面数字的识别与翻译系统作为这里的一个模块,量词则使用语言学家总结的量词表,对于名词部分,则采用数据挖掘的策略,从大语料的phrase-table中来抽取中英数量词翻译对。(4)将中英数字、时间日期、数量词的识别与翻译规范进行了详细阐述并给出了实验结果与分析。实验表明具有较高的识别F-measure值和翻译准确率。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 本文研究意义与研究背景
  • 1.1.1 研究意义
  • 1.1.2 研究背景
  • 1.2 命名实体识别与翻译的研究现状与展望
  • 1.2.1 命名实体识别与翻译的任务
  • 1.2.2 命名实体识别与翻译的评测
  • 1.3 本文的主要研究内容及组织
  • 第2章 有限状态自动机
  • 2.1 确定性有限状态自动机
  • 2.2 非确定性有限状态自动机
  • 2.3 DFA 和NFA 与正则表达式之间的关系
  • 2.4 本章小结
  • 第3章 中英数字的识别与翻译
  • 3.1 引言
  • 3.2 中文数字的识别规范
  • 3.3 英文数字的识别规范
  • 3.4 数字的解析与翻译
  • 3.4.1 数字的解析
  • 3.4.2 数字的翻译
  • 3.5 实验结果与分析
  • 3.5.1 实验设置
  • 3.5.2 评价指标
  • 3.5.3 实验及其结果分析
  • 3.6 本章小结
  • 第4章 中英时间日期的识别与翻译
  • 4.1 引言
  • 4.2 中文时间日期的识别规范
  • 4.2.1 基本时间
  • 4.2.2 复合时间
  • 4.2.3 跨度时间
  • 4.2.4 不可标注的时间日期表达式
  • 4.3 英文时间日期的识别规范
  • 4.3.1 基本时间
  • 4.3.2 复合时间
  • 4.4 时间日期的解析
  • 4.4.1 同步上下文无关文法
  • 4.4.2 时间日期的解析
  • 4.5 实验结果与分析
  • 4.5.1 实验设置与评价指标
  • 4.5.2 实验及其结果分析
  • 4.6 本章小结
  • 第5章 中英数量词的识别与翻译
  • 5.1 引言
  • 5.2 中英数量词调研
  • 5.3 量词名词搭配模式挖掘
  • 5.4 实验结果与分析
  • 5.4.1 实验设置与评价指标
  • 5.4.2 实验及其结果分析
  • 5.5 本章小结
  • 结论
  • 参考文献
  • 攻读学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].会叠罗汉的数量词[J]. 小学生学习指导 2020(27)
    • [2].数量词搭配教学[J]. 小学语文教学 2009(11)
    • [3].从认知语言学角度来看汉语数量词“道”的用法[J]. 短篇小说(原创版) 2018(26)
    • [4].英日语中数量词的后置用法比较[J]. 首都外语论坛 2010(00)
    • [5].上古汉语数量词研究的现状及意义[J]. 黑龙江史志 2010(01)
    • [6].浅析汉日互译中数量词的错位翻译[J]. 中国民族博览 2020(04)
    • [7].数量词“两X”表不定数用法探析[J]. 语言教学与研究 2012(06)
    • [8].含数量词的动植物名称及其英译[J]. 科技英语学习 2008(02)
    • [9].基于构式语法的“数量词A+に+数量词B”构式研究[J]. 日语学习与研究 2012(06)
    • [10].古汉语数量词用法考察[J]. 和田师范专科学校学报 2008(02)
    • [11].数量词的个性及其指代功能的理据解析[J]. 上海师范大学学报(哲学社会科学版) 2014(06)
    • [12].例析文言文数量词[J]. 新课程(中学版) 2009(12)
    • [13].浅析德语中的量词以及数量词结构[J]. 淮阴工学院学报 2011(06)
    • [14].从“八成”看数量词虚化为副词[J]. 文学教育(下) 2019(06)
    • [15].从关联理论的角度分析数量词的模糊性[J]. 文教资料 2009(24)
    • [16].英语新闻报道中模糊数量词的语用分析[J]. 怀化学院学报 2012(06)
    • [17].汉语双数量词构式研究[J]. 浙江大学学报(人文社会科学版) 2009(03)
    • [18].双宾句中数量词相关的不对称现象及其生成机制[J]. 齐齐哈尔大学学报(哲学社会科学版) 2020(05)
    • [19].表小数量的「数量词+も」及其对应的汉语表达形式[J]. 日语教育与日本学研究 2016(00)
    • [20].英汉互译中的数量词翻译[J]. 青年文学家 2009(05)
    • [21].《论语》数量词分析[J]. 甘肃广播电视大学学报 2008(04)
    • [22].数量词妙用 诗情画意浓[J]. 古典文学知识 2009(03)
    • [23].日语「たち」汉语“们”与确数数量词的同现研究[J]. 日语学习与研究 2019(03)
    • [24].日语存在句的数量词研究——从体和数量词游离的角度[J]. 福建商学院学报 2017(03)
    • [25].多元化课程下的听评课例谈——以大班语言活动《好饿的毛毛虫》为例[J]. 今日教育(幼教金刊) 2018(Z1)
    • [26].数量词的认知语义扩展:从精确到模糊[J]. 安徽工业大学学报(社会科学版) 2009(04)
    • [27].量词的性质及量词结构的构造[J]. 浙江外国语学院学报 2019(04)
    • [28].词缀“生”补说[J]. 语言研究集刊 2012(00)
    • [29].浅谈古诗里数量词的表达功能及其教学[J]. 教育实践与研究(小学版) 2008(10)
    • [30].英语单位数量词结构语义研究[J]. 剑南文学(经典教苑) 2012(07)

    标签:;  ;  ;  ;  

    汉英双向时间数字和数量词的识别与翻译技术
    下载Doc文档

    猜你喜欢