英汉命名实体翻译方法研究

英汉命名实体翻译方法研究

论文摘要

命名实体翻译是跨语言信息抽取、机器翻译等跨语言信息处理领域的一项重要任务。命名实体因类别不同采用的翻译方法不同,人名、地名主要采用音译,组织机构名主要采用音译与意译相结合的方法翻译。本文主要针对英汉人名的统计翻译模型方法和基于网络的英汉人名和组织机构名的翻译挖掘方法进行研究。论文的主要内容归纳如下:基于统计机器翻译与基于机器学习策略的英汉音译模型构建方法基于统计机器翻译的音译模型将音译问题映射为句子翻译问题,采用基于短语的和基于N-Gram的机器翻译方法构建音译模型。基于机器学习策略的音译模型将音译问题映射为标注序列问题,采用条件随机场和最大熵两种机器学习方法构建音译模型。对比以上几种音译模型,基于条件随机场的音译模型准确率最高。基于音译与网络的英汉人名翻译挖掘方法本文将统计模型的结果应用到网络挖掘中,通过构造启发式查询扩展获取质量更高的摘要资源,改善网络挖掘翻译的结果。对比基于统计模型的音译方法和基于网络的翻译挖掘方法,实验结果显示基于网络挖掘的翻译挖掘方法具有较高的性能,该方法修正了基于统计音译模型翻译结果中部分汉字不正确的情况。基于网络的英汉组织机构名翻译挖掘方法本文采用基于对齐锚点左右扩展的对齐方法对齐组织机构名双语对语料,然后从对齐结果中抽取组织机构名内部词汇和短语翻译词典。采用该词典作为查询扩展来源从网络中抽取翻译。对比基于网络的翻译挖掘方法和基于短语的统计机器翻译方法,基于网络的翻译挖掘方法性能较高。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状和相关工作
  • 1.2.1 音译模型研究
  • 1.2.2 组织机构名翻译模型研究
  • 1.2.3 基于网络的翻译知识抽取技术研究
  • 1.2.4 基于网络的命名实体翻译抽取技术研究
  • 1.3 本文的研究内容
  • 1.4 论文的组织
  • 第二章 英汉人名音译模型
  • 2.1 音译单元对齐
  • 2.2 统计机器音译方法
  • 2.2.1 基于短语的机器音译方法
  • 2.2.2 基于N-Gram 的机器音译方法
  • 2.3 基于机器学习策略的音译方法
  • 2.3.1 最大熵模型
  • 2.3.2 条件随机场模型
  • 2.3.3 基于机器学习策略的音译模型
  • 2.4 实验结果及分析
  • 2.4.1 实验数据及工具来源
  • 2.4.2 基于统计音译方法实验结果及分析
  • 2.4.3 基于机器学习策略的音译模型实验结果及分析
  • 2.5 本章小结
  • 第三章 基于网络的英汉人名翻译挖掘方法
  • 3.1 设计思路和系统架构
  • 3.2 启发式查询扩展的构造
  • 3.2.1 基于共现主题词译文的扩展集合抽取
  • 3.2.2 基于加权翻译概率的扩展字集合抽取
  • 3.3 候选翻译串的抽取
  • 3.4 候选翻译串的排序
  • 3.5 实验结果及分析
  • 3.6 本章小结
  • 第四章 基于网络的英汉组织机构名翻译挖掘方法
  • 4.1 设计思路和系统架构
  • 4.2 组织机构名内部词汇对齐方法
  • 4.3 启发式查询扩展的构造
  • 4.4 候选翻译串的选择及排序
  • 4.5 实验结果及分析
  • 4.6 本章小结
  • 第五章 总结与展望
  • 5.1 工作总结
  • 5.2 工作展望
  • 参考文献
  • 攻读学位期间公开发表的论文
  • 致谢
  • 相关论文文献

    • [1].跨语言命名实体翻译对抽取的研究综述[J]. 计算机科学 2017(S1)
    • [2].命名实体情报挖掘方法研究及其在图书馆中的发展[J]. 图书馆理论与实践 2017(10)
    • [3].命名实体类流行语描述性释义的识别研究[J]. 现代语文(语言研究版) 2015(02)
    • [4].基于多标签的军事领域命名实体识别[J]. 计算机科学 2019(S2)
    • [5].基于特征相似度的可比语料挖掘汉柬命名实体等价对[J]. 计算机与数字工程 2017(05)
    • [6].基于转移学习的命名实体挖掘技术[J]. 上海交通大学学报 2011(02)
    • [7].一种无指导命名实体关系抽取研究[J]. 咸宁学院学报 2009(06)
    • [8].基于模板的汉维商品命名实体翻译研究[J]. 现代计算机(专业版) 2015(08)
    • [9].一种基于概率主题模型的命名实体链接方法[J]. 软件学报 2014(09)
    • [10].地理命名实体分类体系的设计与应用分析[J]. 地球信息科学学报 2010(02)
    • [11].基于条件随机场的中医临床医案症状命名实体抽取研究[J]. 世界科学技术-中医药现代化 2020(06)
    • [12].从客户评论中识别命名实体——基于最大熵模型的实现[J]. 现代图书情报技术 2011(05)
    • [13].基于机器翻译语块的命名实体翻译方法研究[J]. 硅谷 2015(03)
    • [14].多特征融合的中文命名实体链接方法研究[J]. 情报学报 2019(01)
    • [15].基于深度表示的中医病历症状表型命名实体抽取研究[J]. 世界科学技术-中医药现代化 2018(03)
    • [16].基于词向量和条件随机场的中文命名实体分类[J]. 计算机工程与设计 2020(09)
    • [17].命名实体关系抽取算法的改进[J]. 计算机工程 2010(24)
    • [18].中文嵌套命名实体关系抽取研究[J]. 北京大学学报(自然科学版) 2019(01)
    • [19].基于用户查询日志的命名实体挖掘[J]. 中文信息学报 2010(01)
    • [20].基于多模型结合的军事命名实体识别[J]. 兵工自动化 2011(10)
    • [21].电子病历中命名实体的智能识别[J]. 中国生物医学工程学报 2011(02)
    • [22].音乐命名实体识别方法[J]. 计算机应用 2010(11)
    • [23].中文网页搜索日志中的特殊命名实体挖掘[J]. 哈尔滨工业大学学报 2011(05)
    • [24].基于条件随机场的中医临床病历命名实体抽取[J]. 计算机工程 2014(09)
    • [25].面向工艺操作说明文本的命名实体深度学习识别方法[J]. 计算机应用与软件 2019(11)
    • [26].中文文本的地理命名实体标注[J]. 测绘学报 2012(01)
    • [27].基于Web的命名实体提取的研究方法[J]. 哈尔滨师范大学自然科学学报 2010(02)
    • [28].基于知识图谱的命名实体消歧方法研究[J]. 计算机产品与流通 2020(08)
    • [29].基于半监督话题模型的用户查询日志命名实体挖掘[J]. 中文信息学报 2012(05)
    • [30].基于正反例训练的SVM命名实体关系抽取[J]. 计算机应用 2008(06)

    标签:;  ;  ;  ;  ;  

    英汉命名实体翻译方法研究
    下载Doc文档

    猜你喜欢