蒙古文编码转换研究

蒙古文编码转换研究

论文摘要

蒙古文信息处理开端于上个世纪70年代末期,随着计算机技术在蒙古文信息处理中的应用,许多研究单位在蒙古文文字处理方面都取得了一些重要的进展。进行蒙古文信息处理的研究工作,首先要解决蒙古文编码、蒙古文输入、蒙古文字库等关键基础技术问题。就蒙古文编码而言,由于研究工作相对独立,且国家没有及时制定蒙古文编码统一标准,各研究单位一般都采用了自定义的基于字形的蒙古文编码系统。在1993年,ISO/IEC10646国际编码标准中才定义了蒙古文国际标准编码。蒙古文信息处理的研究工作最先是在文字排版方面展开的,由于文字排版系统对文字而言比较关注的是文字的“形”,一个单词只要能够出现正确的形状即可。因此基于形码的蒙古文编码方案也应运而生。蒙古文显现字符中普遍存在“一形多音”现象,并且有些组成一个字符的部分结构,在其它多个字符中都可能重复出现,不同的研究单位在制定各自的形码方案时有的采用一个字符,只定义一个编码,但可以表示多个不同发音的字母;有的采用一个字符定义多个编码,相同字形编码不同,可表示不同发音的字母;有的采用将多个字母中都会出现的部分结构,重新定义为一个“字符”或从文字书写的习惯和美观角度出发,将字母中的部分笔画进行了重组,并为每一个“字符”定义一个编码。随着蒙古文信息化的不断深入,人们开始逐渐意识到蒙古文编码差异造成的问题。由于蒙古文编码系统的互不兼容,经常导致技术上的重复开发,在不同编码系统上开发的信息资源无法共享,造成人力、物力和财力的极大浪费。本文主要讨论蒙科立蒙古文编码、智能蒙古文编码、赛音蒙古文编码和蒙古文国际标准编码的转换问题。这里提到的蒙古文特指传统蒙古文,而不包括托忒文、锡伯文、满文和阿礼嘎礼字符。蒙科立蒙古文编码、智能蒙古文编码、赛音蒙古文编码采用的是基于UNICODE的形码编码方案,转换后的蒙古文标准编码拟采用正在报批过程中的蒙古文国家标准编码。整个编码转换工作分三个步骤进行。第一步:分析编码特征,制定编码转换规则,由计算机程序实现编码初步转换。第二步:建立蒙古文词典库,用来校对转换单词的准确性。第三步:建立平行语料库,补充词典库词汇量不足问题,进一步校准不确定的编码转换。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 图表目录
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 研究内容
  • 1.3 论文的结构
  • 1.4 开发环境
  • 第二章 蒙古文编码系统
  • 2.1 蒙古文国际标准编码系统
  • 2.2 智能蒙古文编码系统
  • 2.3 蒙科立蒙古文编码系统
  • 2.4 赛音蒙古文编码系统
  • 第三章 蒙古文国际标准编码字库设计
  • 3.1 OpenType字体技术简介
  • 3.2 蒙古文国际标准编码OpenType字库设计
  • 3.3 基于蒙古文国际标准字库的键盘布局设计
  • 第四章 编码转换的实现
  • 4.1 蒙古文最小字素
  • 4.2 智能、蒙科立、赛音编码和最小字素的转换
  • 4.3 智能编码和国际编码的转换
  • 4.4 形码到国际标准编码的转换
  • 4.4.1 蒙古文正字词典在最小字素编码转智能编码中的作用
  • 4.4.2 用平行语料库转换正字法词典中不包含的单词
  • 4.4.3 建立不规则特殊词词库
  • 第五章 总结
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].提高人口普查职业编码准确性的思考[J]. 统计科学与实践 2020(08)
    • [2].大众车系编码简谈[J]. 汽车与驾驶维修(维修版) 2018(06)
    • [3].数据[J]. 检察风云 2018(14)
    • [4].编码里是诚信[J]. 中国自动识别技术 2014(04)
    • [5].癫痫的ICD-10编码技巧[J]. 大家健康(学术版) 2015(09)
    • [6].进口水果的编码秘密[J]. 健康之家 2013(09)
    • [7].临床常用疾病诊断编码库的构建与思考[J]. 中国卫生质量管理 2020(01)
    • [8].基于凿孔的系统极化码编码协作[J]. 应用科学学报 2017(02)
    • [9].完善金融机构编码管理的建议[J]. 信息系统工程 2015(03)
    • [10].“规则”与“创造”——以《班级图书角里的图书编码》为例[J]. 湖北教育(教育教学) 2016(10)
    • [11].黄金周编码[J]. 环境与生活 2016(10)
    • [12].发现一类新型环状非编码RNA[J]. 科学世界 2015(04)
    • [13].马尔尼菲青霉菌病及其ICD-10编码[J]. 中国病案 2011(04)
    • [14].编码调整的实施方案[J]. 实验技术与管理 2011(04)
    • [15].基本DOI编码与规则[J]. 中华普外科手术学杂志(电子版) 2010(03)
    • [16].不能忽视编码管理这个基础[J]. 中国计算机用户 2008(27)
    • [17].“鱼文化”内涵探析——基于文化符号学“N级编码”的视角[J]. 哈尔滨学院学报 2017(11)
    • [18].编码中残余类目.9的误用分析[J]. 中国病案 2016(07)
    • [19].《语言和空间中的运动编码》评介[J]. 外语教学与研究 2015(02)
    • [20].央视爱国街采的“编码—解码”理论剖析[J]. 人民论坛 2013(35)
    • [21].“数字与编码”教案[J]. 中小学数学(小学版) 2010(05)
    • [22].浅谈易被忽略的“另编码”[J]. 中国病案 2014(10)
    • [23].白血病的ICD-10编码探讨[J]. 现代医院 2011(03)
    • [24].浅淡容易忽略的ICD-10编码[J]. 现代医院 2011(10)
    • [25].证券编码及相关标准研究初探[J]. 标准科学 2011(08)
    • [26].脊柱融合术编码的探讨[J]. 中国病案 2010(05)
    • [27].关于自行车上刻制编码的一点建议[J]. 中国自行车 2009(02)
    • [28].肝硬变的病因对ICD-10编码的影响研究[J]. 中国病案 2009(04)
    • [29].编码深度和提取方向对儿童再认的影响[J]. 中国临床心理学杂志 2008(03)
    • [30].皮肤软组织缺损ICD-10编码探讨[J]. 中国病案 2020(08)

    标签:;  ;  ;  

    蒙古文编码转换研究
    下载Doc文档

    猜你喜欢