• 基于概率上下文无关文法的汉语句法分析方法研究

    基于概率上下文无关文法的汉语句法分析方法研究

    论文摘要句法分析是自然语言处理的一个基本问题。许多自然语言处理任务,比如机器翻译、信息获取、自动文摘等都要依赖句法分析的精确结果才能最终获得满意的解决。同时,句法分析中所使用的...
  • 中文命名实体识别的研究

    中文命名实体识别的研究

    论文摘要中文命名实体识别是自然语言处理的基础任务,是机器翻译、信息检索、问答系统等技术的基础,研究并实现有效的中文命名实体识别方法是本文的主要研究内容。本文主要采用基于机器学习...
  • 基于CRF模型的汉语介词短语识别

    基于CRF模型的汉语介词短语识别

    论文摘要介词短语是汉语中一种重要的短语类型。介词短语识别可以缩小句子中心动词的选择范围;可以简化句子结构,降低后续句法分析的难度;在基于模板的翻译中,它还能为模板匹配提供方便。...
  • 基于最大熵模型的汉语词性标注研究

    基于最大熵模型的汉语词性标注研究

    论文摘要词性标注是为文本中的每个词语标上正确词性的过程。它作为自然语言处理的一项基础性工作,是后续句法分析、组块分析等任务的必要准备。词性标注中出现的错误会在后续处理中被放大,...
  • 基于内容的文本分割关键技术

    基于内容的文本分割关键技术

    论文摘要一般而言,稍长的文本往往都会涉及几个主题或同一主题的多个方面,如果能够自动划分出文本的这种语义结构,将语义段落作为基本处理单元,则会极大的改善传统文本处理技术以篇章作为...
  • 词义消歧语料库自动获取方法研究

    词义消歧语料库自动获取方法研究

    论文摘要一词多义现象给计算机对自然语言的处理带来了许多困难,有不少自然语言理解领域的问题归根到底是解决词语歧义的问题。从人们最初注意到歧义的影响至今已经过去了60多个年头,在这...
  • 事实类问题回答研究

    事实类问题回答研究

    论文摘要事实类问题回答系统包括:问题预处理、问题分析、文档检索、答案抽取、答案排序及答案映射。本文首先详细讨论了事实类问题回答的模块组织,以及实现这些模块的常用方法。然后对其中...
  • 基于词汇对齐的未登录词Web挖掘译文候选的重排序

    基于词汇对齐的未登录词Web挖掘译文候选的重排序

    论文摘要随着互联网的高速发展,网络上的信息越来越丰富,一种有效的信息处理技术——Web文本挖掘技术得到了研究者广泛关注,同时这也为未登录词的快速准确自动的翻译提供了一种有效的途...
  • 列表类自动问题问答系统的设计与实现

    列表类自动问题问答系统的设计与实现

    论文摘要我们已经进入了一个信息飞速发展的时代。面对排山倒海的文字信息,如何从中找到问题的确切答案成了一个重要的研究课题。自动问题回答系统是能够根据用户输入的自然语言问题返回确切...
  • 机械产品设计领域动词属性结构的研究与应用

    机械产品设计领域动词属性结构的研究与应用

    论文摘要在语言学当中,动词跟受其支配的语义成分可以构成一个最基本的语义结构,动词与这些成分之间蕴含着语义以及语法关系。本文从这一研究成果出发,结合已有的几种知识表示方法,提出了...
  • 基于Web的双语资源信息抽取研究

    基于Web的双语资源信息抽取研究

    论文摘要在信息爆炸的现代社会,要从浩如烟海的文献、资源中找到真正需要且有价值的内容,是一个重要的课题。为了解决这一课题,信息检索、信息抽取等技术的研究成为当前的热点方向。信息检...
  • 基于语义模板的语义Web服务建模研究

    基于语义模板的语义Web服务建模研究

    论文摘要近年来Web服务在各个领域得到了广泛应用,Web服务的数量也不断地激增,面对如此大量的Web服务,利用Web服务的组合来协作求解等多种新的应用形式也随之产生了,而原先完...
  • 英语从句关联词歧义结构分析

    英语从句关联词歧义结构分析

    论文摘要计算机在对英语句子进行处理时,对于从句的处理是一个很重要的方面。然而在英语句子中,从句种类较多,每一个种类又形式多样。引导从句的关联词都是有歧义的,各个关联词的用法也不...
  • 基于二元组合文法的语义知识库构建

    基于二元组合文法的语义知识库构建

    论文摘要句法分析一直是自然语言处理领域的热点。从上世纪80年代以来,句法分析的处理的重心逐渐转移到语义处理上来,词一级语言单位的研究又是语义处理的重心。无论做机器翻译、信息抽取...
  • 基于短语模板的机器翻译研究

    基于短语模板的机器翻译研究

    论文摘要泛化的EBMT(Example-basedmachinetranslation)是针对传统EBMT的一种改进方案,它利用翻译模板取代翻译实例,这样既减小了实例库的规模,...
  • 汉语句子的组块识别研究

    汉语句子的组块识别研究

    论文摘要组块识别是自然语言浅层句法分析的重要任务之一。它通过采用“分而治之”的策略把句子解析成较小的单元来简化句子结构,并为进一步揭示这些单元间的句法关系提供基础。组块识别作为...
  • 中文机构名识别的研究

    中文机构名识别的研究

    论文摘要中文命名实体识别是中文信息处理任务的前提和基础,其中机构名占有相当大的比重,而且是最难识别的一部分,其识别精度还远远达不到实际应用的需要。本文详细研究了中文机构名的识别...
  • 基于语义分析树核的句子相似度计算

    基于语义分析树核的句子相似度计算

    论文摘要句子相似度计算在自然语言处理领域的各个系统中具有非常广泛的应用,如:问答系统、自动文摘系统、信息检索系统以及基于实例机器翻译系统。因此长期以来,句子相似度计算问题,一直...
  • 基于语义范畴扩展的词义消歧的研究

    基于语义范畴扩展的词义消歧的研究

    论文摘要词义消歧是自然语言处理中亟待解决的一个关键问题,词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,也是近些年来是计算语言学和自然语言处理领域一个重要的...
  • 基于句法变换的自然语言文本水印技术研究

    基于句法变换的自然语言文本水印技术研究

    论文摘要文本数字水印是数字水印领域中一个十分活跃的研究方向,在电子商务、电子政务、国家安全和版权保护等领域应用广泛,并得到越来越多人的重视和研究。基于文档图像和格式的文本数字水...