• 基于Web的未登录词翻译技术研究

    基于Web的未登录词翻译技术研究

    论文摘要未登录词(OutofVocabulary,简写为OOV)的查询翻译是影响跨语言信息检索(Cross-LanguageInformationRetrieval,简写为CL...
  • 基于语素的汉语词法分析方法研究

    基于语素的汉语词法分析方法研究

    论文摘要作为中文信息处理的关键问题之一,汉语词法分析主要包括分词、词性标注和词义消歧三个子任务。虽然近年来汉语词法分析取得很大进展,但处理大规模开放文本时依然面临巨大的挑战,尤...
  • 综合字典和统计分析的中文分词系统的研究与实现

    综合字典和统计分析的中文分词系统的研究与实现

    论文摘要中文分词技术主要包含以下三个研究方向:理解分词,机械分词以及统计分词。基于理解的分词方法研究尚未成熟,所以,绝大部分中文分词系统是应用机械统计相结合的方法。在目前主流的...
  • 词典与统计相结合的中文分词的研究

    词典与统计相结合的中文分词的研究

    论文摘要随着社会信息化的发展,人们很容易获得海量信息。但是要处理海量信息,靠人工是不可能的,必须依靠计算机的帮助。和西方语言不同,中文中的词与词之间没有明显的切分标志。所以,要...
  • 未登录词的语法功能猜测

    未登录词的语法功能猜测

    论文摘要在实际文本中,未登录词的出现频繁且不可预测,影响了自动句法分析的正确率。未登录词的不确定性,带来了未登录词语法功能的不确定性。如果按照以往给未登录词平均分配语法功能概率...
  • 规则与统计相结合的中文分词方法研究

    规则与统计相结合的中文分词方法研究

    论文摘要随着信息时代的到来,计算机在人们生产生活的各个方面作用越来越突显。目前,在机器翻译、语音识别、信息检索等许多领域对语料库的使用越来越多,要求也越来越高,对语料库进行分词...