• 基于文本的实体—关系抽取技术研究

    基于文本的实体—关系抽取技术研究

    论文摘要信息抽取(InformationExtraction)技术可以从非结构化数据中抽取人们感兴趣的实体、关系、事件等,形成结构化存储以供查询检索。命名实体识别和实体间关系抽...
  • 基于认知的非结构化信息抽取关键技术与算法研究

    基于认知的非结构化信息抽取关键技术与算法研究

    论文摘要近年来,随着计算机技术的迅猛发展,信息抽取技术已经成为自然语言处理领域的热点研究问题之一,并且机器学习、文本挖掘和图算法等多个方面的技术也在信息抽取中得到了应用,然而信...
  • 汉英双向时间数字和数量词的识别与翻译技术

    汉英双向时间数字和数量词的识别与翻译技术

    论文摘要命名实体识别与翻译是机器翻译的重要组成部分。本文使用基于语料库的方法,挖掘提取语料库中数字、时间日期、数量词的表达模式,并由此转换为规则,实现了中英数字、时间日期、数量...
  • 基于统计滚雪球模型的知识挖掘理论与方法

    基于统计滚雪球模型的知识挖掘理论与方法

    论文摘要随着互联网技术的迅猛发展,互联网已成为一个巨大的信息源,其中含有大量的关于现实世界命名实体的信息。这些命名实体包括机构、地点和人物等,既涵盖了名人也涉及日常生活中的普通...
  • 基于CRF的中文地名识别研究

    基于CRF的中文地名识别研究

    论文摘要命名实体识别是机器翻译、信息检索、问答系统等的技术基础。中文地名识别是中文命名实体识别的一个难点。本文主要对中文地名识别进行研究,实现了条件随机域(Conditiona...
  • 一种电子产品领域命名实体识别方法研究

    一种电子产品领域命名实体识别方法研究

    论文摘要近年来,随着因特网和信息产业的快速发展,越来越多的信息出现在人们面前,许多新兴的信息处理技术孕育而生,在这些得到广泛应用的技术中有一个共同而基础的问题,那就是命名实体识...
  • 规则与统计相结合的音乐领域命名实体识别

    规则与统计相结合的音乐领域命名实体识别

    论文摘要音乐是人类史上一个永恒的主题,是人们情感的寄托和外化。随着互联网的不断发展,人们接触到的音乐信息更是层出不穷,如何从浩瀚的信息中获取感兴趣的内容是亟待解决的问题。因此,...
  • 中文命名实体识别的研究

    中文命名实体识别的研究

    论文摘要中文命名实体识别是自然语言处理的基础任务,是机器翻译、信息检索、问答系统等技术的基础,研究并实现有效的中文命名实体识别方法是本文的主要研究内容。本文主要采用基于机器学习...
  • 领域本体自动构建的关键技术研究

    领域本体自动构建的关键技术研究

    论文摘要对于一个领域的特殊应用来说,本体是一个非常有价值的资源,尤其在需要领域知识的情况下。随着科学技术的快速发展,本体中新的术语和相关概念也必须实时更新以适应现实的应用。目前...
  • SVM与基于转换的错误驱动学习方法相结合的生物实体识别

    SVM与基于转换的错误驱动学习方法相结合的生物实体识别

    论文摘要本文将基于统计的机器学习方法和基于规则的方法有效的结合起来并应用于生物实体识别领域,运用SVM这一统计学习理论的典型代表作为机器学习方法的具体实现,并运用基于转换的错误...
  • 基于GHMM的Web文本信息抽取技术研究与系统设计

    基于GHMM的Web文本信息抽取技术研究与系统设计

    论文摘要随着互联网的高速发展,Web已经成为这个世界上最大的信息来源。如何获取有用的Web信息则是大家面临的共同问题,Web信息抽取就是针对这一问题而提出的。目前大部分信息抽取...
  • 基于隐马尔科夫模型的中文命名实体识别研究

    基于隐马尔科夫模型的中文命名实体识别研究

    论文摘要随着信息时代的到来和Internet的发展,用自然语言作为人机交互已是必然趋势,这对自然语言处理的深度和广度提出了越来越高的要求。自命名实体识别技术在1995年的MUC...
  • 评论挖掘中的语义信息抽取

    评论挖掘中的语义信息抽取

    论文摘要评论挖掘就是对评论文本的挖掘与分析,包括对文章主客观性的判断和评论褒贬义的判断以及句子层的评论文章基本要素的抽取,如抽取评论对象的名称,特征,评论词以及态度倾向等。评论...
  • 本地搜索领域POI缩略词词典的研究

    本地搜索领域POI缩略词词典的研究

    论文摘要随着社会的日益信息化,人们越来越强烈地希望能够通过计算机获取到大量的信息,尤其是对生活信息的获取。人们有强烈的愿望通过自然语言语句的查询搜索到和他们的什么密切相关的信息...
  • 基于领域本体的汉语共指消解及相关技术研究

    基于领域本体的汉语共指消解及相关技术研究

    论文摘要共指是自然语言篇章和对话中普遍存在的现象。共指使篇章主题更加突出,表述更加连贯与简洁;但它也给自然语言处理带来了不确定性。共指消解是消除这种指代形式带来的不确定性的过程...
  • 面向生物医学领域的文本挖掘技术研究

    面向生物医学领域的文本挖掘技术研究

    论文摘要当前,出版的生物医学文献呈指数级增长,成为一座巨大的知识宝库。由于生物医学文献绝大多数都是以文本方式存在,从这座宝库快速有效地进行文本挖掘,提取生物医学知识的需求变得非...
  • 基于DCC动态流通语料库的中文组织名考察与研究

    基于DCC动态流通语料库的中文组织名考察与研究

    论文摘要中文组织名是组织的专有名称。本文首次基于大规模真实文本,对中文组织名进行了宏观到微观、历时动态到共时静态的多角度考察研究。本研究将为中文信息处理提供有效资源和规则知识,...