• 基于Lucene的汽车信息垂直搜索引擎的设计与实现

    基于Lucene的汽车信息垂直搜索引擎的设计与实现

    论文摘要随着互联网上Web信息爆炸性的增长,如何获取更加准确、更加详细、更加深层的专业信息,成为对搜索引擎提出的新要求。因此,面向主题的垂直搜索引擎系统应运而生。本文以用户对汽...
  • 问答系统中的文本信息抽取研究与应用

    问答系统中的文本信息抽取研究与应用

    论文摘要近年来,互联网的迅速发展,使得人们能够在这个平台上方便地保存数据、交流信息以及共享知识。但是,互联网中海量的数据给用户快速准确地获得这些所需的知识带来了困难。针对这样的...
  • 基于Stacking框架的命名实体识别

    基于Stacking框架的命名实体识别

    论文摘要中文命名实体识别是指识别出文本中特定的实体。它是机器翻译、文本分类、信息检索和自动文摘、自动问答等多种自然语言处理技术的基础。作为信息抽取的基本任务,为了促进其他技术和...
  • Web信息抽取与网页摘要的研究与应用

    Web信息抽取与网页摘要的研究与应用

    论文摘要准确地提取出网页的主题内容并生成文档摘要已经成为一个非常重要而有意义的研究方向。随着万维网的飞速发展,在Internet上形成了不计其数的以HTML网页形式存在的信息源...
  • 基于本体的金融年报语义网自动构建方法

    基于本体的金融年报语义网自动构建方法

    论文摘要持续走热的通用搜索引擎带来了海量信息检索的极大便利,但对于具体某个领域而言,检索能力尚不足以令人满意。于是,各个领域的垂直搜索犹如百花齐放。具体到金融领域,投资用户经常...
  • 大规模真实文本中的人物职衔信息提取研究

    大规模真实文本中的人物职衔信息提取研究

    论文摘要20世纪90年代以来,互联网技术迅速发展,产生了各种应用。人物搜索引擎作为互联网技术应用的一部分,这两年刚刚兴起,还不成熟。各大公司建设人力资源库也需要对人才的简历信息...
  • 文本标注的数据库表达及应用

    文本标注的数据库表达及应用

    论文摘要词典普遍被作为一种含有大量语言学知识、常识知识的知识库。传统英语词典中一般包含词形、词性、词义、例句、习语、各种语法语用说明以及出处、领域等注解。从传统词典中提取出这些...
  • 利用表格等信息的Web文本分类研究与实现

    利用表格等信息的Web文本分类研究与实现

    论文摘要随着互联网等信息技术的发展和广泛应用,Web已经成为人们获取信息最重要手段之一。如何从这海量的信息资源库中快速、准确地进行分类并提取出有用的信息,变得十分迫切。Web信...
  • 基于Web的双语资源信息抽取研究

    基于Web的双语资源信息抽取研究

    论文摘要在信息爆炸的现代社会,要从浩如烟海的文献、资源中找到真正需要且有价值的内容,是一个重要的课题。为了解决这一课题,信息检索、信息抽取等技术的研究成为当前的热点方向。信息检...
  • 信息集成系统中面向领域的Web信息抽取研究

    信息集成系统中面向领域的Web信息抽取研究

    论文摘要互联网上信息爆炸,如何准确、快速地检索出所需的信息以及更有效的利用这些信息,成为亟待解决的问题。在信息集成系统IIS(InformationIntegrationSys...
  • 基于论坛数据的问答挖掘

    基于论坛数据的问答挖掘

    论文摘要论坛中含有大量有价值的、由用户讨论生成的数据,从中可挖掘出大量的问答数据,而这些数据可进一步用于改善问答系统的性能、扩充聊天机器人的知识库等。本文研究从论坛中挖掘问答数...
  • 基础教育网站黄页系统研究

    基础教育网站黄页系统研究

    论文摘要二十一世纪,人类社会是一个信息化社会,越来越多的人开始使用互联网并依赖网络进行学习和工作。但是,目前我国教育信息化建设尚处于初级阶段,互联网上基础教育资源的分布呈现高度...
  • 基于XML和XSLT的Web信息抽取研究与设计

    基于XML和XSLT的Web信息抽取研究与设计

    论文摘要随着互联网的迅猛发展,“信息过载”已经成为一个亟待解决的问题。为了使用户准确获取他想要的信息,信息抽取成为必要。从网页中抽取信息的程序称为Wrapper,关键的任务是:...
  • SVM与基于转换的错误驱动学习方法相结合的生物实体识别

    SVM与基于转换的错误驱动学习方法相结合的生物实体识别

    论文摘要本文将基于统计的机器学习方法和基于规则的方法有效的结合起来并应用于生物实体识别领域,运用SVM这一统计学习理论的典型代表作为机器学习方法的具体实现,并运用基于转换的错误...
  • 基于WEB文本挖掘的企业竞争情报收集系统

    基于WEB文本挖掘的企业竞争情报收集系统

    论文摘要本文主要研究了应用WEB文本挖掘技术收集企业竞争情报信息的理论和方法,作者希望通过已有的元搜索、文本过滤、信息抽取等WEB文本挖掘相关技术自动提取Internet上竞争...
  • 基于GHMM的Web文本信息抽取技术研究与系统设计

    基于GHMM的Web文本信息抽取技术研究与系统设计

    论文摘要随着互联网的高速发展,Web已经成为这个世界上最大的信息来源。如何获取有用的Web信息则是大家面临的共同问题,Web信息抽取就是针对这一问题而提出的。目前大部分信息抽取...
  • 自定义主题信息抽取的研究与应用

    自定义主题信息抽取的研究与应用

    论文摘要当今社会,网站是人们获得信息的主要来源之一,可是在网站提供的信息里面难免掺杂着一些人们不关心的信息,如图片,广告,无关链接等。一些商业性网站已经发现了这些弊端,采用了“...
  • 特定领域的Deep Web查询集成及结果抽取

    特定领域的Deep Web查询集成及结果抽取

    论文摘要网络信息过载,个人从中获取特定需求的信息必须借助于搜索引擎的导航。目前通用搜索引擎,如baidu,google能满足用户对任意领域的基本查询需求,但难以适应特定用户群体...
  • Web信息抽取规则及其学习算法

    Web信息抽取规则及其学习算法

    论文摘要面对Web信息的迅猛增长,信息抽取技术非常适合于从大量的文档中抽取需要的事实数据。被抽取出的信息经常以结构化的形式存入数据库中,可进一步用于信息查询、文本深层挖掘、We...
  • 基于Web的新闻信息抽取系统设计与实现

    基于Web的新闻信息抽取系统设计与实现

    论文摘要因特网的飞速发展,使其成为迄今为止最密集、最丰富的新闻信息来源。伴随着因特网的广泛应用,网络中的新闻信息迅速地积累、膨胀,新闻信息的利用需求与要求也不断提高。人们很难有...