• 文献计量学和文本挖掘在生命科学中的应用

    文献计量学和文本挖掘在生命科学中的应用

    论文摘要在过去的十几年中,随着生物医学科学技术的飞速发展,生物医学文献也呈“指数型”增长。面对如此大规模快速增长的文献数据,仅靠人工阅读的方式去获取感兴趣的知识已变得非常困难。...
  • 基于语义关联的重复数据清理技术研究

    基于语义关联的重复数据清理技术研究

    论文摘要重复数据的出现会给数据质量带来极大的困扰,严重影响着数据处理和分析的效率,如何对重复数据进行清理是数据处理研究的重要问题。然而,随着数据的急剧增长,数据源的多样性,同名...
  • 基于内容的Web新闻文本自动分类问题研究

    基于内容的Web新闻文本自动分类问题研究

    论文摘要随着WWW的迅速发展和普及,人们已经从信息资源匮乏的时代迅速过渡到信息极为丰富的数字化时代。面对网上海量的信息资源,人们很难迅速有效的找到所需的信息。因此,如何合理和有...
  • Deep Web数据集成中的结果抽取及实体识别研究

    Deep Web数据集成中的结果抽取及实体识别研究

    论文摘要随着Internet的发展和Web上信息的快速增加,人们越来越多地依赖搜索引擎来查找所需信息。目前的主流搜索引擎主要依靠爬虫爬行网页上的链接来抓取网页,因此基本上只索引...
  • 基于结果模式的Deep Web数据抽取机制的研究

    基于结果模式的Deep Web数据抽取机制的研究

    论文摘要在Internet的飞速发展和普及下,丰富的Web资源构成了一个巨大的全球性信息仓库,网络已经成为人们获取信息的一个重要手段。面对庞大的Web信息,用户如何从繁杂的数据...
  • 基于SVM和链接分析的蛋白质关系抽取系统

    基于SVM和链接分析的蛋白质关系抽取系统

    论文摘要随着生物医学文献数量的急剧增长,各种各样的生物医学信息出现在生物医学研究者面前。这给生物医学研究者带来很沉重的负担,使他们很难迅速地从这些文献中找到需要的信息。为了提高...