• 基于网页结构特征的垂直搜索引擎研究与实现

    基于网页结构特征的垂直搜索引擎研究与实现

    论文摘要随着Internet的飞速发展,人们越来越依靠网络来查找他们所需要的信息。Internet的信息资源具有多样性、分布性、开放性、时效性和异构性的特点,同一主题的信息通常...
  • 基于领域本体的Web信息抽取技术研究

    基于领域本体的Web信息抽取技术研究

    论文摘要随着WorldWideWeb(简称WWW,Web)的迅速发展,网络上的信息与日俱增,互连网已成为人们获取信息的重要来源。而网络技术的迅猛发展为信息集成技术带来了新的问题...
  • 垂直搜索引擎数据分析技术的研究与实现

    垂直搜索引擎数据分析技术的研究与实现

    论文摘要针对通用搜索引擎的信息量大、查询不准确、深度不够等问题,本文采用垂直搜索引擎技术和电子商务服务相结合的新的服务模式,设计了一个电子商务垂直搜索引擎系统。论文重点研究了系...
  • 基于HMM模型的Web信息抽取方法的研究与改进

    基于HMM模型的Web信息抽取方法的研究与改进

    论文摘要随着因特网技术的迅速发展,网上信息成几何级数增长,如何在海量联机文本中获取所需的信息成为目前重要的研究课题,因此,通用搜索引擎和垂直搜索引擎技术也日益成为人们研究的重点...
  • 基于Web的信息抽取技术研究

    基于Web的信息抽取技术研究

    论文摘要随着互联网的快速发展和普及,人们越来越依赖于网络获取信息。作为海量的信息来源,Web可以看成是一个巨大的数据库,包含着各种各样有价值的信息。基于Web的信息抽取技术就是...
  • 基于DOM的Web信息抽取技术的研究与实现

    基于DOM的Web信息抽取技术的研究与实现

    论文摘要当前,互联网已成为全球信息传播与共享的重要渠道,但随着其数据量的爆炸性增长,用户查找自己所需的信息却变得越来越困难。在这种情况下,如何从浩繁的Web数据中抽取出有用的信...
  • 基于网络的多媒体节目编目信息抽取技术的研究

    基于网络的多媒体节目编目信息抽取技术的研究

    论文摘要近年来随着数字多媒体业务的不断扩展,数字多媒体业务的观众对多媒体节目编目信息的要求也随之而来。而目前尚没有此领域的研究来满足观众的这一迫切需求,这也正是本文研究的背景和...
  • 网络学术资源主题判定技术研究

    网络学术资源主题判定技术研究

    论文摘要互联网络的迅速发展,使网络资源成指数级增长,对各专业领域的发展也带来了巨大的影响,对于专业领域人员而言,怎样准确地从浩如烟海的网络信息资源中找到所需的专业学术资源是一件...
  • Web数据抽取在商业银行信用风险监控系统中的应用

    Web数据抽取在商业银行信用风险监控系统中的应用

    论文摘要对于商业银行来说,银行的利润就是经营风险的收益。而如何打破银行间的界限,跳出银行产品的“窠臼”,使客户的信用风险信息共享,最终以完整的视图看待一名客户的风险,是商业银行...
  • 新闻信息采集系统的设计与实现

    新闻信息采集系统的设计与实现

    论文摘要网络新闻信息的自动采集对于新闻网页的自动分类、自动摘要、敏感信息监测以及Web挖掘等应用十分重要。本文以半结构化的新闻网页为对象,研究如何从纷繁复杂的网络空间中采集各种...
  • 基于SVM的Web信息抽取技术研究

    基于SVM的Web信息抽取技术研究

    论文摘要随着Internet的迅猛发展,Web已然变成全球化的信息中心,如何快速、准确的从中获取所需信息显得越来越迫切。Web信息抽取技术就是在这样的情况下应运而生的。Web信...
  • 基于本体的医疗搜索引擎的设计和实现

    基于本体的医疗搜索引擎的设计和实现

    论文摘要随着互联网的普及和上网医疗信息的不断丰富,越来越多的普通用户和医护人员倾向于使用互联网查询、获取各种医疗信息。目前,用户主要通过通用搜索引擎和医学专业搜索引擎获取互联网...
  • 垂直搜索引擎中Web信息抽取技术研究

    垂直搜索引擎中Web信息抽取技术研究

    论文摘要目前Web上的资源日益增多,为更有效地利用这些资源,近年来产生了垂直搜索引擎。它是面向专业或主题的搜索引擎,只采集与专业或主题相关的信息,这样就需要从Web页面等资源中...
  • 从大规模中文语料中获取知识模式的研究

    从大规模中文语料中获取知识模式的研究

    论文摘要知识获取被认为是一项非常困难和耗时耗力的任务,几十年来一直是阻碍智能系统等研究和开发的瓶颈问题。互联网时代,大量的信息都以非结构化的文本形式存在。由于自然语言处理的歧义...
  • 一种模式发现算法及其Web信息抽取应用

    一种模式发现算法及其Web信息抽取应用

    论文摘要随着电子商务的飞速发展,大量的商品信息不断涌现在电子商务网站上,要想获取一条有用的商品信息难度越来越大。面向特定行业,抽取并合理保存这些商品信息,对于帮助人们快速获取所...
  • 基于ontology的Blog信息抽取技术研究

    基于ontology的Blog信息抽取技术研究

    论文摘要Blog作为一种新兴的个人媒体,正逐步流行于互联网中。它承载了大量有价值的信息,已经成为当前互联网应用研究中的一个热点。针对Blog的研究诸如Blog社区发现,Blog...
  • 面向领域的半结构化Web信息抽取技术

    面向领域的半结构化Web信息抽取技术

    论文摘要为了应对信息爆炸带来的挑战,人们迫切需要一些自动化的工具在海量信息源中迅速定位到真正需要的信息。在这样的情况下,信息抽取技术应运而生。目前大部分的Web信息抽取方法都是...
  • 网站敏感信息监视系统设计与实现

    网站敏感信息监视系统设计与实现

    论文摘要随着网络技术的飞速发展,网络已经成为人们学术交流、信息共享的主要平台。但是由于网络规模的不断扩大和分布的跨地域性等特点,使得各国对于网络信息的管理变得越来越难,造成了在...
  • 基于多特征的Web页面分块算法MFPS的研究与实现

    基于多特征的Web页面分块算法MFPS的研究与实现

    论文摘要随着互联网的快速发展,Web已成为人们获取信息的重要来源。为了满足人们不断增长的从互联网上获取信息的需求,Web信息抽取技术不可避免地成为当今研究的技术热点。由于互联网...
  • 时间表达式识别与归一化研究

    时间表达式识别与归一化研究

    论文摘要在自然语言中,时间是一种重要的语义载体。人们通过了解一个事件的开始、发展和结束的时间信息,把握事件发展的全过程。时间信息识别在信息抽取、问答系统、摘要生成、话题跟踪和检...