基于索引的web服务发现研究

基于索引的web服务发现研究

论文摘要

web服务作为SOA有效的实现技术已经取得了很大的发展。与传统网页相比,web服务领域存在更加严重的信息孤岛问题。在Internet上,特定功能的web服务不仅淹没在web服务库中,同时也淹没在普通网页库中。因此,对web服务进行快速、准确的查找成为web服务领域亟待解决的问题,从而促生了人们对web服务发现领域的研究。本文结合国家973计划“一体化可信网络与普适服务体系基础研究——普适服务的基础理论、模型与关键技术”项目,以面向服务的架构(Service Oriented Architecture, SOA)为基础,对web服务发现领域中的问题进行了研究,并取得了一定的成果。论文中的工作主要集中在以下几个方面:1.选择一个恰当的形式化模型是web服务发现的基础。目前的web服务的形式化模型相对于原始的web服务描述文件,存在信息丢失或者信息强加现象。信息丢失主要表现在对web服务进行形式化时丢失了web服务描述文件中的大量有用信息,这种现象多出现在传统的基于关键词匹配的web服务发现方法中,这导致了在后续的web服务匹配中缺少依据,难以支持高准确性的查找;信息强加主要表现在形式化模型中包含了web基本服务描述文件中不存在、且难以获取或无从获取的信息,多出现在基于语义本体的web服务发现方法中,这导致后续的web服务匹配所依赖的信息在许多web服务中不存在,从而导致这类方法在Internet上推广困难。本文设计了一种web服务形式化模型。该模型基于web服务(组合)基本的描述文件,如wsdl文件、bpel文件等。较传统的基于关键词的web服务形式化模型,可以包含更丰富的语义信息;较基于语义本体的web服务形式化模型,其所有信息都可以由web服务(组合)的基本描述文件中获取。从而使得此形式化模型所支持的web服务发现系统能够更好的处理Internet上的web服务,从而具备更强的可推广性。2.作为web服务发现的核心组件——web服务匹配,其准确性极大的影响着web服务发现的准确性。目前能够提供高准确性匹配的web服务匹配引擎绝大部分都依赖于本体库,借助于本体对象完善的描述信息实现更加准确的匹配。然而,目前并没有出现权威的本体库,web服务发现系统的本体库多是由服务发现系统创建者自己创立的,不同创建者创建的本体库难于一致、或兼容,这使得匹配失去了公认的基准,直接导致了理论上的完美与实践中难于的实现的矛盾。本文提出了一种能够支持高准确性匹配并不依赖于本体库的web服务匹配引擎。在自然语言描述匹配中设置了同义词扩展、本体库扩展接口(可选),本体库扩展接口是否引入不会对自然语言匹配引擎的准确性起到很大影响;web服务多数有效信息包含在在由多语义片段组成的多词拼接体命名中,处理由多语义片段组成的拼接体命名时,在并发使用概率的监督下,依次对命名体进行了同义词扩展、缩写词扩展、本体概念关系扩展(可选)、命名语义体归纳,在针对自然语言匹配引擎难于处理的多词拼接体命名的匹配中,取得了很高的准确率。整个匹配引擎表现出了高查准率和查全率,同时脱离了对本体的依赖。3. Internet上的web服务性能差别很大。有的web服务描述信息与所提供的实体严重不符;有的web服务虽然服务描述与所提供的实体能够一致,但使用时响应时间太长,或者有的使用界面很不友好,使用起来很不方便。而这些web服务所提供的描述信息差别不大,如果仅仅基于这些描述信息的匹配结果进行服务查找,难以辨别这些性能不同的服务。本文提出了一种基于用户体验的web服务性能评估方法。借助于目前普通web网页的评估工具和理论,结合web服务本身的特点,我们提出了一种高可行性、低开销的web服务性能评估方法。通过对web服务信息与功能方面的评估来实现对web服务的整体性能评估。我们将该方法作为一个组件加入到web服务发现系统中,显著提高了web服务发现系统的查准率。4查询准确性与查询请求处理时间是web服务发现系统最重要的两个衡量标准。目前的研究成果中存在低请求处理时间与高查询效率不可兼得的问题。低请求处理时间多出现在基于传统关键词匹配和索引架构的web服务发现系统中,它们能够保证低请求处理时间但查询准确性却难于保证;由于传统的关键词匹配在处理多词拼接体命名时准确性很低,从而导致了完成同一功能、被表达成不同形式的web服务查找不到,或查找到的结果中包含许多与用户需求不相关的web服务。高查询准确性多出现在基于语义本体的web服务发现系统中,这些方法通过引入语义本体来完善web服务描述,通过明确描述目标的各个属性达到精确匹配的目标;然而他们引入语义本体描述的同时也引入了本体推理机制,这些推理机制多基于自动机,需要进行服务间两两匹配;关键词被扩展成本体类,每个类的匹配需要进行多个属性的匹配,从而在完善关键词描述的同时也增大了关键词匹配的规模;这些使得基于语义本体的web服务发现系统在进行服务查找时的时间复杂度扩展到O(n2)(其中n为服务库中的属性总数)规模,当web服务库规模增大时,进行web服务发现的请求处理时间急速增大。本文提出了一种基于索引库的web服务发现架构。此架构基于索引库,有效的降低了服务发现时的查找空间,从而使得服务发现的处理时间可以控制在合理的范围内;在建立索引库的过程中,引入了语义挖掘,很大程度上克服了传统的不依赖本体库的索引架构查准率低的缺点;架构中引入了对web服务潜在组合方案的查找,进一步提高了查全率;增加了web服务性能评估组件用以优化匹配结果,提高了web服务发现的查准率。整个架构在实验评估时表现出了很高的查全率和查准率。解决了低请求处理时间与高查询效率不可兼得问题。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题的研究背景
  • 1.2 课题研究期间的工程背景
  • 1.3 问题的描述
  • 1.4 本文的创新点
  • 1.5 论文结构
  • 1.6 本章参考文献
  • 第二章 WEB服务发现研究综述
  • 2.1 相关背景知识概述
  • 2.1.1 面向服务的体系架构SOA
  • 2.1.2 web服务
  • 2.2 WEB服务发现研究现状
  • 2.2.1 基于传统关键词匹配的web服务发现系统
  • 2.2.2 基于语义本体的web服务发现系统
  • 2.2.3 基于潜在语义挖掘的web服务发现系统
  • 2.3 本章小结
  • 2.4 本章参考文献
  • 第三章 WEB服务形式化描述
  • 3.1 引言
  • 3.2 相关研究介绍
  • 3.3 WEB服务形式化模型
  • 3.4 本章小结
  • 3.5 参考文献
  • 第四章 基于交互接口语义挖掘的WEB服务匹配
  • 4.1 引言
  • 4.2 相关研究介绍
  • 4.3 基于语义挖掘的WEB服务关键词索引库
  • 4.3.1 关键词语义体挖掘
  • 4.3.2 基于关键词语义体的参数匹配
  • 4.3.3 基于关键词语义体的web服务匹配
  • 4.3.4 基于关键词语义体的web服务可组合性检测索引库
  • 4.4 基于关键词语义挖掘的WEB服务发现系统
  • 4.4.1 基于交互参数的用户需求描述
  • 4.4.2 web服务发现结果描述
  • 4.4.3 基于语义挖掘的web服务发现
  • 4.5 实验与分析
  • 4.5.1 用户请求处理时间评估
  • 4.5.2 查准率、查全率评估
  • 4.6 本章小结
  • 4.7 本章参考文献
  • 第五章 基于用户体验的WEB服务性能评估
  • 5.1 引言
  • 5.2 相关研究介绍
  • 5.3 基于用户体验的WEB服务性能评估方法
  • 5.3.1 基础工具介绍
  • 5.3.2 web服务的信息提供性能评估
  • 5.3.3 web服务的功能共享性能评估
  • 5.3.4 评估集成
  • 5.4 实验与分析
  • 5.5 本章小结
  • 5.6 参考文献
  • 第六章 基于索引库的WEB服务发现架构
  • 6.1 引言
  • 6.2 相关研究介绍
  • 6.2.1 基于本体匹配的web服务发现架构
  • 6.2.2 基于传统关键词匹配的web服务发现架构
  • 6.2.3 基于潜在语义挖掘的web服务发现架构
  • 6.2.4 web服务发现架构现状总结
  • I'>6.3 基于索引库的WEB服务发现架构WSFI
  • 6.3.1 web服务发现流程
  • 6.3.2 后台语义挖掘流程
  • S'>6.4 基于索引架构的WEB服务发现系统实例——基于语义挖掘的WEB服务发现系统WSDS
  • S系统搭建'>6.4.1 WSDS系统搭建
  • S实验评估'>6.4.2 WSDS实验评估
  • I实验与评估'>6.5 WSFI实验与评估
  • 6.6 本章小结
  • 6.7 本章参考文献
  • 第七章 结束语
  • 7.1 论文总结
  • 7.2 进一步的研究工作
  • 致谢
  • 攻读博士学位期间完成的学术论文
  • 攻读博士学位期间参与申请的专利和编写的教材
  • 相关论文文献

    • [1].基于WEB的通信电源远程监控系统研究[J]. 中国设备工程 2019(24)
    • [2].基于自适应遗传算法的考虑服务质量感知Web服务发现[J]. 电子测量技术 2019(22)
    • [3].面向Web系统热点数据预测及缓存管理的研究[J]. 信息技术与信息化 2019(12)
    • [4].基于页面对象的Web应用测试用例生成方法[J]. 计算机应用 2020(01)
    • [5].运用物联网和Web服务搭建院际转运信息平台[J]. 电子技术与软件工程 2020(02)
    • [6].延迟加载在web开发中的应用心得[J]. 视听 2020(02)
    • [7].基于Web的期刊采编系统的设计与实现[J]. 电脑知识与技术 2020(06)
    • [8].Web服务软件测试技术的研究与实现[J]. 电脑知识与技术 2020(02)
    • [9].移动互联网时代的Web性能优化实践[J]. 信息通信 2020(01)
    • [10].基于Web的校园个人自行车租赁系统[J]. 卫星电视与宽带多媒体 2020(02)
    • [11].基于网站制作的Web前端开发技术与优化[J]. 数字技术与应用 2020(01)
    • [12].基于Web应用的网络安全漏洞发现与研究[J]. 无线互联科技 2020(05)
    • [13].基于Web的动态几何软件领域模型及其应用[J]. 计算机应用 2020(04)
    • [14].基于web技术支持下网络多媒体课件的制作原则及优点[J]. 科技风 2020(13)
    • [15].基于Web的网上教学平台的设计与实现[J]. 科技与创新 2020(07)
    • [16].1+X证书制度与Web前端开发专业融合的探索[J]. 信息与电脑(理论版) 2020(04)
    • [17].基于《web前端页面设计》在线开放课程自主学习探讨[J]. 计算机产品与流通 2020(05)
    • [18].基于WEB的计算机课程辅助教学系统的设计与实现[J]. 计算机产品与流通 2020(05)
    • [19].基于Web的时变体数据的体绘制方法[J]. 计算机测量与控制 2020(04)
    • [20].Web浏览器中数据安全配置的研究[J]. 电脑编程技巧与维护 2020(04)
    • [21].基于实践应用的Web开发技术教学改革研究初探[J]. 科学大众(科学教育) 2020(05)
    • [22].基于Web的桥梁健康监测系统设计与实现[J]. 计算机技术与发展 2020(04)
    • [23].基于Web技术的计算机实验室综合管理系统设计[J]. 电子制作 2020(11)
    • [24].分析校园网中Web服务器的配置及安全防护[J]. 江西电力职业技术学院学报 2020(01)
    • [25].基于Web的研究生学位信息管理系统技术研究[J]. 创新创业理论研究与实践 2020(07)
    • [26].WEB技术在地质资料二次开发中的应用探讨[J]. 中国非金属矿工业导刊 2020(03)
    • [27].基于Web技术的医疗图像脱敏系统的设计与实现[J]. 宁夏工程技术 2020(02)
    • [28].网站制作的Web前端开发设计的相关研究[J]. 卫星电视与宽带多媒体 2020(07)
    • [29].Web开发提高网站性能的技巧[J]. 电脑编程技巧与维护 2020(06)
    • [30].随钻测井地质导向服务WEB版[J]. 国外测井技术 2020(03)

    标签:;  ;  ;  ;  ;  

    基于索引的web服务发现研究
    下载Doc文档

    猜你喜欢