软件缺陷自动分派研究

软件缺陷自动分派研究

论文摘要

现代大型软件系统,特别是像Eclipse和Firefox这样的开源软件中,随着系统规模的增大和功能需求的增加,会不断有出现新的缺陷被检测和报告出来,因为数量庞大,所以人工地将这些缺陷分派给合适的维护人员进行修复,需要大量的时间和人力。同时,这样的大型系统中都会配备有专门的缺陷跟踪系统,以保存已提交缺陷的信息和处理过程,这些已有的历史信息为软件缺陷的自动分派提供了可能。软件的缺陷自动分派就是利用缺陷跟踪系统当中已经解决的那部分历史数据,结合数据挖掘的方法,将新提交的缺陷报告自动分派给合适的修复者的过程。传统的软件缺陷自动分派方法都是基于文本分类的,这种方法将缺陷报告中的描述信息看成文本,将修复缺陷的人员看成是文本的类别标签,通过在已经修复的历史缺陷报告上训练分类器的方式,对新提交的缺陷报告进行分派。但是相比于文本分类,软件缺陷分派有许多自身的特点,比如说文本信息较少,类比较多,软件缺陷拥有缺陷类型,所属平台等等基本属性信息,同时缺陷的修复者之间,具有一定的交互性等等。这些辅助信息都可以用来提高缺陷分派的效果。本文对软件缺陷自动分派的问题进行了研究,分析了这一问题的产生的背景和意义,同时还对软件缺陷分派的历史现状和主要方法进行了回顾,并且总结了软件缺陷分派问题中的主要特点。针对用单词表征缺陷报告文本时含有的特征空间维度高、数据稀疏且包含噪音等缺点,本文提出了一种基于主题模型的软件缺陷分派方法,通过PLSA和LDA两种模型,将缺陷报告的表征从单词空间映射到主题空间,进而在新的低维空间上进行缺陷分派。对比试验的结果表明,本文提出的基于主题模型的方法,对于提高缺陷分派的准确率和降低特征空间的维度,都有着明显的效果。

论文目录

  • 摘要
  • Abstract
  • 图目录
  • 表目录
  • 第一章 引言
  • 1.1 研究背景与意义
  • 1.2 本文的研究内容
  • 1.3 本文的组织结构
  • 第二章 软件缺陷自动分派简介
  • 2.1 软件的缺陷跟踪系统
  • 2.2 软件缺陷报告
  • 2.3 软件缺陷分派技术
  • 2.3.1 缺陷修复者信息的提取
  • 2.3.2 软件缺陷报告的特征空间构造
  • 2.3.3 常用分类方法
  • 2.4 本章小结
  • 第三章 软件缺陷分派研究现状
  • 3.1 软件缺陷分派概述
  • 3.2 基于文本分类的基本方法
  • 3.3 使用LSA构建特征空间的方法
  • 3.3.1 隐含语义分析
  • 3.3.2 基于LSA的软件缺陷分派
  • 3.4 使用Assignedto传递图调整推荐列表的方法
  • 3.5 使用半监督文本分类的改进方法
  • 第四章 基于PLSA模型的软件缺陷分派
  • 4.1 概率隐含语义分析(PLSA)
  • 4.1.1 主题模型
  • 4.1.2 PLSA模型
  • 4.1.3 PLSA中的EM参数估计方法
  • 4.2 基于PLSA模型的缺陷分派
  • 4.3 实验及结果分析
  • 4.3.1 实验数据
  • 4.3.2 结果分析
  • 第五章 基于LDA模型的软件缺陷分派
  • 5.1 隐含狄利克雷分配(LDA)
  • 5.1.1 狄利克雷分布
  • 5.1.2 MCMC参数估计方法
  • 5.2 基于LDA模型的软件缺陷分派
  • 5.3 实验及结果分析
  • 第六章 总结与展望
  • 参考文献
  • 发表学术论文
  • 致谢
  • 相关论文文献

    • [1].一种基于领域适配的跨项目软件缺陷预测方法[J]. 软件学报 2020(02)
    • [2].跨项目软件缺陷预测方法研究综述[J]. 计算机技术与发展 2020(03)
    • [3].软件缺陷预测研究综述[J]. 信息通信 2020(04)
    • [4].过采样与集成学习方法在软件缺陷预测中的对比研究[J]. 计算机与现代化 2020(06)
    • [5].基于相对密度的类不平衡软件缺陷预测[J]. 计算机与数字工程 2020(06)
    • [6].基于卷积神经网络的软件缺陷预测研究[J]. 电脑编程技巧与维护 2020(09)
    • [7].软件缺陷预测中的数据质量评估方法[J]. 华中科技大学学报(自然科学版) 2020(11)
    • [8].静态软件缺陷预测研究进展[J]. 计算机科学与探索 2019(10)
    • [9].基于卷积神经网络的代价敏感软件缺陷预测模型[J]. 计算机科学 2019(11)
    • [10].基于多核字典学习的软件缺陷预测[J]. 计算机科学 2017(12)
    • [11].开源程序的软件缺陷分布特征的量化分析研究[J]. 电子元器件与信息技术 2017(04)
    • [12].一种基于关联规则的网络软件缺陷预测方法[J]. 信息技术与网络安全 2018(04)
    • [13].基于爬虫的软件缺陷预测[J]. 南昌教育学院学报 2016(06)
    • [14].基于组合机器学习算法的软件缺陷预测模型[J]. 计算机研究与发展 2017(03)
    • [15].深度信念网软件缺陷预测模型[J]. 计算机科学 2017(04)
    • [16].基于二次学习的半监督字典学习软件缺陷预测[J]. 模式识别与人工智能 2017(03)
    • [17].数据驱动的软件缺陷预测研究综述[J]. 电子学报 2017(04)
    • [18].基于主成分分析法的人工免疫识别软件缺陷预测模型研究[J]. 计算机科学 2017(S1)
    • [19].基于软件生命周期的软件缺陷预防流程研究[J]. 电脑编程技巧与维护 2017(12)
    • [20].核字典学习在软件缺陷预测中的应用[J]. 小型微型计算机系统 2017(07)
    • [21].基于非负稀疏图的协同训练软件缺陷预测[J]. 计算机技术与发展 2017(07)
    • [22].基于半监督集成学习的软件缺陷预测[J]. 模式识别与人工智能 2017(07)
    • [23].基于机器学习的软件缺陷预测技术研究[J]. 长春大学学报 2017(10)
    • [24].基于改进蚁群算法在软件缺陷预测中的应用[J]. 太原科技大学学报 2016(01)
    • [25].半监督软件缺陷挖掘研究综述[J]. 数据采集与处理 2016(01)
    • [26].基于元学习的软件缺陷预测推荐方法[J]. 中国电子科学研究院学报 2015(06)
    • [27].面向软件缺陷报告的提取方法[J]. 计算机科学 2016(06)
    • [28].液压支架电液控制系统软件缺陷管理[J]. 工矿自动化 2016(11)
    • [29].软件缺陷管理方案分析[J]. 电脑与电信 2014(10)
    • [30].代价敏感分类的软件缺陷预测方法[J]. 计算机科学与探索 2014(12)

    标签:;  ;  ;  

    软件缺陷自动分派研究
    下载Doc文档

    猜你喜欢