科技项目相似性检测系统研究

科技项目相似性检测系统研究

论文摘要

随着政府对科技项目投入的经费逐年增加,科技项目申报数量和范围的逐步扩大,导致了项目审查和评审工作量的剧增,同时引起了种种管理上的难题,出现了很多“重复立项”的问题。目前,文档复制检测技术在保护知识产权和优化搜索引擎方面应用广泛,但在科技项目管理领域应用甚少。本论文主要研究基于科技项目知识表示模型的一种基于字段的相似度计算方法及其系统,便于高效、准确地查找相似的科技项目,向项目评审者提供预警,有效防止同类科技项目重复立项。论文主要研究工作包括:1针对科技项目知识表示,研究提出一种结合向量空间模型和物元模型的知识表示模型。通过科技项目文本分词获取关键词,运用TF方法计算关键词权重,从而建立科技项目知识表示模型。2基于项目知识表示模型,研究提出一种基于字段结构的科技项目相似度计算方法。本方法以科技项目单个字段作为关键词词频统计单元,采用字符串Hash匹配的方法,根据向量余弦公式计算项目对应字段之间的相似度,再对各字段相似度加权平均得到项目之间的相似度。3基于以上研究成果开发了科技项目相似性检测系统。系统由项目知识库、项目知识构建模块、相似度计算模块、判断和解释模块以及并行计算任务管理模块组成。首先,项目知识构建模块为待审查项目知识和已立项项目知识信息构建项目知识模型。然后,相似度计算模块根据这两个项目知识模型计算出相似度。最后,判断和解释模块根据相似度来判断项目之间的相似关系。而并行计算任务管理模块的主要任务则是对相似度计算模块、判断和解释模块进行并行处理。本文开发的科技项目相似性检测系统已应用于浙江省科技项目管理系统中,应用验证了论文研究成果的可行性和有效性,对重复立项问题提供了良好的检查和预警手段。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 课题提出的背景和意义
  • 1.2 国内外研究现状
  • 1.2.1 文档复制检测技术
  • 1.2.2 文本相似度计算
  • 1.2.3 中文分词
  • 1.3 主要研究内容与创新点
  • 1.4 本文的内容安排
  • 1.5 本章小结
  • 第2章 文档复制检测技术
  • 2.1 文本分词
  • 2.1.1 基于字符串匹配的分词方法
  • 2.1.2 基于统计学的分词方法
  • 2.1.3 基于字标注的分词方法
  • 2.2 特征选择方法
  • 2.2.1 文档频率
  • 2.2.2 信息增益
  • 2.2.3 互信息
  • 2.2.4 类别区分词
  • 2.3 文本块大小的问题
  • 2.4 文档表示模型
  • 2.5 文档相似度计算
  • 2.6 本章小结
  • 第3章 科技项目知识表示模型
  • 3.1 向量空间模型
  • 3.1.1 基本概念
  • 3.1.2 特征项的粒度选择
  • 3.2 基于可拓学的知识表示
  • 3.2.1 基于物元的知识集表示
  • 3.2.2 基于关系元的知识集关系表示
  • 3.3 知识集的相关性分析
  • 3.3.1 知识集的相似关系
  • 3.4 科技项目预处理
  • 3.4.1 项目字段结构抽取
  • 3.4.2 字段文本分词
  • 3.4.3 字段特征提取
  • 3.5 科技项目知识表示
  • 3.5.1 科技项目知识模型
  • 3.6 项目知识库
  • 3.7 本章小结
  • 第4章 科技项目相似度计算
  • 4.1 基于统计学的相似度计算
  • 4.1.1 基于向量空间模型的TF-IDF方法
  • 4.2 基于语义理解的相似度计算
  • 4.2.1 词语相似度
  • 4.2.2 句子相似度
  • 4.2.3 段落相似度
  • 4.3 项目智能化预处理
  • 4.4 基于字段结构的科技项目相似度计算
  • 4.5 本章小结
  • 第5章 科技项目相似性检测系统实现
  • 5.1 系统体系结构
  • 5.2 项目知识构建模块
  • 5.3 项目相似度计算模块
  • 5.4 判断和解释模块
  • 5.5 并行计算任务管理模块
  • 5.6 实验结果
  • 5.7 本章小结
  • 第6章 总结与展望
  • 6.1 本文的总结
  • 6.2 研究工作的展望
  • 致谢
  • 参考文献
  • 附录
  • 详细摘要
  • 相关论文文献

    • [1].父子(女)间面孔相似性的进化适应机制及其影响[J]. 心理科学进展 2020(03)
    • [2].隐喻相似性的认知构建[J]. 学术交流 2016(12)
    • [3].浅述隐喻视角下中西文化的相似性[J]. 英语广场 2016(08)
    • [4].基于一类支持向量机的快速人脸相似性学习[J]. 浙江师范大学学报(自然科学版) 2015(01)
    • [5].相似性科学浅析[J]. 科教导刊(中旬刊) 2015(03)
    • [6].搜索图片也要讲相似性[J]. 电脑迷 2009(22)
    • [7].寻找遥远的相似性[J]. 语文月刊 2020(09)
    • [8].感知到亲子间面孔相似性对亲子虐待的影响:一个双重调节模型[J]. 心理科学 2019(06)
    • [9].一种基于协同过滤和混合相似性模型的推荐算法[J]. 上海理工大学学报 2020(03)
    • [10].论数学的相似性教学[J]. 云南教育(中学教师) 2014(06)
    • [11].普通法类比推理:概念、相似性标准与说理过程[J]. 法律方法与法律思维 2011(00)
    • [12].山寨产品/真品相似性评价与山寨产品购买意愿[J]. 管理学报 2012(09)
    • [13].人格相似性与关系质量的关系:单向视角[J]. 心理学探新 2011(02)
    • [14].一种新的加权功能相似性算法在蛋白质相互作用研究中的应用[J]. 应用与环境生物学报 2010(03)
    • [15].特征相似性和因果解释在归纳推理中的整合[J]. 心理科学 2010(06)
    • [16].语言中的相似性[J]. 外语教学理论与实践 2008(01)
    • [17].隐喻相似性的认知构建[J]. 知与行 2017(01)
    • [18].关于利用建筑与城市相似性的设计方法分析[J]. 四川水泥 2016(04)
    • [19].基于相似性随时间衰减的矩阵分解算法[J]. 小型微型计算机系统 2016(07)
    • [20].竞争相似性衡量模型[J]. 科技与管理 2013(04)
    • [21].灰色相似性栽培理论在杂交稻宜香481配套栽培中的应用[J]. 湖南农业科学 2013(17)
    • [22].父母-子女人格相似性对教养行为与青少年抑郁关系的调节作用[J]. 中国临床心理学杂志 2012(05)
    • [23].基于运动相似性的仿人机器人上阶梯行走研究[J]. 华中科技大学学报(自然科学版) 2012(12)
    • [24].浅析西门庆和宋思明形象的相似性[J]. 社科纵横(新理论版) 2010(02)
    • [25].一种基于节点局部相似性的复杂网络链路预测算法[J]. 计算机应用与软件 2020(05)
    • [26].基于趋势相似性特征的异常工况监测方法研究[J]. 自动化仪表 2020(02)
    • [27].用户与项目语义相似性填充的协同过滤推荐方法[J]. 西安工业大学学报 2020(02)
    • [28].基于网络嵌入与转移相似性的链路预测研究[J]. 信息技术与信息化 2018(12)
    • [29].师徒间相似性对师傅指导意愿的影响[J]. 心理学探新 2018(06)
    • [30].基于文本内容相似性的网络用户群分析[J]. 佳木斯大学学报(自然科学版) 2017(05)

    标签:;  ;  ;  ;  

    科技项目相似性检测系统研究
    下载Doc文档

    猜你喜欢