网络学术资源主题判定技术研究

网络学术资源主题判定技术研究

论文摘要

互联网络的迅速发展,使网络资源成指数级增长,对各专业领域的发展也带来了巨大的影响,对于专业领域人员而言,怎样准确地从浩如烟海的网络信息资源中找到所需的专业学术资源是一件非常有意义的事情,因此判断学术资源是否属于该专业领域就十分重要了。现有的一些专业领域学术资源大都是手动人工整理出来的,存在着工作量大、维护困难、适应性差等缺点。针对以上问题,网络学术资源主题判定系统TIARI根据网络资源的特点提出了基于网页正文的主题判定方法,其基本思想是:使用基于HTML标签的网页正文信息抽取算法抽取得到网页正文,根据训练阶段得到的该专业领域主题特征词集及其权值计算主题相关度。由于大网页正文向量空间消耗资源过多,TIARI系统提出了基于网页摘要的主题判定方法予以修正,使用基于网页结构的摘要选择方法和基于句子的摘要选择方法相结合的方式得到网页的摘要信息,进而计算主题相关度。结合基于网页正文的主题判定方法和基于网页摘要的主题判定方法这两种主题判定方法的优点,TIARI系统提出了综合主题判定方法。综合主题判定方法根据专业领域网页超链接的特征和网页内超链接之间的内在联系得到一定的权值,并分析基于网页正文的主题判定方法和基于网页摘要的主题判定方法的内在联系,以此作为两者权值分配的依据,从而使得主题判定更加准确。基于Windows操作系统平台,采用Java语言实现了SemreX的TIARI系统,并且对系统进行了测试。功能测试表明:对网络学术资源的主题判定功能正常。性能测试结果表明:当阈值取0.35时,基于网页正文的主题判定、基于摘要的主题判定、综合主题判定这三种方法的准确率分别为90%、91%、93%,召回率分别为90%、91%、92.5%,F-measure分别为:90%、91%、92.75%;当阈值取0.45时,三种主题判定方法的准确率分别为95%、96%、96.5%,召回率分别为86%、89%、91%,F-measure分别为:90.28%、92.37%、93.67%。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 问题提出
  • 1.2 国内外研究现状
  • 1.3 课题背景与研究内容
  • 1.4 论文组织结构
  • 2 网络学术资源主题判定系统TIARI 的设计
  • 2.1 基于语义的科技文献共享平台SemreX 简介
  • 2.2 TIARI 系统的主要设计思想
  • 2.3 TIARI 系统的体系结构
  • 2.4 TIARI 系统的工作流程
  • 2.5 小结
  • 3 网络学术资源主题判定系统TIARI 的实现方法
  • 3.1 基于网页正文的主题判定
  • 3.2 基于网页摘要的主题判定
  • 3.3 综合主题判定
  • 3.4 小结
  • 4 网络学术资源主题判定系统TIARI 的主要实现技术
  • 4.1 网络爬虫机制
  • 4.2 文本表示
  • 4.3 阈值策略
  • 4.4 信息存储机制
  • 4.5 小结
  • 5 系统测试与分析
  • 5.1 评估标准及测试环境
  • 5.2 功能测试
  • 5.3 性能测试
  • 5.4 小结
  • 6 总结及未来工作
  • 致谢
  • 参考文献
  • 附录1 攻读学位期间软件著作版权目录
  • 相关论文文献

    • [1].“互联网+”背景下网络学术资源的众筹开发与利用研究[J]. 兰台内外 2019(20)
    • [2].网络学术资源免费获取技巧[J]. 榆林学院学报 2016(02)
    • [3].网络学术资源的开发与利用[J]. 考试周刊 2013(41)
    • [4].免费网络学术资源的获取途径与技巧[J]. 卫生职业教育 2010(03)
    • [5].网络学术资源的获取[J]. 中共贵州省委党校学报 2008(06)
    • [6].高校图书馆免费网络学术资源建设要点研究[J]. 图书馆理论与实践 2011(07)
    • [7].大数据时代数字图书馆面临的机遇和挑战[J]. 大众文艺 2017(03)
    • [8].数学免费网络学术资源获取的途径及检索技巧[J]. 信息与电脑(理论版) 2011(24)
    • [9].我国高校图书馆免费网络学术资源建设情况调查与分析——以“211工程”高校为例[J]. 图书馆学研究 2008(11)
    • [10].高校图书馆网络学术资源整合[J]. 现代情报 2008(09)
    • [11].充分利用网络资源 提高科技期刊初审质量[J]. 中国科技期刊研究 2011(03)
    • [12].“美味书签”在网络学术资源导航服务中应用探析[J]. 图书馆杂志 2009(02)
    • [13].大学生利用网络学术资源不端行为现状研究[J]. 当代青年研究 2011(07)
    • [14].我国网络学术资源建设的政策保障[J]. 科技创业月刊 2010(04)
    • [15].基于高职院校专业需求的网络学术资源组织模式探讨[J]. 科技情报开发与经济 2009(35)
    • [16].浅谈网络学术资源的使用[J]. 云梦学刊 2008(03)
    • [17].大数据时代数字图书馆面临的机遇和挑战[J]. 科技资讯 2016(29)
    • [18].谈档案学免费网络学术资源的获取途径[J]. 兰台世界 2009(14)
    • [19].CrossRef简介[J]. 分子植物育种 2011(03)
    • [20].网络学术资源的免费利用[J]. 牡丹江大学学报 2009(01)
    • [21].网络学术资源整合系统及其应用[J]. 图书馆理论与实践 2011(11)
    • [22].网络学术资源的RSS定制与管理[J]. 图书馆工作与研究 2009(09)
    • [23].网络学术资源网站的研究与实现[J]. 湖南邮电职业技术学院学报 2016(03)
    • [24].数字环境下的高校网上学术资源开发与利用[J]. 晋图学刊 2008(05)
    • [25].社交媒体学术资源开发与利用状况分析[J]. 出版科学 2020(02)
    • [26].学术博客用户的博文分类行为研究——以科学网博客为例[J]. 情报学报 2016(11)
    • [27].学海无涯巧渡舟——免费获取网络学术资源的几个路径与技巧[J]. 历史教学(中学版) 2011(01)
    • [28].畜牧兽医网络学术资源的检索与利用[J]. 黑龙江畜牧兽医 2010(16)
    • [29].基于网络引文的网络学术资源可获取性研究——以湖南高校为例[J]. 科技情报开发与经济 2015(11)
    • [30].近年来网络新型学术信息资源、搜索及搜索工具分析[J]. 中国索引 2009(04)

    标签:;  ;  ;  ;  

    网络学术资源主题判定技术研究
    下载Doc文档

    猜你喜欢