个性化论文推送系统的研究与实现

个性化论文推送系统的研究与实现

论文摘要

目前,作为学术出版和科学信息交流的全新模式,在线论文发布平台已经引起人们越来越多的关注。在传统的平台中只是简单的对信息进行罗列,因此会出现评议专家人员数量少,评议意见质量低的现象致使在线论文质量无法得到提高。由于专家人员的信息需求倾向会在相当长一段时间内围绕一个主题基本保持不变,因此可以根据专家的研究方向,将其研究领域内的信息主动提供给他们,并且尽量屏蔽那些不相关信息。本文针对在线论文平台——“中国科技论文在线”,设计并实现了一个个性化论文推送系统。该系统对每个专家的研究领域建模,利用文本分类的原理将新发布的论文准确推送给相应专家。首先设计并实现了论文信息搜集模块,它主要负责对Web论文库进行爬取,从而高效的获取专家研究领域的相关论文信息以及新发布论文信息。接着讨论了核心模块——文本分类系统,它在改进特征抽取算法的基础上,实现了向量空间模型、朴素贝叶斯模型,以此对专家的兴趣进行描述。在特征抽取中对常用的特征权重计算互信息方法分析后,提出了新的计算方法,该计算方法综合考虑了频度、分散度和集中度三项指标,使得选出的特征项被整体优化。实验结果表明,贝叶斯模型比向量空间模型更好地表达了用户的兴趣和变化。基于改进后的互信息特征抽取,两个模型在召回率、准确率、F1测试值方面都有一定程度的提高。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 在线论文推送系统背景
  • 1.2 在线论文推送系统概述
  • 1.3 研究现状
  • 1.4 本文主要工作
  • 1.5 本文的组织结构
  • 第二章 个性化在线论文推送系统的设计
  • 2.1 系统必要性分析
  • 2.2 系统目标
  • 2.3 系统总体功能设计
  • 2.3.1 专家数据收集
  • 2.3.2 元数据整合
  • 2.3.3 论文的预处理
  • 2.3.4 论文数据建模及分类
  • 2.3.5 论文推送
  • 2.4 总体功能逻辑设计图
  • 2.5 总体流程图
  • 第三章 论文搜集系统
  • 3.1 系统功能及架构
  • 3.2 网络爬虫模块
  • 3.2.1 网络爬虫系统的实现原理
  • 3.2.2 网络爬虫系统的实现技术
  • 3.2.3 针对万方文献数据库的网络爬虫
  • 3.2.4 针对中国科技论文在线的网络爬虫
  • 3.3 信息预处理模块
  • 3.3.1 切分程序
  • 3.3.2 词干提取
  • 第四章 基于兴趣模型的个性化论文推送系统
  • 4.1 系统结构和模块划分
  • 4.2 特征选择模块
  • 4.3 专家兴趣模型的建立及论文表示
  • 4.3.1 向量空间模型
  • 4.3.2 贝叶斯模型
  • 第五章 系统实现及实验结果
  • 5.1 系统实现
  • 5.2 实验数据介绍
  • 5.3 分类结果的评价方法
  • 5.4 实验结果
  • 5.4.1 贝叶斯模型实验
  • 5.4.2 向量空间模型实验
  • 第六章 总结与展望
  • 参考文献
  • 发表论文和科研情况说明
  • 致谢
  • 相关论文文献

    • [1].算法推送在气象信息传播中的应用——以今日头条和抖音为例[J]. 新媒体研究 2019(21)
    • [2].浅析算法推送新闻存在的合理之处[J]. 新闻研究导刊 2019(23)
    • [3].政务服务中的智能推送:需求、应用模式和实现路径[J]. 电子政务 2020(02)
    • [4].基于微信公众号个性化新闻推送平台设计与实现[J]. 电脑知识与技术 2019(36)
    • [5].基于云短信的煤矿安全监控信息推送系统[J]. 能源与环保 2020(01)
    • [6].基于聚类算法的数字图书馆知识推送原理[J]. 江苏科技信息 2020(01)
    • [7].精准推送:学术期刊构建“全效媒体”的策略与实践[J]. 阅江学刊 2019(06)
    • [8].针对算法推送强化茧房效应的分析与对策研究[J]. 视听 2020(02)
    • [9].信息推送方法及信息推送系统企业知识产权分析[J]. 电脑知识与技术 2020(02)
    • [10].江苏有线同屏推送终端能力探索与实现[J]. 广播电视网络 2020(01)
    • [11].新媒体背景下地学期刊按需出版精准推送供需协调分析[J]. 中国科技期刊研究 2020(02)
    • [12].基于读者体验的科技类期刊精准推送质量评价与控制[J]. 编辑学报 2019(S2)
    • [13].面向企业信息推送的短文本有监督分类[J]. 工业控制计算机 2020(03)
    • [14].基于最大互信息系数的图书馆文献个性化推送系统设计[J]. 现代电子技术 2020(09)
    • [15].行车服务推送平台及其关键算法的设计与测试[J]. 汽车工程 2020(06)
    • [16].信息茧房:对个性化推送的过度担忧[J]. 视听 2020(06)
    • [17].新冠肺炎疫情期间高校图书馆微信公众号信息推送分析——以“双一流”大学图书馆为例[J]. 河北科技图苑 2020(03)
    • [18].基于用户行为的个性化信息推送专利技术[J]. 中国新通信 2020(13)
    • [19].基于新闻推送平台的推送算法研究[J]. 数字传媒研究 2020(07)
    • [20].《健康研究》官方微信公众号正式上线[J]. 健康研究 2020(04)
    • [21].“环境与健康”公众号信息阅读量影响因素分析[J]. 环境卫生学杂志 2020(04)
    • [22].智能化推送业态治理研究:国际比较视角下的政策启示[J]. 中国行政管理 2020(09)
    • [23].基于远程桌面协议的资源推送模型设计[J]. 电子设计工程 2020(19)
    • [24].用户画像机制下信息定向推送的权利保护与法律规制[J]. 西安电子科技大学学报(社会科学版) 2018(04)
    • [25].基于微信平台的信息推送研究[J]. 信息技术与信息化 2019(01)
    • [26].读者需求匹配推送的实现路径探赜[J]. 图书馆理论与实践 2019(11)
    • [27].手机客户端推送消息的负面影响[J]. 青年记者 2019(32)
    • [28].科技类政务微信公众号推送内容选择建议——以微信公众号“广东科技”为例[J]. 科技创新发展战略研究 2018(03)
    • [29].聊天机器人信息推送机制研究[J]. 中国新通信 2018(18)
    • [30].类案推送的精细化:问题、成因与改进——以刑事类案推送为例[J]. 法律适用(司法案例) 2018(20)

    标签:;  ;  ;  ;  

    个性化论文推送系统的研究与实现
    下载Doc文档

    猜你喜欢