• 基于频繁共现熵的跨语言网页自动分类研究

    基于频繁共现熵的跨语言网页自动分类研究

    论文摘要网页自动分类可有效的提高互联网信息的组织与应用,在建立网页自动分类模型时,需要大量的可信的已标注数据集。相对中文网页来说网页数量增长迅速,已标注数据集缺乏,然而数据集标...
  • 基于向量空间模型的中文网页自动分类技术研究

    基于向量空间模型的中文网页自动分类技术研究

    论文摘要信息技术的发展和互联网资源的迅速膨胀对传统的搜索引擎提出了挑战。在提高搜索引擎对信息的检索效率和用户操作的方便性方面,中文网页自动分类技术是一个有效的解决方案,是中文信...