位置服务中的中文自动分词技术研究与应用

位置服务中的中文自动分词技术研究与应用

论文摘要

位置服务(Location Based Services,LBS),是指通过移动终端和移动网络的配合,确定移动用户的实际地理位置,从而提供用户所需要的与位置相关的服务信息。这是利用用户位置信息进行增值服务的一种移动通信与导航融合的服务形式。中文自动分词技术于20世纪80年代初在中文信息处理领域被提出,大致可以分为机械分词方法和分机械分词方法两类。机械分词方法基于字符串匹配的原理,易于实现。按照切取字串的方向,机械分词方法可以分为正向匹配法和逆向匹配法;按照每次匹配时优先考虑长词还是优先考虑短词,机械分词方法可以分为最大匹配法和最小匹配法;按照匹配不成功时重新切取字串的策略,机械分词方法又可以分为增字法和减字法。其中最大匹配法、最小匹配法和逐词遍历法被认为是中文分词的基本分词方法,但逐词遍历法并不实用。其它的分词方法都只是在分词过程中采用的一些技巧,并不是纯粹意义的机械分词方法。非机械分词方法主要包括专家系统方法和神经元网络方法。歧义切分字段的处理的是分词算法中的一个难点,在自动分词过程中分词歧义的出现是难以不可避免的。产生歧义的原因主要有:(1)由计算机自动分词产生的特有歧义;(2)由自然语言中的二义性所引起的歧义;(3)由于分词词库的大小而引起的歧义。从构成形式上,歧义切分字段分为交集型歧义切分字段和多义组合型歧义切分字段。从分词结果看,歧义切分字段还可以分为真歧义和伪歧义两类。从切分歧义所需的知识层次分类,可将歧义字段分为:语法歧义、语义歧义和语用歧义。目前,国内几所知名高校都研制了自己的分词系统,并且在分词速度和分词精度上都达到了一定的要求。浙江电信114号码百事通超级搜索服务平台是一个为浙江电信内网用户提供的地图查询系统。在这一平台中,我们需要把存储在数据库中的地址转换成地图经纬度,以便在地图上标识出其地图位置。本文所说的中文地址转换就是指将中文地址转换为其对应的地图经纬度以满足超级搜索服务平台的功能需求。由于人们的诸多书写习惯,中文地址的出现形式较为复杂,但却存在一些使用频率较高的关键字。利用这些关键字作为分词标志,使用中文分词技术,可以完成地址的初步切分。有了地址分词的结果,就可以在经纬度信息数据库中较为准确的检索出与地址相关的经纬度信息,并通过计算最终得出地址所对应的大致经纬度。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 位置服务的开展
  • 1.2 中文自动分词技术介绍
  • 1.3 全文的布局
  • 第2章 位置服务介绍
  • 2.1 位置服务的现状与发展
  • 2.2 浙江电信114号码百事通超级搜索服务平台介绍
  • 2.3 本章小节
  • 第3章 中文自动分词技术概述
  • 3.1 中文自动分词方法与技术
  • 3.2 歧义现象分析
  • 3.3 已实现的中文自动分词系统
  • 3.4 中文自动分词模型(CWSM)
  • 3.5 本章小结
  • 第4章 中文分词技术在浙江电信114号码百事通超级搜索服务中的应用
  • 4.1 浙江电信114号码百事通超级搜索服务平台业务方案
  • 4.2 中文地址转换功能的设计
  • 4.3 本章小节
  • 第5章 中文地址分词的设计与实现
  • 5.1 中文地址分词设计
  • 5.2 中文地址分词的实现
  • 5.3 实验结果
  • 5.4 本章小节
  • 第6章 经纬度的计算方法与技术
  • 6.1 经纬度查找与计算
  • 6.2 经纬度信息采集
  • 6.3 实验结果
  • 6.4 本章小节
  • 第7章 地址转换的改进
  • 7.1 改进的方法
  • 7.2 功能的扩展
  • 7.3 本章小节
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].中文自动分词中的歧义现象研究[J]. 语文学刊 2013(18)
    • [2].基于深度学习的中文自动分词研究[J]. 吉林广播电视大学学报 2019(12)
    • [3].基于条件随机场的藏语自动分词方法研究与实现[J]. 中文信息学报 2013(04)
    • [4].信息过滤中的中文自动分词技术研究[J]. 计算机工程与科学 2009(03)
    • [5].中文自动分词系统概述[J]. 电脑知识与技术 2010(33)
    • [6].多种方法融合的中文自动分词系统的设计与实现[J]. 韩山师范学院学报 2009(06)
    • [7].下期要目[J]. 图书情报工作 2019(22)
    • [8].在线英语语料库自动分词和分句的实现[J]. 电脑知识与技术 2010(28)
    • [9].基于数学设计的计算机自动分词算法[J]. 江西科学 2009(05)
    • [10].以《汉学引得丛刊》为领域词表的先秦典籍自动分词探讨[J]. 图书情报工作 2015(11)
    • [11].藏文词级处理研究现状及热点方法[J]. 电脑知识与技术 2015(32)
    • [12].藏文自动分词技术研究综述[J]. 科技视界 2016(06)
    • [13].藏语自动分词中的几个关键问题的研究[J]. 中文信息学报 2014(04)
    • [14].藏文自动分词系统中虚词识别算法研究[J]. 计算机应用与软件 2017(09)
    • [15].藏语自动分词中的数词识别方法研究[J]. 西藏大学学报(自然科学版) 2015(02)
    • [16].傣文自动分词系统的设计与实现[J]. 中文信息学报 2013(06)
    • [17].彝文自动分词技术研究[J]. 中文信息学报 2011(03)
    • [18].自动答疑系统中文自动分词模块设计与实现[J]. 现代计算机(专业版) 2010(02)
    • [19].基于DRIS系统中的中文自动分词模块设计与实现[J]. 电子设计工程 2016(14)
    • [20].基于小字符集的藏文自动分词技术研究[J]. 西藏大学学报(自然科学版) 2013(02)
    • [21].藏文自动分词系统的设计[J]. 计算机工程与科学 2011(05)
    • [22].基于模板知识的带噪音半结构文本数据自动分词方法[J]. 微型机与应用 2015(17)
    • [23].从计算机自动分词的障碍谈汉语书面语改革[J]. 语文学刊 2008(02)
    • [24].基于词频学习和动态词频更新的藏文自动分词系统设计[J]. 计算机应用与软件 2014(05)
    • [25].藏文自动分词中未登录词处理方法研究[J]. 计算机工程 2012(17)
    • [26].国内中文自动分词技术研究综述[J]. 图书情报工作 2011(02)
    • [27].中文信息处理中自动分词技术的研究与展望[J]. 科技创新与应用 2015(25)
    • [28].班智达藏文自动分词系统的设计与实现[J]. 青海师范大学民族师范学院学报 2010(02)
    • [29].基于计算机自动分词的研究[J]. 沈阳化工学院学报 2008(03)
    • [30].基于CFRs模型的交集型歧义消解研究[J]. 电脑知识与技术 2018(18)

    标签:;  ;  ;  ;  ;  

    位置服务中的中文自动分词技术研究与应用
    下载Doc文档

    猜你喜欢