VoiceXML语音浏览器的实现与整合

VoiceXML语音浏览器的实现与整合

论文摘要

人们可以使用电话或移动电话、PC、PDA和其它智能设备通过语音识别、语音合成的交互技术,以及语音浏览、智能信息处理技术等实现访问互联网,实现个人服务和商业服务的语音应用。其中,作为建立于网络与语音通讯之间的桥梁,语音浏览技术发挥着重要的作用。而作为语音浏览技术以及语音互联网的核心,VoiceXML突破性地实现了互联网与电话网的融合,为语音应用领域展现了一个更为广阔的未来。本文在分析VoiceXML、语音识别、语音合成、文档解析等技术的基础上,完成了基于窄带智能网的VoiceXML语音浏览平台的原型系统设计并对系统结构、设计思想进行了详细介绍。本语音浏览平台以卡耐基梅隆大学的开源项目OpenVXI为核心,分为执行平台,VoiceXML语音浏览器和文档服务器三部分,本文重点介绍了VoiceXML语音浏览器的设计、实现、优化以及与执行平台的整合。针对语音浏览器与执行平台高度耦合的局限,本语音浏览器采用标准的INAP/UIScript消息与执行平台进行交互,使其很容易、快速地部署到现有的窄带智能网平台中,并可以轻松地在不同设备制造商的智能网平台间迁移。本语音浏览器的设计充分考虑了大规模商业应用的需要,通过采用多线程多通道的呼叫控制模型满足了商业应用环境下的大话务量并发呼叫请求。由于OpenVXI没有对语音文件播放进行缓存,常常导致不必要的语音文件重复下载,严重地影响语音浏览平台的性能。因此本文提出了一种对语音浏览器的优化方案,通过引入VoiceAgent模块实现对语音文件的缓存,从而极大地提高了整个语音浏览平台的性能。为了更方便快捷地测试语音本浏览器的功能和性能,本文提出了自主开发的自动测试工具VxmlEmul,该工具可以模拟窄带智能网的功能,在不需要SCP、SSP、媒体处理等智能网设备的参与下对语音浏览器进行测试。文章的最后使用VxmlEmul完成了对语音浏览器的测试和性能分析,证实了其实际可行性。本论文的研究工作为进一步的产品化研究和商业应用奠定了一定的基础,并具有实际的参考价值。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 背景
  • 1.2 国内外研究现状
  • 1.2.1 VoiceXML标准的发展状况
  • 1.2.2 国外研究状况
  • 1.2.3 国内研究状况
  • 1.2.4 待解决问题
  • 1.3 论文的主要研究内容
  • 1.4 论文的组织结构
  • 第二章 VoiceXML及关键技术介绍
  • 2.1 VoiceXML介绍
  • 2.1.1 VoiceXML简介
  • 2.1.2 VoiceXML的体系结构
  • 2.1.3 VoiceXML的特点
  • 2.1.4 VoiceXML的基本概念
  • 2.2 语音识别技术
  • 2.2.1 语音识别技术简介
  • 2.2.2 语音识别技术在语音浏览平台中的应用
  • 2.3 语音合成技术
  • 2.3.1 语音合成技术简介
  • 2.3.2 语音合成技术在语音浏览平台中的应用
  • 2.4 文档解析
  • 2.4.1 对象树生成模块
  • 2.4.2 解释器模块
  • 2.4.3 JavaScript集成
  • 2.5 OpenVXI介绍
  • 2.5.1 OpenVXI的组件
  • 2.5.2 OpenVXI的系统框架
  • 2.5.3 OpenVXI在语音浏览平台中的应用
  • 2.6 智能网技术介绍
  • 2.6.1 智能网的产生背景
  • 2.6.2 智能网的概念和目标
  • 2.6.3 智能网系统结构
  • 2.7 小结
  • 第三章 VoiceXML语音浏览平台的设计
  • 3.1 实现原理
  • 3.2 网络结构图
  • 3.3 平台模块结构
  • 3.3.1 协议接口
  • 3.3.2 功能模块描述
  • 3.4 小结
  • 第四章 VoiceXML语音浏览平台的整合
  • 4.1 实现思路
  • 4.2 呼叫控制原理
  • 4.3 VoiceXML服务主程序
  • 4.3.1 处理流程
  • 4.3.2 初始化阶段
  • 4.3.3 处理阶段
  • 4.3.4 关闭阶段
  • 4.4 解析线程
  • 4.4.1 处理流程
  • 4.4.2 呼叫状态机
  • 4.4.3 主要消息处理概述
  • 4.5 电话接口的实现
  • 4.5.1 扩充OSBtelTransferBlind接口函数
  • 4.5.2 扩充OSBtelTransferBridge接口函数
  • 4.6 录音接口的实现
  • 4.6.1 扩充Record函数
  • 4.6.2 扩充OSBrecRecord接口函数
  • 4.6.3 录音状态迁移
  • 4.7 放音接口的实现
  • 4.7.1 数据结构扩充
  • 4.7.2 扩充OSBpromptQueue接口函数
  • 4.7.3 扩充OSBBpromptPlay接口函数
  • 4.7.4 扩充OSBpromptwait接口函数
  • 4.7.5 放音状态迁移
  • 4.8 识别接口的实现
  • 4.8.1 扩充OSBrecRecognize接口函数
  • 4.9 小结
  • 第五章 VoiceXML语音浏览器优化及自动测试工具介绍
  • 5.1 VoiceXML语音浏览器的优化
  • 5.1.1 优化策略
  • 5.1.2 优化后的平台模块结构
  • 5.1.3 VoiceAgent模块描述
  • 5.1.4 VoiceXML语音浏览器的修改
  • 5.2 语音浏览器自动测试工具
  • 5.2.1 概述
  • 5.2.2 测试平台模块结构
  • 5.2.3 VxmlEmul模块描述
  • 5.2.4 模拟消息交互
  • 5.3 小结
  • 第六章 VoiceXML语音浏览器的测试与分析
  • 6.1 测试环境
  • 6.1.1 硬件环境描述
  • 6.1.2 软件环境描述
  • 6.1.3 组网结构图
  • 6.2 测试配置
  • 6.2.1 VxmlEuml的配置
  • 6.2.2 VoiceXML浏览器的配置
  • 6.3 功能测试
  • 6.3.1 测试文档
  • 6.3.2 测试用例
  • 6.3.3 测试方法和结果
  • 6.4 性能测试
  • 6.4.1 测试文档
  • 6.4.2 测试用例
  • 6.4.3 测试方法和结果
  • 6.5 测试分析
  • 6.6 小结
  • 第七章 结论
  • 7.1 总结
  • 7.2 展望
  • 致谢
  • 参考文献
  • 在学期间的研究成果
  • 相关论文文献

    • [1].基于翻转梅尔频率倒谱系数的语音变调检测方法[J]. 计算机应用 2019(12)
    • [2].语音助手能力评估研究及趋势分析[J]. 广东通信技术 2019(12)
    • [3].语音伪造与鉴伪的发展与挑战[J]. 信息安全学报 2020(02)
    • [4].广告语中语音隐喻的使用规则研究[J]. 传播力研究 2020(03)
    • [5].阻止语音欺诈的7种方法[J]. 计算机与网络 2020(09)
    • [6].5G初期语音业务方案与优化策略[J]. 广西通信技术 2019(03)
    • [7].在线语音直播发展动因探析[J]. 视听 2020(09)
    • [8].语音欺骗检测方法的研究现状及展望[J]. 数据采集与处理 2020(05)
    • [9].5G语音回落4G解决方案探讨[J]. 移动通信 2019(04)
    • [10].手机智能语音助手的发展与未来[J]. 通讯世界 2019(04)
    • [11].语音营销,是新机遇,还是新泡沫?[J]. 营销界 2019(02)
    • [12].语音在少数民族口传音乐中的作用——以赫哲族为例[J]. 北极光 2019(06)
    • [13].古交语音与中古语音的比较[J]. 汉字文化 2019(13)
    • [14].手机语音助手用户体验现状及发展[J]. 内蒙古煤炭经济 2019(15)
    • [15].语音助手市场增长惊人[J]. 董事会 2019(10)
    • [16].在线语音直播的兴起与发展探析[J]. 新闻研究导刊 2018(07)
    • [17].基于噪声分类和字典选择的语音活动检测[J]. 华中科技大学学报(自然科学版) 2016(12)
    • [18].语音拣选系统在汽车零部件首批仓库拣选业务中的应用[J]. 物流技术 2017(01)
    • [19].一种基于语音活动检测的声源定位方法[J]. 电脑知识与技术 2017(04)
    • [20].互联网时代语音业务发展的思考分析[J]. 中国新通信 2017(08)
    • [21].一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用[J]. 华东理工大学学报(自然科学版) 2017(04)
    • [22].语音中继主叫号码的限制[J]. 通讯世界 2017(18)
    • [23].在线语音直播开启直播新战场[J]. 新闻战线 2017(21)
    • [24].基于同轴的广电语音业务的实现[J]. 中国有线电视 2016(08)
    • [25].瑜伽语音冥想对大学生心理健康的积极影响[J]. 赤子(上中旬) 2014(15)
    • [26].语音感知和语音产出——二语语音习得研究梳辨[J]. 语文学刊(外语教育教学) 2015(04)
    • [27].国内外语语音能力研究论析[J]. 宿州学院学报 2015(06)
    • [28].关于语音转换实现的研究[J]. 价值工程 2015(29)
    • [29].浅析语音导览系统在博物馆中的应用[J]. 学理论 2015(32)
    • [30].语音反馈的实践改进[J]. 教学月刊小学版(综合) 2020(06)

    标签:;  ;  ;  

    VoiceXML语音浏览器的实现与整合
    下载Doc文档

    猜你喜欢