自主心智发育机器人的语音感知映射

自主心智发育机器人的语音感知映射

论文摘要

说和听是人类最为重要的信息获取和传达的手段。与文字等信息交流方式相比,基于语音的交互是绝大多数人所掌握的最普及、最自然的交互方式,不受使用者的教育水平和专业分类的约束。而随着智能机器人的发展和高性能计算机的普及,若能够以语音作为计算机或者智能机器人与使用者交互界面,将会极大的提升计算机和机器人的易用性、友好性,为人们在信息时代的生活带来巨大的便利。自主心智发育作为一个新兴的理论框架,有潜力解决传统方法难以解决的复杂问题和跨任务问题。因此,将自主心智发育理论框架和已有的高性能方法结合起来,使智能机器人能够具备更强的语音交互能力,是一个值得深入探索的理论方向。传统语音处理方法中需要针对特定领域、语言进行人工分析和设计以及人工干预训练,从而导致这些方法对环境的适应能力以及对新语言新领域的扩展能力较弱,不能达到智能机器人在自然环境中为人类服务的设计要求。本文针对这个问题,以自主心智发育理论框架的任务无关的思想为前提,引入递增计算、在线计算、在位计算等原理,通过对语音处理研究中的经典的隐马尔可夫方法进行改进和扩展,将其融入到自主心智发育理论框架中,提出了双隐层马尔可夫模型,作为听觉感知映射模块的核心模型,为自主心智发育机器人这种新框架下的智能机器人进行针对性设计,使其具有在与外部的环境交互的过程中,自动产生和调整声学单位内部表达模型能力,让智能机器人具有听懂不同语种语言,自动适应不同背景噪声条件的潜力,并为机器人的听说联合打下基础。隐马尔可夫模型作为一种经典的语音表达模型,在语音识别和语音合成等应用中都取得了一定的成果。但是这些成果都是针对特定领域的具体问题进行的,比如特定语言的语音识别,在识别之前必须要针对该语言和应用领域训练大量的声学模型和语言模型,这就导致了当应用场景和使用环境发生改变时,原有模型不适用,导致识别效果急剧下降的问题。本文通过对其进行双隐层扩展,并调整其搜索和训练算法,使其能够达到自主心智发育框架中感知映射的基本要求,无需人为干预,不受环境限定,不针对特定语言和领域,使其能够达到自主心智发育机器人的听觉系统感知映射层次的需要。在此基础上,本文针对自主心智发育机器人语音处理感知映射的问题,提出了解决该问题的方法,并给出了实验系统的设计方法,并对针对系统具体实现时进行了计算性能优化。实验证明,相对于传统方法,本文的在发育框架中的方法对新环境具有更强的适应性能。

论文目录

  • 摘要
  • Abstract
  • 第一章 概述
  • 1.1 智能机器人的语音处理
  • 1.2 自主心智发育机器人
  • 1.3 自主心智发育框架中的语音处理
  • 1.4 本文研究目标
  • 第二章 研究背景和相关工作
  • 2.1 基本相关概念
  • 2.2 发声系统和听觉系统
  • 2.3 语音处理的应用背景和研究现状
  • 2.4 自主心智发育的研究背景和现状
  • 2.5 相关领域的研究工作现状
  • 第三章 语音感知映射的关键技术研究
  • 3.1 自主心智发育机器人的语音处理问题
  • 3.2 语音的编码和特征选择及计算方法
  • 3.3 经典语音表达模型
  • 3.4 双隐层马尔可夫模型
  • 第四章 自主心智发育机器人语音感知的实现
  • 4.1 自主心智发育机器人研究平台简介
  • 4.2 系统框架
  • 4.3 样本存储策略
  • 4.4 特征流和数据流
  • 4.5 DHLMM的实现问题
  • 4.6 实验与分析
  • 第五章 总结和展望
  • 参考文献
  • 研究生期间发表论文情况
  • 相关论文文献

    • [1].基于翻转梅尔频率倒谱系数的语音变调检测方法[J]. 计算机应用 2019(12)
    • [2].语音助手能力评估研究及趋势分析[J]. 广东通信技术 2019(12)
    • [3].语音伪造与鉴伪的发展与挑战[J]. 信息安全学报 2020(02)
    • [4].广告语中语音隐喻的使用规则研究[J]. 传播力研究 2020(03)
    • [5].阻止语音欺诈的7种方法[J]. 计算机与网络 2020(09)
    • [6].5G初期语音业务方案与优化策略[J]. 广西通信技术 2019(03)
    • [7].在线语音直播发展动因探析[J]. 视听 2020(09)
    • [8].语音欺骗检测方法的研究现状及展望[J]. 数据采集与处理 2020(05)
    • [9].5G语音回落4G解决方案探讨[J]. 移动通信 2019(04)
    • [10].手机智能语音助手的发展与未来[J]. 通讯世界 2019(04)
    • [11].语音营销,是新机遇,还是新泡沫?[J]. 营销界 2019(02)
    • [12].语音在少数民族口传音乐中的作用——以赫哲族为例[J]. 北极光 2019(06)
    • [13].古交语音与中古语音的比较[J]. 汉字文化 2019(13)
    • [14].手机语音助手用户体验现状及发展[J]. 内蒙古煤炭经济 2019(15)
    • [15].语音助手市场增长惊人[J]. 董事会 2019(10)
    • [16].在线语音直播的兴起与发展探析[J]. 新闻研究导刊 2018(07)
    • [17].基于噪声分类和字典选择的语音活动检测[J]. 华中科技大学学报(自然科学版) 2016(12)
    • [18].语音拣选系统在汽车零部件首批仓库拣选业务中的应用[J]. 物流技术 2017(01)
    • [19].一种基于语音活动检测的声源定位方法[J]. 电脑知识与技术 2017(04)
    • [20].互联网时代语音业务发展的思考分析[J]. 中国新通信 2017(08)
    • [21].一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用[J]. 华东理工大学学报(自然科学版) 2017(04)
    • [22].语音中继主叫号码的限制[J]. 通讯世界 2017(18)
    • [23].在线语音直播开启直播新战场[J]. 新闻战线 2017(21)
    • [24].基于同轴的广电语音业务的实现[J]. 中国有线电视 2016(08)
    • [25].瑜伽语音冥想对大学生心理健康的积极影响[J]. 赤子(上中旬) 2014(15)
    • [26].语音感知和语音产出——二语语音习得研究梳辨[J]. 语文学刊(外语教育教学) 2015(04)
    • [27].国内外语语音能力研究论析[J]. 宿州学院学报 2015(06)
    • [28].关于语音转换实现的研究[J]. 价值工程 2015(29)
    • [29].浅析语音导览系统在博物馆中的应用[J]. 学理论 2015(32)
    • [30].语音反馈的实践改进[J]. 教学月刊小学版(综合) 2020(06)

    标签:;  ;  ;  ;  

    自主心智发育机器人的语音感知映射
    下载Doc文档

    猜你喜欢