基于深度学习的维语语音识别研究.pdf

上传人: 太甜蜜 IP属地:江苏 文档编号: 20190314172430529 更新时间: 2023-07-19 格式:pdf 页数:66 大小:5.04MB
收藏 版权申诉 举报
基于深度学习的维语语音识别研究.pdf_第1页
第1页 / 共66页
基于深度学习的维语语音识别研究.pdf_第2页
第2页 / 共66页
基于深度学习的维语语音识别研究.pdf_第3页
第3页 / 共66页
基于深度学习的维语语音识别研究.pdf_第4页
第4页 / 共66页
基于深度学习的维语语音识别研究.pdf_第5页
第5页 / 共66页
资源描述:
语音识别就是将原始语音信号识别成相对应的文本或者其它形式的可以被计算机所处理的信息。语音识别技术是人工智能领域一个重要的研究方向,具有很高的研究价值和商业价值。近年来,随着深度学习在机器学习和模式识别领域的兴起,以及深度学习所具备的超强建模能力,能从海量的数据里“学习”到有效的信息,迅速吸引了众多国内外研究者的关注。深度学习也被应用到语音识别领域,并且取得了很好的效果,基于深度神经网络隐马尔科夫模型(,)的语音识别框架更是迅速取代了传统基于高斯混合模型(,)隐马尔科夫模型的框架,成为当今语音识别系统的标准配置。  以往语音识别所关注的语种主要是那些使用人口多或普及率高的语言,比如汉语、英语、阿拉伯语等,研究过程中所开发的技术成果在不经过太大改动的情况下就可以直接被推广到具有相似特点的语种中。经过几十年的发展,这些语种的语音识别技术发展已经日趋成熟。然而一些像维吾尔语这样的小语种的语音识别技术在国外却没有得到广泛的关注和发展。随着经济的快速发展,也变的越来越开放,关于维吾尔语语音识别系统开发工作的必要性及极其广阔的市场前景是不可忽略的。本文对基于深度学习的网络模型及其建模方法做了详细分析,并将基于深度学习的语音识别技术用在了维吾尔语的识别上。  、研究了基于的声学建模  声学模型(,)是语音识别系统最重要的组成部分,一个好的声学模型可以提高语音识别的系统性能。本文首先介绍了深度神经网络的网络结构以及算法,然后分别用小时和小时的维吾尔语语音数据训练基于深度神经网络结合隐马尔科夫模型的声学模型。通过实验发现小时的训练集训出的声学模型比小时的训练集训出的声学模型在词识别错误率上相对下降了%,这说明训练集合越大声学模型识别率越高。  、研究了基于的声学建模  介绍了循环神经网络(),但由于存在后面时间节点对前面时间节点感知力下降导致的梯度消失问题,因此研究了长短期记忆()网络。通过实验发现声学模型较声学模型在词识别错误率上相对下降了%,这说明声学模型较声学模型有很大的性能提升。  、维语语言模型优化  由于维吾尔语为黏着性语言,黏着语超大词汇量会带来传统整词语言模型数据稀疏、鲁棒性不强等问题。本文通过子词建模的方法对维语语言模型进行了优化,缓解了黏着语超大词汇量带来的传统整词语言模型数据稀疏性、鲁棒性不强等问题,使词识别错误率相对下降了%。
展开
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 举报非法信息、侵权联系 QQ:9411152

机械图纸源码,实习报告等文档下载

备案号:浙ICP备20018660号
收起
展开