论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>毕业论文>范文阅读
快捷分类: 期刊卷号怎么查 刊物卷号 期刊卷号 教育刊物卷首语 期刊的卷号和期号 基于fpga的卷积码开题报告 卷积码毕业论文 英文期刊卷号 杂志卷首语 如何查看期刊的卷号 培训期刊的卷首语

关于卷积论文范文 基于卷积神经网络语音情感识别相关论文写作参考文献

分类:毕业论文 原创主题:卷积论文 更新时间:2024-03-18

基于卷积神经网络语音情感识别是关于卷积方面的论文题目、论文提纲、卷积的物理意义论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

摘 要:语音识别对于人机交互而言一直以来都是非常重要的.而仅仅识别语音的内容,忽略它的情感是不完整的识别.因此,对语音情感的研究十分有必要.卷积神经网络在图像分类和语音识别等领域中取得了一系列的突破,十分具有分析和研究价值.将语音信号转换成三维语谱图的形式,送入到卷积神经网络进行分类识别是最基本的方式.文章做了以下工作:(1)研究了对语谱图进行不同的预处理,然后再送入网络模型中进行比较.(2)对卷积神经网络进行改进,对比改进后的网络和原始的网络,得出改进后的网络在识别率上具备更好的效果.

关键词:语音情感;卷积神经网络;语谱图;改进

中图分类号:TN912.34 文獻标志码:A 文章编号:2095-2945(2018)13-0040-02

Abstract: Speech recognition is always essential for human-computer interaction. It is incomplete to recognize the content of speech only but ignore its emotion. Therefore, it is necessary to study speech emotion. Convolution neural network (CNN) has made a series of breakthroughs in the field of image classification and speech recognition, which is of great value for analysis and research. It is the most basic way to convert the speech signal into the form of three-dimensional spectrum and send it to the convolution neural network for classification and recognition. In this paper, we do the following work: 1) We study the different preprocessing of the linguistic spectrum, and then send it into the network model for comparison. 2) We improve the convolutional neural network, compare the improved network with the original network, and conclude that the improved network has better effect in recognition rate.

Keywords: speech emotion; convolutional neural network (CNN); linguistic spectrogram; improvement

当今时代智能科技飞速发展,科学家们致力投身于一个伟大的行业,不断探索、不断进步,创造了一项又一项的世界纪录.情感计算这一概念首先被美国Picard教授提出,在她的论文中,情感计算被定义为:和情感相关,来源于情感,或者能够对情感施加影响的计算[1].中科院胡包钢教授对情感计算有重新的定义:通过技术手段,赋予计算机诸如人类识别、理解、表达情感这样的能力,从而可以实现更加和谐的人际交互,实现更加高级的智能[2].20世纪80年代中期,Bezooijen和Tolkmitt对语音情感的基本特性以及模式进行了研究,开启了运用声学特征对情感识别的时代.1999年,Moriyama建立了语音和情感的联系模型,并在电子商务领域中得到了应用[3].到了21世纪,语音情感识别的研究开始逐步加快.美国教授Picard证明了声学特征参数和情感间的联系[4];德国Schuller团队提出了情感识别框架的诸多构想[5];Narayanan科研小组探索了语音中和情感相关的声学特征参数,研究了情感的合成以及结合语义信息的情感识别[6];日本Nicholson选用神经网络技术对情感进行识别[7].21世纪初,国内东南大学赵力教授率先提出了语音中情感信息的研究[8],随后,许多科研机构也开始了相关研究.

1 语音信号的预处理

研究卷积神经网络的输入后,了解到网络的输入是二维矩阵,那么对于复杂的语音信号,该如何转换成研究所需要的二维矩阵.这个时候就要应用语谱图了,语谱图是一种三维频谱,它将和时序相关的傅立叶分析显示到图形上.语谱图的规范化将是CNN语音情感识别研究的第一步,也是至关重要的一步.为了适应于卷积神经网络的要求,介绍下面四种语谱图预处理算法.(1)时间维度降采样:取所有样本中最小的采样频率cmin,以cmin/c为重采样率,获得处理后的样本集合.(2)时间维度中采样:取所有样本的采样频率求平均值得到cmean,以cmean/c为重采样率,可以获得处理后的样本集合.(3)对样本时间维度进行切割,以c为目标时间维度,可以获得处理后的样本集合.(4)时间维度PCA降维,利用PCA降维的方法对时间维度进行处理,获得处理后的样本集合.

2 改进的卷积神经网络设计

2.1 多卷积核CNN

传统的卷积神经网络在卷积核尺度上是固定的,而语谱图上所包含的信息是多尺度的,为了能提取到更具备情感敏感度的特征,采取两种尺度的卷积核进行研究.双卷积核CNN的网络结构为:输入-双卷积-分别池化-分类.

2.2 显著性特征CNN

传统的卷积神经网络在池化层后将一维变量直接送入到Softmax分类器中,并没有对一维向量做任何的处理.分析这些一维向量可以得到,这些并不全是和情感特征相关的向量,所以提出对这些一维向量进行二次特征提取,得到和语音情感更加密切相关的向量.显著性特征提取CNN将情感相关特征和其他特征解耦,实现了特征集合降维的同时,提取了和目标标签更为相关的特征.

总结:本论文为您写卷积毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

参考文献:

1、 基于卷积神经网络的短文本分类方法 摘 要:文本分类一直是自然语言处理中一个备受关注的问题,在邮件分类、文件检索、用户情感识别等领域有着广阔的应用。同时人工智能飞速发展,卷积神经网。

2、 卷积神经网络在语言识别中应用 摘 要 近年来,随着理论的发展与大数据的来临,人工智能、深度学习再度成为学术界研究的热点。本研究的主要目标是通过卷积神经网络实现对江苏省方言的分。

3、 基于全卷积神经网络的图像缩略图生成算法 摘要:为提高缩略图生成中有效信息的保留率,该文提出一种基于全卷积人工神经网络并以图像显著性图驱动的缩略图生成算法。算法可有效识别图像中显著性区域。

4、 基于BP神经网络的人脸识别算法的实现 摘要:人脸识别技术是当前进行身份识别的研究热点,已广泛应用在社会的各个领域。BP神经网络算法可以通过自动学习对网络的权值和偏差进行反复的调整训练。

5、 基于PSO—BP神经网络的语音识别 摘要:针对应用传统BP神经网络在语音识别中训练速度慢、容易陷入局部最优解的问题。该文提出了基于粒子群优化算法的BP神经网络语音识别模型。首先对不。