论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 论文里的参考文献怎么标注 罗密欧和朱丽叶论文 麦田里的守望者论文 数字图像傅里叶变换论文 参考文献里的ed 论文里的附录是什么 最具学术影响力期刊里有没有外国 论文里引用的图片来源怎么标注 论文里的摘要

关于傅里叶变换论文范文 语谱图傅里叶变换的二字汉语词汇语音识别相关论文写作参考文献

分类:论文范文 原创主题:傅里叶变换论文 更新时间:2024-02-14

语谱图傅里叶变换的二字汉语词汇语音识别是关于傅里叶变换方面的的相关大学硕士和相关本科毕业论文以及相关傅里叶变换论文开题报告范文和职称论文写作参考文献资料下载。

摘 要: 以语音信号的语谱图作为处理对象,提出一种基于宽窄带语谱图傅里叶变换频域图像二进宽度分带投影特征融合的二字汉语词汇语音识别算法.首先,对宽窄语谱图傅里叶变换频域图的图像意义以及相应的语音特性进行分析;然后,分别对宽窄带语谱图频域图像进行二进宽度分带列投影和行投影,将投影值作为语音识别的第一个特征参数集合和第二个特征参数集合,将以上两个特征集进行特征融合作为二字词汇语音识别的特征量,以支持向量机为分类器实现二字汉语词汇语音识别.实验结果表明,该方法对特定人二字汉语词汇语音的识别率可达96.8%,对非特定人二字汉语词汇语音的识别率可达98.8%,为解决汉语词汇整体语音识别提供了一种新的思路.

关键词: 傅里叶变换; 语谱图; 特征融合; 支持向量机

中图分类号: TN912?34 文献标识码: A 文章编号: 1004?373X(2017)16?0013?06

Abstract: A speech recognition algorithm of two?word Chinese vocabulary is proposed, which takes the spectrogram of speech signals as a processed object, and is based on binary width zoning?band projection feature fusion of the broad?band and narrow?band spectrogram images in Fourier tranorm domain. First, the image significance of Fourier tranorm domain image in the broad?band and narrow?band spectrogram and their corresponding speech characteristics are analyzed. Then, the binary width zoning?band column projection and line projection of the broad?band and narrow?band spectrogram frequency domain image are carried out respectively. The projected value is taken as the first and second feature parameter sets for speech recognition. The above two feature sets are fuzed according their features as the feature value of two?word vocabulary speech recognition. Taking the support vector machine (SVM) as a classifier to realize the speech recognition of two?word Chinese vocabulary. The experiment results show that the recognition rate of this method can reach to 96.8% for specific persons and 98.8% for non?specific persons. The proposed method provides a new way for vocabulary recognition.

Keywords: Fourier tranorm; spectrogram; feature fusion; support vector machine

0 引 言

语音识别技术就是让相应的设备通过识别和理解两个过程把语音信号转变为相应的命令或文件的高科技技术.近几年来,语音识别技术的理论研究得到了飞速的发展,相应的应用实现也越来越贴近人们的生活,从而大大提高了相应的工作效率和生活品质[1].

一般来说,语音识别的方法有四种:基于声道模型和语音知识的方法、模板匹配的方法、随机模型的方法和利用人工神经网络的方法.2002年,孙光民研究了基于神经网络的中文孤立词语音识别技术,将时间规整算法与神经网络相结合,组成一个混合级联神经网络语音识别系统.利用该方法对小词表汉语孤立词进行语音识别实验,获得了98.25%的正确识别率[2].2005年,林遂芳等人提出一种基于动态时间规整(DTW)和学习矢量量化(LVQ)神经网络的语音识别方法.该方法用动态时间规整算法先对语音信号进行时间规整,然后通过学习矢量量化神经网络进行语音的分类识别.大量实验表明,采用DTW/LVQ混合模型的识别的正确率[3]为97.9%.2009年,张军等人针对动态时间规整(DTW)对孤立词端点检测准确性过度依赖的问题,采用放宽端点和限定动态规整计算范围结合的算法解决此问题,该算法不仅更准确地放松前后端点降低端点检测的敏感度,而且结合对动态规整计算范围的限定,减少计算量,提高执行效率.实验结果发现采用改进后的DTW算法,平均识别率[4]达到91.8%.同年,吴金南等人针对传统LVQ算法计算量大,泛化能力不强的缺点,采用改进的LVQ算法(LoPLVQ),以缩短训练时间,提高识别率,增强分类器的泛化能力,并且DTW的时间规整能力强,综合了两者的优点,使得新系统在语音识别方面效果显著.实验结果表明,常用汉字发音识别率[5]最高可达99.1%.2010年,肖利君提出了整体路径约束DTW算法(ADTW),并用Matlab语言将改进的语音识别算法编程,仿真表明该算法能有效地提高识别率并有着极好的鲁棒性.对于一定的孤立词汇,整体路径约束DTW算法的识别率[6]达到97.5%.2014年,陈孟元在提取MFCC的基础上,整合差分倒谱参数作为语音的特征参数,并对现有的DTW算法加以改进,节省了系统匹配的计算时间,使其具有一定的鲁棒性.分别对普通话语音、湖北话语音、安徽语音和闽南语音进行测试,每种语音有5个测试模板组,每个模板组将0~9这10个数字语音重复10遍,包括100个测试语音,系统对所有测试模板组的平均识别率[7]为94.55%.

总结:本论文可用于傅里叶变换论文范文参考下载,傅里叶变换相关论文写作参考研究。

参考文献:

1、 壮语对广西汉语方言语音影响 摘 要:广西境内的白话、平话、官话、客家话、湘语、闽语六大汉语方言中受壮语影响最多的是白话、平话、官话、客家话。本文主要分析壮语对这四种汉语方言。

2、 中长期电量预测傅里叶马尔科夫修正模型 摘 要:灰色模型在中长期电量预测中只对电量呈近似指数规律单调增长的序列才有较高的预测精度 随着电量变化随机波动性的增强,建立新的修正预测模型是十。

3、 用傅立叶和小波对我国产出缺口分析 [摘要]本文采用二次时间趋势法、HP滤波、单变量状态空间和多变量状态空间四种方法对我国的产出缺口进行估算,并对估算结果应用傅立叶进行频域分析,应。

4、 基于GeoStation的高密度电阻率色谱图开发和实现 摘要:高密度电阻率法是一种重要的地球物理勘探方法。由于它具有施工快捷、分辨率高,可靠性好、图像直观等优点,已被广泛应用于寻找非金属矿、地下水及各。

5、 基于快速傅里叶变换SmaartLive音频测量基本原理(节选) 【摘 要】介绍关于SIA-SmaartLive?测量平台上所使用的快速傅里叶变换(FFT)技术性实践分析报告的概况,从而了 解SmaartLiv。

6、 周卫红山水开图千里花鸟精工不俗 周卫红,1970年生于江苏苏州,字金家堂游子,号聚宝斋主人,国家一级美术师。现为中国书画研究会副会长、中国书画家协会常务理事,苏州美术院常务理事。