论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>毕业论文>范文阅读
快捷分类: 计算机网络论文 计算机网络毕业设计 网络安全论文 网络营销论文 网络营销相关论文 网络论文 人工神经网络文献综述 卷积码毕业论文 数学建模论文bp神经网络 bp神经网络文献综述 神经网络开题报告 有关神经网络的外文文献翻译

关于卷积神经网络论文范文 卷积神经网络在语言识别中应用相关论文写作参考文献

分类:毕业论文 原创主题:卷积神经网络论文 更新时间:2024-04-22

卷积神经网络在语言识别中应用是关于对写作卷积神经网络论文范文与课题研究的大学硕士、相关本科毕业论文matlab神经网络论文开题报告范文和相关文献综述及职称论文参考文献资料下载有帮助。

摘 要 近年来,随着理论的发展和大数据的来临,人工智能、深度学习再度成为学术界研究的热点.本研究的主要目标是通过卷积神经网络实现对江苏省方言的分类,提出了一种高效准确的语音识别和分类的方法,可建立详细的方言数据库,在方言日益衰微的今天,方言数据库对于方言的保护和研究都具有重大意义.首先详细介绍了用于卷积神经网络的数据集的制作过程,包括语音文件的准备,声谱图的批量转化以及处理过程.然后使用MatConvNet建立卷积神经网络,在训练和测试过程中不断修改参数,最后使用江苏省方言中的单字进行测试,分类的准确率在85%左右,证明该卷积神经网络性能良好.

关键词 卷积神经网络;语音识别;江苏省方言;MatConvNet

中图分类号 TP3 文献标识码 A 文章编号 1674-6708(2018)208-0080-03

1 卷积神经网络

1.1 卷积神经网络的起源和发展

卷积神经网络是人工智能神经网络的一种,Fukushima于1980年第一次提出了一个基于感受野的理论模型Neocognitron,Neocognitron是一个自组织的多层神经网络模型,也是卷积神经网络的理论基础;1998年,Lecun 等提出的LeNet-5采用了反向传播算法对神经网络网络进行有监督的训练,经过训练的网络通过交替连接的卷积层和下采样层将原始图像转换成一系列的特征向量,最后通过全连接的神经网络针对图像的特征表达进行分类,这就是最早的卷积神经网络模型;2012年,Krizhevsky 等提出的AlexNet 在大型图像数据库ImageNet的图像分类竞赛中以准确度超越第二名11%的巨大优势夺得了冠军,使得卷积神经网络成为了学术界的焦点,至此卷积神经网络被广泛应用于语音分析和图像识别领域.

1.2 卷积神经网络的结构

卷积神经网络是一个多层的神经网络,由多个独立神经元彼此连接构成平面,又由多个二维平面构成完整的网络.卷积神经网络一般含有多个卷积层和特征映射层,其中卷积层是卷积神经网络最基本的结构,一般来说,一个典型的卷积层包括数据输入、卷积计算、激活、池化等部分组成.其中,数据输入层也包括可选择性的对原始数据的处理,主要是归一化等图像白化处理;卷积计算的目的是通过卷积核和输入数据的卷积来实现图像的特征提取,得到多个特征映射;激活通过非线性的激活函数处理,提高网络的表达能力;池化层通过最大池化或者平均池化等来减小参数的规模,降低网络的复杂程度.特征映射层上所有神经元的权重相同,通过Logistic回归和ReLu激活映射图像特征,最后一个特征映射层通过softmax输出结果.以本研究为例,本文的卷积层共使用了18个卷积核,并采用最大池化来提取图像有效特征,防止过拟合,同时提高模型泛化能力;特征映射层通过ReLu函数来约束Logistic回归中可能出现的负值,最后一层通过softmax来输出分类结果.

1.3 卷积神经网络的特点和优势

卷积神经网络的模型因其权值共享的结构类似于生物神经网络,使得网络模型的复杂度大大降低而被用于图像及语音的识别,并取得了卓越的效果.另外,由于引入了GPU,以前很复杂的模型现在通过并行计算能很容易地训練,大大缩短了训练调节参数的周期,大大增强了卷积神经网络的实用性.

2 语音文件的准备

2.1 语音文件的选择

为了使卷积神经网络具有良好的性能,本研究选择了种类繁多,发音相近的江苏省方言对神经网络进行训练.因为训练卷积神经网络需要庞大的数据集,本研究按照江苏省各市分为70类,其中每类的语音文件又分为单字、词语和短句各选择300个音频文件,从而提供了足够可分为训练集和测试集的数据库.

2.2 语音文件的下载

首先登录江苏语言和文化资源库http://jsyy. jsjyt.edu.cn/选择所要下载的音频类型和所属市,点击鼠标右键,选择其中的“查看源”选项,使用“ctrl+F”进入查找页面,查找“wav”文件,得到音频的源文件下载地址为:http://jsyy.jsjyt. edu.cn/bigdata/滨海需交文件电子版/录音/方言老男/老男例句/0001小张昨天.wav 获得一个市的所有下载地址后使用Internet Download Manager进行批量下载:点击“任务”选项,选择“从剪贴板中添加批量任务”;点击“浏览”选项,选择需要保存的位置,然后点击“全部选择”,然后点击“确定”;选择“开始执行队列”,点击“确定”,开始批量下载到以县级市名字命名的指定文件夹.这样即可批量下载一个市的方言音频文件.而下载其他市的样本集只需在excel中用目标市替换下载地址中的当前市,重复以上步骤即可.

3 声谱图的转换和处理

3.1 声谱图的转换

为了使用卷积神经网络进行语音识别,本研究使用MATLAB将音频文件转换为可输入卷积神经网络的二维声谱图.在MATLAB中有许多绘图函数,本研究中采用自动短时傅里叶变换spectrogram函数直接绘制音频文件的声谱图,软件框架如图1所示.

使用strcat函数获取音频文件的路径和名称;使用audioread函数读取音频文件并保存为向量形式;使用spectrogram函数将音频文件转化为声谱图,其中的参数分别为:x——输入信号的向量,本研究中即为音频文件转化为的向量;window——窗函数,本研究中默认为nfft长度的海明窗Hamming;noverlap——每一段的重叠样本数,本研究中采用500;nfft——做FFT变换的长度,本研究中取512;fs——采样频率,本研究取384;最终使用saves函数保存获得的声谱图至目标路径.

总结:此文是一篇卷积神经网络论文范文,为你的毕业论文写作提供有价值的参考。

参考文献:

1、 基于卷积神经网络语音情感识别 摘 要:语音识别对于人机交互而言一直以来都是非常重要的。而仅仅识别语音的内容,忽略它的情感是不完整的识别。因此,对语音情感的研究十分有必要。卷积。

2、 基于卷积神经网络的短文本分类方法 摘 要:文本分类一直是自然语言处理中一个备受关注的问题,在邮件分类、文件检索、用户情感识别等领域有着广阔的应用。同时人工智能飞速发展,卷积神经网。

3、 基于全卷积神经网络的图像缩略图生成算法 摘要:为提高缩略图生成中有效信息的保留率,该文提出一种基于全卷积人工神经网络并以图像显著性图驱动的缩略图生成算法。算法可有效识别图像中显著性区域。

4、 基于BP神经网络的人脸识别算法的实现 摘要:人脸识别技术是当前进行身份识别的研究热点,已广泛应用在社会的各个领域。BP神经网络算法可以通过自动学习对网络的权值和偏差进行反复的调整训练。

5、 基于PSO—BP神经网络的语音识别 摘要:针对应用传统BP神经网络在语音识别中训练速度慢、容易陷入局部最优解的问题。该文提出了基于粒子群优化算法的BP神经网络语音识别模型。首先对不。