论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>论文范文>范文阅读
快捷分类: 相声规矩论文本 俄语论文注释文本 论文文本结构 西北大学硕士论文本论 传播学总论文本分析例子 文本分类论文

关于文本论文范文 一种新型和文本相关话人识别方法相关论文写作参考文献

分类:论文范文 原创主题:文本论文 更新时间:2024-01-08

一种新型和文本相关话人识别方法是关于本文可作为相关专业文本论文写作研究的大学硕士与本科毕业论文文本编辑器论文开题报告范文和职称论文参考文献资料。

摘 要: 在和文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的和文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,和传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统和文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高.

关键词: 文本相关; 说话人识别; 语音识别

中图分类号: TP 391.4 文献标志码: A 文章编号: 10005137(2017)02022407

Abstract: In the study of textrelated speaker recognition,it is to include the identity recognition as well as the speech text recognition.This paper proposes a new kind of textrelated speaker recognition method based on the speech recognition.The model built by this method can describe both the identity information and the speech text information more accurately.Besides,it can also solve the problem that the shortterm speech samples have poor recognition effect.The experiments show that compared with the traditional textrelated speaker recognition system such as dynamic time warping(DTW) and Gaussian mixture modeluniversal background model(GMMUBM),the false alarm probability of the system established by the present method is reduced by 8.9% and the recognition performance is improved.

Key words: textrelated; speaker recognition; speech recognition

0 引 言

伴随着网络化、信息化时代的到来,传统的以密码为特征的身份认证技术暴露出巨大的弊端,很难满足高安全性和长效安全性的要求.语音是人的自然属性之一,不会丢失或遗忘.说话人发声器官的生理以及后天形成的行为存在差异,每个人的语音都带有强烈的个人色彩,故声纹信息具有唯一性.此外语音信号容易采集,系统设备的成本低等优势都为说话人识别技术提供了广阔的应用前景.

根据说话人的训练和测试语音文本,说话人识别可分为和文本无关的和和文本相关两类.前者识别过程中建立模型需要的语音数据量大,而且单纯依靠说话人声纹信息的方式识别率低,且存在说话人语音被窃取录制,语音被模仿等风险,在安全性能要求很高的情况下,很难单独使用这项技术进行识别.而和文本相关的说话人识别要求训练和识别的时候使用内容相同的语音文本,仅采用较少的训练和测试语音数据就能达到较高的识别率;同时语音文本内容也是识别过程中一项重要的判定信息,相同文本的语音几乎是不可能被窃取录制,在文本不知情况下,也不能被模仿,安全性能很高,具有很大的实际意义及研究价值[1],在说话人识别的多数应用案例中,和文本相关说话人识别占了多數[1],比如微信近期推出的声纹锁.

现阶段,和文本相关的说话人识别方法主要有基于动态时间规整(DTW)[2-3]、高斯混合模型(GMM)[4]和高斯混合-通用背景模型等方法(GMMUBM)[5].文献[3]采用DTW算法实现了和文本相关的说话人识别,该算法虽然实现起来较简单,但它是基于非统计的匹配方法,稳健性能差;文献[4]在GMMUBM系统的基础上构建了一个和文本相关的说话人识别系统,并针对训练和测试语音的文本内容固定的特点做出相应调整,提出了内容相关的通用背景模型概念,因为GMM和GMMUBM是一种统计概率模型,其模型的建立需要统计分析大量的特征样本,因此对于短训练语音的情形容易出现统计失真,从而导致识别性能下降[6-7].针对以上问题,本文作者提出了一种基于语音识别的和文本相关的说话人识别方法,具体为一方面利用语音识别技术对语音的文本信息进行判定,另一方面利用GMMUBM方法对语音的说话人身份信息进行判定,两种判定智能结合,让两者的判定结果互相影响,互相制约,较好地解决了短时语音样本的识别效果不佳和系统稳健性差的问题.

2.1 特征参数提取

本系统主要提取是12维MFCC、1维的能量特征及其13维的一阶差分和13维的二阶差分,总共39维的特征参数.其中MFCC提取过程分为预加重、端点检测、分帧、加窗、快速傅里叶变换(FFT)、梅尔频率滤波和离散余弦变换(DCT)等主要步骤:

1) 预加重:预加重的目的是将更有用的高频部分的频谱进行提升,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于进行频谱分析或声道参数分析.

2) 端点检测:对输入语音信号进行判断,从背景噪声中准确找出语音段的起始点和终止点.

3) 分帧:由于语音信号的准平稳特性,只在短时段上才可看做是一个平稳过程,若用对平稳过程的分析方法来分析,必须将信号划分为一个一个的短时段,每一短时段称为1帧,每一帧的长度大概为10~30 ms.分帧采用连续分段的方法,但为了使帧和帧之间平滑过渡,一般采用交叠分段的方法,即每一帧的帧尾和下一帧的帧头是重叠的.

总结:本论文为免费优秀的关于文本论文范文资料,可用于相关论文写作参考。

参考文献:

1、 一种新型采暖散热器组件 公开(公告)号:CN207214235U本实用新型公开了一种新型采暖散热器组件,包括箱体、散热管、排风扇、供水管和回水管;所述供水管和回水管分。

2、 一种智能变电站指针式仪表读数识别方法 摘要:为了解决智能变电站中人工读取仪表存在的效率低下,读取困难等问题,运用数字图像处理技术设计了一个智能变电站指针式仪表自动读数识别系统。该系统。

3、 一种优化稀疏分解的雷达目标识别方法 摘 要: 雷达目标识别中雷达回波数据巨大,因此利用稀疏分解的方法对回波数据进行稀疏化处理。但稀疏分解中的匹配追踪算法存在计算复杂、计算量大的问题。

4、 一种新型环保墙面涂料 项目概述手工壁纸是一种可以随性发挥的个性涂料,其原材料大多取自山地地区独有的天然石灰岩、矿土、天然蜂蜡及自然十二色,不起皮、不开裂、不发霉、。

5、 一种新型筒灯灯饰 授权公告号:CN205101975U专利权人:唐海松;丘永亮摘要:筒灯是一种具有一个螺口灯头,可以直接装上白炽灯或节能灯的灯具,其一般嵌装。

6、 一种新型仓储模型在跨境电子商务中应用 摘 要:随着国家“一带一路”政策的实施以及云南与东盟之间贸易往来的增加,促使云南与周边国家的跨境电子商务日益成熟。作为跨境电子商务中存放商品的仓。