论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>本科论文>范文阅读
快捷分类: 语音情感特征提取识别开题报告 语音识别技术和实现开题报告 凌阳语音识别开题报告 语音识别技术论文 语音识别技术文献综述 语音识别开题报告

关于语音识别论文范文 语音识别成长起来,并走向移动应用相关论文写作参考文献

分类:本科论文 原创主题:语音识别论文 更新时间:2024-03-28

语音识别成长起来,并走向移动应用是关于本文可作为语音识别方面的大学硕士与本科毕业论文语音识别论文开题报告范文和职称论文论文写作参考文献下载。

从台式机到移动设备再到更多应用,语音识别已经不再是满足小众需求的新鲜事物——而且还衍生出了一类新型的小工具.

过去三十年里,语音识别是这样的:您能够和自己的计算机交谈,通常使用头戴式麦克风,使用微软Windows中未公开的语音识别应用软件,或者Nuance通信公司“龙自然语言”版的应用软件.如果您发音很清晰,那么屏幕上就会显示出单词,然后执行命令.

今天,改进很大的语音识别技术得到了广泛应用,在过去两年中,它催生了一类新的消费系列产品:语音控制的个人助理.VoiceLabs公司为语音应用软件开发人员提供分析技术,该公司创始人之一Adam Marchick表示:“这是经过了30年的沉淀而一夜成名.它终于变得足够精确,足以能进行对话了.”

和大多数技术一样,语音识别的发展也是逐步的.2017年8月,微软宣布,根据行业标准测试,其会话语音识别系统的单词识别准确度已经超过了专业人类转录员的识别准确度.在此类测试中,专业人员的平均错误率为5.9%,而微软系统达到了5.1%.

微软技术研究员,也是该公司语音和语言部负责人黄学东说:“这就像梦想成真.1993年我们在微软开始语音识别时,错误率大约是80%.1982年,我在读研究生的时候开始研究语音识别技术,那时,我们面对的是孤立的单词,根本不敢想象软件能够像人那样识别出对话.”

Nuance首席技术官Vlad Sejnoha说:“今天,如果您在一间安静的办公室里,清晰的用普通口音说话,那么语音识别准确率能接近100%.”

这样的准确度意味着人们能更好的与自己的电话进行交谈,更轻松高效的与客户服务呼叫中心的机器人聊天,在家里和办公室里使用语音命令.

逐渐累积的进步

Sejnoha说,该技术能够达到目前的水平,也是一步步走过来的.Sejnoha说:“15到20年来,我们使用的主要技术是基于统计学的,特别是隐藏Markov模型.我们有各种各样的模型来预测这个片段是某个特定音素产生的可能性,或者某个单词应该合理的出现在某种上下文环境中.我们开发了各种变体,并且能够稳步进展.

他补充说:“近年来,传统的统计方法已经被深度学习(神经网络)模型所取代,这些模型非常灵活,而且比以前更能推动系统的发展.结果在过去10年中,错误率平均每年下降20%.”他说,语音识别现在能够为更多的人提供服务,用在各种各样的环境中.Sejnoha举了一个语音识别仍然不能很好工作的例子,他说:“在鸡尾酒会上还是要喊.”

Sejnoha预计每年20%的改善率仍然会继续下去,不仅越来越适应嘈杂的环境,而且还能适应很多特殊的情况.他指出:“理解多种语言越来越重要,在欧洲借助GPS地图,还必须做一些工作,比如理解德国司机所说的法语地名.普通话有很多外来词,其发音因人而异.”

关键点

随着每年20%改善率的累积,大厂商开始使用深度学习来制作自己的语音识别引擎.后来,他们越来越信任该技术,认为它足以支持新一类消费产品——个人助理,先是作为应用软件(例如,苹果的Siri和微软的Cortana),后来作为独立的设备(例如,基于Alexa服务的亚马逊的Echo,基于谷歌助理服务的谷歌Home,等).

这类系统的语音识别是在云中进行的.这些设备在收到“OK Google”类似的命令提醒后,开始收听,传送出语音数据.

Marchick解释说:“设备非常薄,就像Unix终端一样.计算机在云中,它们会待命,听它们的名字,就是这样.”

语音和视觉技术公司Sensory首席执行官Todd Mozer补充说:“长期以来,语音识别的重点一直放在计算机上,但在过去的5到10年间,重点转向了消费类技术.第一个关键事件是Steve Jobs发布了Siri,表明了对语音识别的支持.苹果无论做什么都会是消费类电子产品的典范.第二个关键事件是亚马逊发布基于Alexa的产品,例如Echo.”

Marchick说:“当我们在一年前开始这项业务时,市场上只有亚马逊的Echo,以及几万台设备.很快Echo将面对7个竞争对手,预计今年年底会有三千三百万台设备投入使用.语音交互会大幅度攀升.此前,有三百人为这些设备制作语音应用程序.而一年后的现在,有一万六千人.”

Marchick说,Echo的竞争对手包括谷歌Home,再加上未发布的苹果HomePod;運行微软Cortana的未发布的Harman/Kardon Invoke;还有三星Galaxy智能手机的三星Bixby;其中至少有两个是中文系统.

扩展应用

但事实证明,这些供应商通常会提供软件开发工具包,使其语音识别引擎能够被用来开发使用自然语言作为接口的应用程序.对话技术公司顾问Deborah Dahl说:“自然语言和语音识别令人兴奋之处在于这些工具包的开发.他们对其进行设置,以便普通开发人员都能够使用在线工具创建口语系统.这真的降低了难度,所以不需要成为自然语言专家便能够开发客户服务应用程序.”

Sherif Mityas是达拉斯TGI星期五连锁餐厅的首席信息官,说他的公司能够在5个月内启动一个基于语音的接口应用程序,该应用程序是采用亚马逊Alexa工具包Lex开发的.他补充道,对于手机用户和亚马逊Echo用户,它用起来也是一样的,唯一的区别是手机用户通常四处走动,需要确定方向.

Marchick说:“应用程序开发过程就像创建一个网页.您有很多服务可以使用,您编写代码,然后发布代码,最后进行测试.”

Dahl指出,“如果您花几天的时间去适应GUI,那么这个过程会非常简单.最难的是,它们不会帮助您设计应用程序——如果您对结果没有一个清晰的概念,那么当您看到没有覆盖所有应该覆盖的用例时,您不得不回头去做大量的返工工作.”以一个比萨订购应用程序为例,“您必须想清楚所有需要由用户提供的东西:浇料、厚度、尺寸和酱汁,等等.您可以在几星期内自己完成,但是必须和订购系统的后端保持一致.”

总结:关于免费语音识别论文范文在这里免费下载与阅读,为您的语音识别相关论文写作提供资料。

参考文献:

1、 教育招生,如何走向公平化 【摘要】在“国民教育”不断受到重视的今天,义务教育作为基础教育阶段最为重要的一种教育“公益”手段,其公平性已经得到了越来越多的关注。就在今年的2。

2、 成长路上,别丢了仪式感 仪式感就像孩子们成长路上的一支甜蜜口服液,家长们一定不要随意就把它丢弃了。春节前的一个周末,我和老公商量,想带孩子们去城隍庙逛一逛。窝在沙发里。

3、 基于PSO—BP神经网络的语音识别 摘要:针对应用传统BP神经网络在语音识别中训练速度慢、容易陷入局部最优解的问题。该文提出了基于粒子群优化算法的BP神经网络语音识别模型。首先对不。

4、 细节,教育走向成功基石 摘要:班务工作,每位班主任都有一套行之有效的经验方法,无论是低年级小学生良好行为习惯的培养,还是高年级抓常规、帮助孩子养成良好的行为习惯,无不浸。

5、 起死回生,科幻走向现实 妙手回春是人们对医护人员常见的赞美,但随着科技的发展,“起死回生”正从科幻走向现实,研究人员利用“悬停生命”的技术,可以将医学上已经死亡几小时。

6、 基于语音识别逃跑型闹钟 摘 要:本项目采用单片机和语音处理芯片相结合,当语音芯片接受到声音信号时,产生电信号通过单片机控制I O接口电路输入给单片机,通过单片机控制的时。