趋势网 > 资讯 > 正文
版权归原作者所有 侵权敬请通知移除
摘要:语音识别就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。
徐娇劝阻男子餐厅内抽烟被抢手机
网友:抽烟去外面抽,别人不想抽你的二手烟。
赵露思坐轮椅
网友:估计是节食加上拍戏压力过大导致人心情不好,身体抵抗力下降导致的 ​。
女网红拿无人区救命粮喂狗
网友:不过说真的,SOS物资最好还是压缩饼干矿泉水之类的好一点,大米土豆这种容易变质的就不是很科学。
曝特朗普私下抱怨马斯克太黏人了
网友:马斯克算是美国大清醒,可惜由于不是出生在美国,没法竞选总统,所以黏糊一个总统就是最好的选择。
于正问赵露思我怎么着你了
网友:于正这次真是委屈,坐着也能躺枪。
直播间榜一大哥1周骗走女主播7.4万
网友:高端的猎手通常以猎物的形式出现。

趋势网(微博)讯:语音识别就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。

以下为趋势网小编为网友整理的实现语音识别系统的各个方面的技术:

声学特征

声学特征的提取与选择是语音识别的一个重要环节。声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。

由于语音信号的时变特性,特征提取必须在一小段语音信号上进行,也即进行短时分析。这一段被认为是平稳的分析区间称之为帧,帧与帧之间的偏移通常取帧长的1/2或1/3。通常要对信号进行预加重以提升高频,对信号加窗以避免短时语音段边缘的影响。

常用的一些声学特征包括:线性预测系数LPC、倒谱系数CEP、Mel倒谱系数MFCC和感知线性预测PLP。

声学模型

语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。声学模型技术包括:HMM声学建模和上下文相关建模。

语言模型

语言模型主要分为规则模型和统计模型两种。统计语言模型是用概率统计的方法来揭示语言单位内在的统计规律,其中N-Gram简单有效,被广泛使用。

搜索

连续语音识别中的搜索,就是寻找一个词模型序列以描述输入语音信号,从而得到词解码序列。搜索所依据的是对公式中的声学模型打分和语言模型打分。在实际使用中,往往要依据经验给语言模型加上一个高权重,并设置一个长词惩罚分数。

系统实现

语音识别系统选择识别基元的要求是,有准确的定义,能得到足够数据进行训练,具有一般性。英语通常采用上下文相关的音素建模,汉语的协同发音不如英语严重,可以采用音节建模。系统所需的训练数据大小与模型复杂度有关。模型设计得过于复杂以至于超出了所提供的训练数据的能力,会使得性能急剧下降。

自适应与鲁棒性

语音识别系统的性能受许多因素的影响,包括不同的说话人、说话方式、环境噪音、传输信道等等。提高系统鲁棒性,是要提高系统克服这些因素影响的能力,使系统在不同的应用环境、条件下性能稳定;自适应的目的,是根据不同的影响来源,自动地、有针对性地对系统进行调整,在使用中逐步提高性能。

解决办法按针对语音特征的方法(以下称特征方法)和模型调整的方法(以下称模型方法)分为两类。前者需要寻找更好的、高鲁棒性的特征参数,或是在现有的特征参数基础上,加入一些特定的处理方法。后者是利用少量的自适应语料来修正或变换原有的说话人无关(SI)模型,从而使其成为说话人自适应(SA)模型。

趋势网记者编后语:读图时代已经要进化到语音时代,触屏应用也即将升级为穿戴应用。这些技术在实际使用中达到了较好的效果,但如何克服影响语音的各种因素还需要更深入地分析。

西安警方通报男童遭恶犬咬伤
网友:情况稳定掩盖不了伤势严重的事实。
女生被丢高速后司机账号被永久封禁
网友:乘客自己既然没考完试约什么10点30啊,都不是很对吧。
杀熊救妻丈夫与熊搏斗近半小时
网友:母广才满院子的木匠工具,起到了关键作用。
宝石老舅道歉:酒后用身体撞汽车
网友:这个道歉,感觉不是人寻衅滋事,像是路边的车寻衅滋事。
孩子随口一句话男子把家砸烂
网友:不离就别在网上气网友了。
珠海冲撞行人案一审宣判
网友:果然是从重从快,法院好样的。
  感谢各大网址导航推荐本站: