趋势网(微博)讯:语音识别技术是智能手机的下一个制高点。和大名鼎鼎的苹果Siri相比,谷歌的语音搜索服务Google Voice Search显得不那么有名气。而实际上,如果你有留意应该会发现,谷歌语音搜索技术最近已经有了飞跃式的进步,其识别错误率不会比Siri高多少(前提是你的发音比较标准)。
@趋势网 (微博) 配图
和有美国国防部背景的Siri不同,Google Voice Search一直都备受语音识别算法困扰,谷歌是如何获得如此大进步的?
实际上,在Android 4.1以后,谷歌语音搜索获得了数次重大提升,语其别的机制已经类有些似于人脑。在Android 4.1中,Google加入了被称为“神经网络”的技术,这种技术将语音识别错误率降低了25%以上。当你对你的Android手机说出一个要搜索的关键字时,你的声音会转变成声谱图,被分成8段然后传送到不同的服务器上。Google通过分析以前记录过的无数声谱图,来推测你究竟说了什么。
@趋势网 (微博) 配图:人类声谱图
在这个处理过程中,Google做了两件事:1,从声谱图中分辨出元音和辅音;2,从元音和辅音的组合中推测出单词,然后再做进一步处理。这就和你在看见一张图片的时候是一样的:你的大脑总会先寻找这张图片的边缘再看内容。
这就是Google正在做的事,这间公司布满全球的超级服务器正在一点一滴地探索着IT技术的极限。如果未来有一天,Google宣布他们的服务器已经产生了一个具有人类那样的思考能力的AI,小编一点也不会惊讶。
酒店有酒店自己的规定,干嘛要非得破坏人家的规定,日本还有不招待中国人的饭店呢。