Siri的强大是有目共睹的。当然,它的强大是与它使用的技术是密不可分的。Siri使用了2种非常先进的计算技术,人工智能及云计算,具体来说,人工智能主要是语音识别以及语音合成技术,云计算主要是以Wolfram Alpha为代表的知识搜索技术(或者知识计算技术)和以Yelp为代表的问答以及推荐技术。
语音识别以及语音合成技术语音识别技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
语音合成是将人类语音用人工的方式所产生。若是将电脑系统用在语音合成上,则称为语音合成器,而语音合成器可以用软/硬件所实现。文字转语音(text-to-speech, TTS)系统则是将一般语言的文字转换为语音,其他的系统可以描绘语言符号的表示方式,就像音标转换至语音一样。
相比于语音识别,语音合成感觉难度要低,并且基本能够在本地完成(很多OS都有内置的语音合成引擎)。而语音识别,由于涉及到语义理解,难度大大加大,需要大量的知识库,一般需要在云端完成。
知识搜索技术,由平台将从公众的和获得授权的资源中,发掘、建立起一个异常庞大的经过组织的数据库,再利用高级的自然语言算法进行处理,最终构造出一个类似于谷歌搜索的工具。
Wolfram Alpha就使用了知识搜索技术,它不同于Google的数学计算搜索引擎—向用户提供一系列可能含有用户所需答案的相关网页,Wolfram Alpha的特色是可以直接向用户返回答案。在搜索处理机制上,Wolfram Alpha也和Google不同:Wolfram Alpha强大的地方,除了它在信息处理和提取方面的功能,还在于它可以通过推理机制在知识库中寻找满足条件的条目,以及它与众不同的强大计算能力。正因为如此,Wolfram Alpha能够做到直接给你提供计算结果。通过这种新型的计算引擎,人们获得的将不再是网上现成的未经处理的内容,而是经过计算生成的信息。由于苹果和Wolfram Alpha进行了深度合作,因此用户提出的需要计算的问题Siri便会指令Wolfram Alpha去完成。
据国外媒体报道,近日有调研公司对Siri进行了一项使用率调查,结果发现目前在Wolfram Alpha进行的所有搜索当中,有1/4来自于Siri。Wolfram Research在官方博客中透露,本月Wolfram Research将进行重大升级。目前Wolfram Research已经将员工数量扩大到200名,以应付未来可能会出现的更为火爆的局面。
何玺在《Siri:搜索引擎的终结者?》一文中曾提到“Siri将电脑从搜索过程中的“被动”参与者转变成了“主动”参与者。智能又贴心的Siri一旦得到进一步普及,它就必然会改变人们的搜索习惯。用户们会习惯于利用语音搜索来寻找他们想要查找的信息,那样可以避免搜索到很多可能完全不相干的结果。而且,移动设备显示屏的尺寸是有限的,到时候谁还会去注意搜索页面上的广告呢?
现在,越来越多的证据表明Siri用户经常绕过谷歌。(siri正在使用的数据库似乎有3个,它们是:Yelp、维基百科和Wolfram Alpha。),如果用户一旦习惯了siri提供的数据,谷歌的价值何在?”。
调研公司的数据进一步印证了何玺对Siri+ Wolfram Alpha……正在改变用户习惯的这一预言。
现在,siri和Wolfram Alpha正在改变用户习惯。
.