你的位置: iPc 首页 > 全部文章 > 手机数码 > 阅读文章
科学X网    Office    苹果中国    微软中国    VPS

iPhone 的 Siri 语音助理究竟牛在哪里?深入解析苹果的人工智能助理

12
十月

不久前,苹果公司宣布下一代iPhone将启用一项新的语音识别系统:Siri。Cult of Mac对Siri进行了一番深入的解析,看过此文或许能让你更有理由相信,人工智能已经走进我们的生活。说到Siri,这是一道硬菜。可在Android上,这个功能一年前就有了,苹果不过是想在这方面“不输他人”,而且其功能也并非如此强大。对吧?错。除了它确实是一道硬菜以外,其他的都错。

iphone-siri

其实,Siri是十年内移动平台上最重要的事件之一。
对Siri持否定看法的人一般会分成两个阵营:一边会说它没什么了不起的;另一边会说Android上之前已经有了。这两方的说法都不正确。

Siri的意义相当重大

我们不妨先从Siri的血统说起。Siri直接发端于史上最大的人工智能项目:五角大楼的CALO项目。CALO是“Cognitive Assistant that Learns and Organizes”的缩写(会学习和组织的认知助理),这个项目汇聚了全球人工智能方面的顶尖科研人员。

整个CALO计划的带头人名叫Adam Cheyer,他现在也是苹果iPhone团队的工程总监。

在《麻省理工技术评论》的采访中,Cheyer说CALO早已开始探索如何把“对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考、服务代表全部融合到一个⋯⋯模仿人类的助理中,帮助人们完成不同的事情。”

他形容说Siri计划就是寻求在一件消费产品中做同样的事情。其实,在过去的四年里,Cheyer和他的团队一直在钻研如何优化CALO,使其能够 在一台强大的移动电话中发挥效用,每天都能被成千上万的用户使用。在过去一年半中,他们把主要精力放在Siri技术和iOS及其应用程序的整合上。

它不是单纯的“声音识别”。它是人工智能。当人工智能进入了你的手机,难道意义还不够重大?

Siri和Voice Actions是两码事

Android系统的Voice Actions也是一项伟大的技术,并已经被许多Android用户所熟知和使用。但说真的,它和Siri不是同一个层面的产品。

Voice Actions提供了非常坚实可靠的声音识别引擎,它的高识别度把曾经一度流行的语音识别工具都比了下去。

不过,和过去的所有语音命令系统一样,它要求你说的话严格符合一系列特定的语法,否则它就无法理解。

Siri和以前公众使用过的所有产品都不相同。你说的话可以和你想表达的意思在字面上毫不相干,从严格的技术上看也似乎是文不对题,但Siri会根据上下文、人类历史以及能够理解一般人类语言的人工智能去分析,并在多数情况下领会你的意思。

打个比方,你想小睡一会,并准备上个闹钟,只需要说“20分钟后叫醒我”。如果你想查阅后面的日程安排,你可以说:“我今天接下来都有什么事?”

这些语句中既不包括会用到的应用程序名称,也不包括所需数据的名称。Siri仍然能够理解。

对人类而言,这些句子再平常不过了。但要让机器去理解这些变化多端的棘手词汇,就是人工智能的圣杯了。

而更加人性化的特点是,一旦你开始和Siri进入一段对话,它甚至能理解许多含义模糊或者引申的语义。比如,你可以问它:“步行范围内有没有什么顶 尖的意大利餐馆?”如果Siri查询后回答“没有”的话,你可以说:“那墨西哥的呢?”Siri会将你的这个问题连同上文的“顶尖的餐馆”和“步行范围” 一道进行理解。

Android的Voice Actions做不到这样的事情,因为它是一个声控命令软件,而并非人工智能。

Siri有时会为你显示网页搜索的结果,有时能替你执行一些操作,有时能够直接控制iPhone里的应用程序。

而且Siri同样能够回答问题,这要归功于它整合的Wolfram-Alpha。你可以随机提问:“30英里是多少公里?”,“巴黎现在几点?”, “钢琴上有多少个八度?”,或者“天空为何是蓝色的?”Siri能够直接回答这些问题。不是唰地显示一个网页。就是回答你的问题。

我们来看看关于Siri的一段视频,试试对Siri说“我爱你”

该视频主要介绍了Siri语音助理功能。Siri是苹果推出的全新语音助理,你可以通过Siri与你的iPhone 4S交谈、查询网络、执行任务或者获取答案。视频中评测的人在问了一些正经问题之后,就开始问一些很傻的问题:比如说你多大了?和我爱你等等。

关于Siri,重中之重是什么?

从历史和文明的角度来看,关于Siri,最伟大的事情并非人工智能本身。而是苹果通过Siri把人工智能带进了现实生活中。

理由就是:苹果将Siri做成了iPhone的一个核心组成部分,并且让它作为手机使用的主流,让每个用户都觉得除了使用很方便之外,更想时时刻刻都尝试使用它。

提到“主流”,我指的是捡起那些被人类文明边缘化了的东西,并使其成为大量人群每日生活的一部分。现在,Google出品的Voice Actions不得不面临被边缘化的境地。一般人甚至都没听说过它。

Siri会成为主流的。人们会逐渐熟知它,甚至包括非iPhone用户。

爱迪生并不是发明灯泡的人。他是通过产品设计和市场营销,将灯泡变为主流的人。

福特并不是发明汽车的人。他是通过控制成本和市场营销,将汽车变为主流的人。

我们总是记住那些将事物变成主流的人,因为正是这些人和公司让科学技术真正融入每个人每天的生活。于是,说道灯泡,它就溯源于爱迪生;说道汽车,它就溯源于福特。

Google的Voice Actions并非人工智能,虽说它确实让用户省去了打字输入、触摸操作的工序,只需要使用声音去控制机器就可以完成一系列事情。但是,Voice Actions最终没有让声控成为主流。或许一些极客们会学着使用它吧。

然而,妈妈们会选择Siri

And One More Thing(还有一件事)

iPhone 4S也许会成为第一款支持蓝牙4.0的手机,这项技术可以降低能耗,同时可以做到一件非常特别的事:唤醒设备。

如果把Siri和这项无线技术结合起来,其使用范围就更加广泛了。例如,可以想象你戴着一款“超长待机”手表,它会一直睡眠,你触摸它才会显示时 间,或者在iPhone收到短信时,手表会被Siri唤醒。你如果要和Siri交谈,只需要对着手表说话就可以了,甚至连手机都不用掏出来。

同样,可以试想一下,有这么一款桌面麦克风,当你说话时会唤醒iPhone,就像《星际迷航》里那样不用按任何按钮直接说话,并从企业号,呃我是说iPhone的人工智能,得到回应。

那么让我们来总结一下Siri对于人类而言意味着什么。Siri是人机交互新纪元的黎明,是大众进入真正的人工智能时代的开端。

当然,目前它尚未达到完美,苹果目前将其定位在“beta”阶段。并且,它也还不是你在科幻电影里看到的那种无限高能的人工智能。

但它的步伐远未停止。iPhone 4S里的Siri只是一个开端。相信以后会有更加复杂的版本出现。

Google、微软和其他公司也终会拿出自己的人工智能产品的(并且我预言就是按照这个排序)。

所以,一旦你最终和Siri搭上话了,请善待它。Siri具有非常非常重大的现实意义,和以往任何产品都不同。它能够代表计算机发展的一个新纪元。当然,它会让每个人都“说”起来的。

关于本文
各种回音
  1. 说: 回复他/她

    siri,看好你哦

  2. 说: 回复他/她

    板凳~

  3. 说: 回复他/她

    地板

  4. 说: 回复他/她

    siri 听得明白中文不,普通话 OR 方言

    • 说:

      不懂

    • 说:

      目前只支持英文。

    • 说:

      这东西在景德镇用的话~~~
      行不通

  5. 说: 回复他/她

    腾讯的小Q机器人算不算人工智能啊,又或者腾讯这个抄袭公司是不是……你懂的

  6. 说: 回复他/她

    同样想知道siri是否能听得懂普通话呢?还是说只限英语?

    • 说:

      现在不懂中文,因为中文太复杂了

  7. 说: 回复他/她

    很好的一篇文章,这个技术在成熟后是在是太强大了,结合google的无人驾驶汽车技术,领先十年的技术啊

  8. 说: 回复他/她

    ip 的程序优化得好,其实也没什么。

  9. 说: 回复他/她

    看到那个闹钟设定的动作我才确定这是人工智能,好好练英语口语吧~

  10. 说: 回复他/她

    打个比方,你想小睡一会,并准备上个闹钟,只需要说“20分钟后叫醒我”。如果你想查阅后面的日程安排,你可以说:“我今天接下来都有什么事?”
    =============================

    不吹牛果粉能死?还人工智能,所谓人工智能能否实现在理论上还不止能不能通过呢?这些所谓的AI不过是把一些统一意思不同说法的语句事先录入,然后指向同一指令罢了,跟google的语音识别没有什么本质区别。

    他要真是AI,能理解“今天该干吗呢,今天还得干吗,今天还有多少屁事……”

    而这些还只是极其简单的,说白了,从语言学上讲,这些话其实还是极其简单的,他们是同一语法结构,只是换了个别单词。所谓的AI根本谈不上,而苹果如果能够快速准确的解决语言识别就已经很了不起了,更遑论AI

    • 说:

      说的不错,看来你也理解了AI的表现,但是,既然你知道他是怎么运作的,为何不抢先苹果把这个搞出来呢?用熟识的理论去做出了不起的东西,这就是苹果的过人之处,更何况也许我们的见识只是井底之蛙,siri真的有了简单的AI能力呢?

    • 说:

      你理解什么叫智能吗?就是有思考的能力,很简单的一个问题能证实siri是否有简单的智能,就拿i love you来说,你对了安卓的系统说说,它会回答你吗?你问安卓系统根号32等于多少,它会回答你吗?

    • 说:

      可笑啊,那叫思考?那只不过是苹果程序员的一个玩笑。我想问一下,如果你对着iphone说20遍ILOVEYOU,我不知道他怎么反映,就算程序员闲着没事多写几个程序应答,就能证明那时AI??如果是的话,诸如使命召唤、战地这样的游戏里,你的队友针对你的一些动作或命令都会有不同的反映,有的甚至多大几十种反映,难道这也叫人工智能?我到很想看看,只能的iphone怎么反馈I Hate YOu, I wanna sell you, Do you know Biil Gates? 这些最简单的对话怎么反映,恐怕他不会自动使用google然后直接给你答案吧?
      什么叫人工智能,我认为最简单的一个衡量标准之一就是创造性?请问果粉眼里的iphone有自我创造性吗?

    • 说:

      一个单机动作游戏好不好玩很大程度上取决于敌人和队友的AI,你如果对AI的定义有怀疑可以去喷给那些游戏制作人听,跟他们说不过是设定的几组程序罢了,你也敢叫AI?

  11. 说: 回复他/她

    转载从来只注明而不给原文链接,我靠 ……

    • 说:

      自己看标题下方。cnBeta。不懂别乱说。

    • 说:

      链接基本每次都有的。这次可能是因为cnbeta不是原创的,所以不给链接。
      http://www.ipc.me/porter-robinson-cs-filming.html

  12. 说: 回复他/她

    在国内应用的号码。

  13. 说: 回复他/她

    在国内能应用的好么?

  14. 说: 回复他/她

    四川话呢

  15. 说: 回复他/她

    Siri目前支持的语言有 美式英语、英式英语、澳式英语、法语、德语。

  16. 说: 回复他/她

    一句话有那么多种表达方式,我都还没懂siri就懂了. 真是对自己汗颜

  17. 说: 回复他/她

    可以用这个siri语音助手来练习英语语法

  18. 说: 回复他/她

    如果siri能够做到比较流畅的英德互译我就满足了。比如说我说句英语,它能把相应的德语翻译出来。

  19. 说: 回复他/她

    我觉得为什么siri能够出来,这句话很重要:
    而且Siri同样能够回答问题,这要归功于它整合的Wolfram-Alpha。
    ===========
    大家可能不知道wolframalpha.com,你们可以去试试看。
    http://www.iplaysoft.com/latex-eqneditor.html
    这个下面我贴了一下东西,勉强介绍了这个网站,但是他是个知识库,包括数学物理英文天文之类的各类知识。你可以问各类问题。这些直接移植到siri里面了。

    然后,我认为,中文版几乎不可能。因为没有一个中文知识库是wolframalpha这样牛叉的。

    • 说:

      失望了。英文还没好到可以和Siri正常交流的程度…..好伤心!

    • 说:

      呵呵,谢谢介绍了wolframalpha.com,通过人工智能对自然语言的处理,再结合强大的数据库的以及搜索技术,能做出siri,苹果确实很牛啊。。。

  20. 说: 回复他/她

    说实话,看完这个我还是不知道siri是啥

    www.5918job.com

  21. 说: 回复他/她

    就是说 苹果 又起了个带头的做用卅,
    是好事~

  22. 说: 回复他/她

    意义重大,实用有限,苹果又再一次敢为人先,占领至高点了。。。

  23. 说: 回复他/她

    人机交互,终于开始了

  24. 说: 回复他/她

    让我想起《人工智能》这部感人肺腑的电影。

  25. 说: 回复他/她

    ai,关键的一点是自我学习的能力

  26. 说: 回复他/她

    人工智能

  27. 说: 回复他/她

    机器程序与人工智能最大的不同就在于有无【学习】能力。假设未来信息储存空间足够巨大至于接近无限,而机器可以记住你告诉它的比方“Tom只有一个蛋”,并且自动更新到它的程序中,在下次别人问他“Tom有几个蛋”的时候能回答,这就是人工智能的第一步了。
    假如语音类人工智能实现并普及,这就意味着人脑与机器甚至互联网产生了更强烈直接的联系,而网络和卫星讯号将会将所用使用者整合为一个虽然结构并不紧密,但联系颇多的“总脑”,而这个“总脑”正在我们不断的使用中飞速学习。这是很恐怖的事了。

  28. 说: 回复他/她

    中国也有小i机器人

微博评论箱