CBA

亚马逊Alexa进化史当话语遇见AI生活

2019-08-11 04:22:26来源:励志吧0次阅读

  亚马逊Alexa进化史:当话语遇见AI 生活产生了剧变

  本文系易智能工作室(公众号 smartman 163)出品。聚焦AI,读懂下一个大时代!

  人工智能语音装备不但仅是一台可以表达观点的自动唱机,它们很可能成为人机互动的主要方式之一。

  Alexa的诞生与技能扩张

  2012年8月31日,4名亚马逊工程师注册了一项基础性专利,这项专利的内容往后终究演变成了Alexa。专利涉及了一种人工智能系统,该系统旨在与人类语言,这1世界上最大、最复杂的数据集进行互动。工程师当时只需要使用11个单词和一个简单的图表就能描述它的工作原理。

  一个男性用户在一个安静的房间里说:请播放甲壳虫乐队的Let It Be。

  一台小型台式电脑回答说:没问题。

  然后系统开始播放这首歌曲。

  由此开始,家用语音人工智能成为了亚马逊的一项重要业务,而这1领域也成为亚马逊与其科技界的竞争对手们较量的重要战场。谷歌,苹果、三星和微软都在这1领域投入了上千名研究人员和商业专家,以期待制造出可以同人类进行交换,且便于使用的强大设备。

  直到现在,我们还必须去打字、敲击或滑动来解锁装备和操作。而目前,新的用户界面正在逐渐适应人类,Witlingo公司的首席执行官Ahmed Bouzid说道。该公司制造了各种各样适用于银行、大学、法律公司和其他企业的语音驱动应用程序。

  对亚马逊来讲,其最初只是想制造一个自动唱机,但后来这1项目变得越来越大:它变成了一种基于人类数据并且可以不断学习的人工智能系统。它生产的Echo和体积更小的Dot是无处不在的家庭好帮手,它们可以关灯,讲笑话,或让你不用手就能知晓天下事。

  他们还搜集了大量关于用户的数据,这些数据被用来改进装备本身,并增加他们的功能。自2014年上市以来,已售出了上千万台的Alexa装备。据第三方机构统计,亚马逊目前已占据了美国人工智能语音装备70%的市场。

  (图:沟通的原则:亚马逊设备能听懂的指令越来越多,以下是当你想让它调剂房间灯光亮度时,一些可以见效或不能见效的指令,红色为不能见效的)

  目前,Alexa同超过50种智能照明系统合作,包括飞利浦、通用电气和宜家等。 2016年,德语版的Alexa诞生,其他非英语语种的Alexa也将陆续诞生。但是,亚马逊并没有试图从可与Alexa相连接设备的制造商那里取得收入,这些设备包括智能恒温器、灯泡等。不过,照这样的趋势发展,未来亚马逊与这些公司之间很有可能会签订收入同享合同或是采取其他的支付方式。这三个市场中最小的一个是家庭自动化市场,在这1市场中每一年的支出已超过了50亿美元,而去年美国的零售总额为4.9万亿美元。

  如今,亚马逊通过出售这些设备来赚钱,装备的价格从50美元到230美元不等,最高端的Echo show产品带有视频屏幕。如果选购这些装备的用户终究在亚马逊庞大的上商店中购买了更多的商品,那末亚马逊就能再赚上一笔(不过亚马逊是不会泄漏这些数据的)。若要让Echo像智能那样普及,他们还需要更多的努力。为此,亚马逊鼓励独立开发者在其平台上开发新服务,正如苹果长期以来与所做的那样。

  到目前为止,已出现了超过15000个这样的技能或应用程序。应用程序构建工具十分易于使用,以至于不具有太多知识的人现在可以在大约一小时内打造出一个简单的技能。其中最受欢迎的应用是优步和Lyft的叫车服务。而Duds具有48种不同的技能,可以以狂轰滥炸之势诋毁它的听众。

  而那些最具雄心的开发商中包括了制造、销售与Alexa配合的硬件或服务的公司。例如,Capital One向其银行客户提供基于Alexa的账单支付服务。而总部位于多伦多的Ecobee公司是一家智能恒温器制造商,该公司生产的恒温器可以受Alexa控制,用户可以仅仅通过几个简单的指令就能够提高或下落室温。

  我们的客户都很忙,Ecobee的首席执行官Stuart Lombard说。该公司现在从其与Alexa合作的产品中取得的销售额占总销售额的40%,这些产品也成为了该公司10年来增长最快的业务。

  为了回家,他们不能不忍受交通拥堵,然后他们还要给孩子们喂饭,换尿布,谁知道还要干什么别的。

  我们让他们不用双手就能完成一些工作,这样他们就可以多管齐下了。

  Google Home也有了数百万的销量,苹果和微软也在研发他们自己的设备。这些努力的最终回报是有机会可以占据或最少可以影响三个重要的市场:家庭自动化、家庭文娱和购物。

  虽然可能没有太多人愿意和他们的冰箱交谈,但不可否认的是,生活方式在产生巨大改变。正犹如智能改变了生活的各个方面,语音人工智能设备也在变革着我们的居家生活。为什么需要从床上爬起来去锁门,或者是在大冷天还要去手动开启车上的暖风呢?Alexa或是它的亲戚们就能帮你做这些事了。

  当话语遇见AI

  基于语音的人工智能技术之所以如此吸引消费者,是由于它满足了人类的要求:它按照人类的交换方式进行交换和思考,而使我们不再需要在键盘或屏幕上打字。

  但这样的技术同时也很难打造。人类在说话时完全不斟酌规律性。相反,我们打断自己的话。我们的思维经常反反复复。我们还常常稀里糊涂地说出一些只言片语,有时点头有时摇头,乃至有时支支吾吾说不出话。对人类,有时明明是在胡说八道,我们仍相信自己说的话有道理。

  数千名亚马逊员工正在努力应对这1挑战,这包括在其位于西雅图、加州森尼维尔和马萨诸塞州剑桥等地研究中心的研究人员们。即便如此,亚马逊最近还在为1100个散布在各个部门的、和Alexa相关的工作岗位进行招聘,其中包括215个机器学习专家职位。在公司位于剑桥的办公室召开的一次会议上,经过询问Alexa的首席科学家Rohit Prasad关于为何他需要这么多的人,和他的研究团队什么时候才能完全建成等问题。Prasad回答说:你的问题在我听来简直太可笑了。我已从事了20年的语音技术研究工作,绝大多数时候,我们获得进展的速度都非常缓慢。但是,在过去的五年里出现了很多难逢的良机。

  发明一个真正见效的语音激活式人工智能系统是一个非常复杂且还没有被攻克的困难。在过去,语言科学家们在试图一次性肯定杂乱语句的具体含义时遇到了困难。而现在,新的机器学习方法另觅蹊径,以期待能解决这1问题:他们在一开始时就着手处理那些不完善的词语搭配,继而通过临时性的料想快速调剂这些搭配。

  Prasad表示:问题的关键是具有处理大量用户数据的能力,并可以从之前的错误中吸取教训。随着Alexa同用户相处的时间增加,它搜集到的数据会越来越多,它也随之变得愈来愈聪明。伴随着这些进步,愈来愈多的机会出现,随之而来也需要越来越多的人力。这也就是为何需要招聘这么多人的缘由。

  让我给你举个例子,Prasad说,如果你问阿黛尔的第一张专辑是什么?答案应该是《19》。如果你说播放它,那末Alexa就可以获得足够多的信息,并开始播放那张专辑。但如果有一些对话式的玩笑夹杂其间会怎样呢?如果你先问一下专辑是哪一年出版的,它卖了多少张,又会发生甚么呢?如果进行了上述对话,最后用一个具有困惑性的播放它结束,那末初期版本的Alexa可能就会被难住。而现在这项技术可以遵照一种思维方式,这使得它最少在部分时间可以意想到播放它中的它仍然意味着专辑《19》。

  这类改进来自于机器学习技术对此前数千次类似交换的反思,在这些交换中Alexa被弄胡涂过。系统了解了用户真正想听的是哪首歌曲,和具体是在之前对话的什么地方出现了那首歌曲的名字。麻省理工学院口语系统小组的负责人James Glass说:一开始你需要做一些关于人们如何提要求的假定,然后搜集数据,对你的模型进行调剂。Glass表示,这类机器学习方法得到了广泛的认可,但如果想让它发挥作用,那需要的数据则远远超过了大学研究人员所能掌握的。

  随着Alexa的使用量激增,亚马逊现在具有了一个巨大的人机对话数据库这让它在改进语音技术方面具有了一定的优势,而谷歌长期以来一直仰仗其文本搜索查询取得的数据进行这样的改进。外部数据也是有帮助的:例如,2016年一个庞大的歌词数据库被载入了Alexa中,这可以帮助确保当客户提出想听drove my Chevy to the levee (歌曲《American Pie》中的歌词)时,系统可以自动播放歌手Don McLean的名曲《American Pie》。

  Prasad团队的一个最新项目凸显了这1方法的灵活性。这1项目致力于破解用户在何时会重新提及他们之前提过的要求。提示方式可能千差万别:有些人常说不,不,不,但另一些人偏向于使用停止那个,也有人喜欢尝试不同的表达,比如等一下,实际上,我是想这么做。但Alexa不需要解码所有的话语。大规模的样本数据和半监督式机器学习使系统能够勾画出一组可能的否定性语言标记,以后它可以在这些表达出现变化时,从这组标记中找到一个易于理解的新的请求方式。

  除将Alexa打造成一个更好的听众之外,亚马逊的人工智能专家还在使用大量的数据来让它成为一个更好的演讲者,对机器合成女声的话语节奏进行调剂,以使其可以更好地被使用。传统的语音合成依托的是将众多被记录下的人类语言片断进行融会。虽然这类技术可以产生一种相当自然的声音,但它并不能表达窃窃私语、讽刺或其他类型的话语模式,而这些模式在人类交谈中会被使用到。为了继续加强Alexa对从活泼的对话到深沉的朗诵等不同类型话语的把控能力,亚马逊的机器学习算法采取了不同以往的方法去训练Alexa,使其能够掌握或急切或焦虑等听起来很逼真的声音,那听起来就像是专业的播音员发出的。

  据悉,亚马逊具有自己的有声读物出版机构Audible,这对这项研究有所帮助。

  如何帮助更多人

  语音人工智能技术最热忱的使用者是那些没法轻易在或平板电脑上打字的人。据外媒报道,费城的Inglis公司为残疾人提供住房和其他服务,其首席执行官Gavin Kerr在8个居民住宅中安装了亚马逊Echo和Dot设备。他希望在先期试点测试完成后,终究可以为所有300座住宅全部配备这样的设备。这对当地居民来说是一个难以置信的好消息,Kerr说,他们会过得更舒服。由于这使得他们可以独立。

  据悉,Kerr公司的服务对象是数百名得了多发性硬化症或其他身体衰弱状态的人。对那些卧床不起或坐着轮椅的人来说,够不到墙上的温度控制器是非常痛苦的。他们由于身体问题,很难调理室内室温,Kerr解释道。而72华氏度的房间对他们来说可能一会觉得热,一会觉得冷。由于行动障碍,他们很难让室温保持舒适,特别是在没有全天候护理人员的情况下。

  在对Alexa进行一些小改动后,它就可以为那些语言功能严重受限的人群提供服务了。Kerr提到了一个快四十岁男人的故事,这名男士想要离开长时间护理机构,重返日常生活。Kerr回想道:他告知我们,我永久都没法说出Alexa的指令。因而我们问他:你能说甚么呢?然后我们重新修改了软件,这样Alexa就可以根据他的情况工作了。现在当他想打开厨房灯时,他可以说妈妈,当他想打开浴室灯时,他可以说约翰。

  虽然Inglis公司为新的Echo用户提供了四个小时的培训,但通常是靠新用户是自己探索发现的。将新的Echo从包装盒里拿出来,包装上会特别说明一些常见的功能,比如播放音乐、设置闹钟或更新购物清单。对产品有良好了解的用户可以通过他们笔记本或智能进入Alexa的控制界面,以修改设置,寻找新的应用程序,或了解如何让一款运用最好地发挥作用。

  六月,在一篇阅读量很高的博客中,微软的产品经理Darren Austin写道,Alexa取得的更大的成功在于它能够减缓过于劳碌的生活带来的压力,它是一个可以随时帮助你的好伴侣。他说:通过简单的提问,Alexa可以解决由于不确定性而带来的负面情绪和人们对遗忘的恐惧。他说用户们喜欢随时给Alexa出一些困难,或者将自己的欲望告知它,而它就是一个随时都可以跟你互动的好火伴。

  Alexa的总经理Rob Pulciani通常会每周或更频繁地查看关于Alexa和Dot用户最常常使用语言的整体数据统计。通常情况下,这1列表的顶部是对音乐、、天气、交通和游戏的要求。但是,今年春季,列表上却出现了一个新晋热词。这个热门短语就是Alexa,帮我放松一下。

  当用户发出这个要求时,他们会听到一系列使人情绪舒缓的声音:小鸟唧唧喳喳地叫着,远处的海浪冲击着海岸,或是货运列车隆隆地穿过黑夜。如果用户要求,这样的声音可以延续播放几个小时。当这些应用程序在2015年第一次出现在Alexa的平台上时,Pulciani觉得这只是小众人群的怪癖好。但这些运用很快就取得了大批追随者,压力缠身的成年人会听着这些声音入眠。父母们会把它们变成摇篮曲的替代品。

  当Pulciani发现这一点以后,他和他的同事们在几周内对Alexa的内部结构进行了调剂,以使新的Echo买家可以迅速发现这些抚慰人心的声音,在他们要求系统推荐新技能以供尝试时,这1功能会被推荐给他们。

  下一个目标:持续性对话

  在研究中,谷歌、苹果、微软和亚马逊的人工智能平台显示出了不同的优势。其中,谷歌助理在大范围搜索指令上表现最出色。而苹果的Siri和微软的Cortana在其他一些方面天赋异禀。但在购物指令方面,Alexa表现最好。

  具有与用户进行一场合理的、延续多分钟的对话将会是语音人工智能技术的终极目标。这样雄伟目标的实现要求机器具备非常强的意图辨认能力,即便是说话人没有提出明确的要求。如果一个人说我几周没去健身房了,那他的朋友可能会猜出来他想要谈谈自己面对的压力或是与自尊心相干的话题。对人工智能软件来讲,这一关却很难过。对话题的突然转换,或隐晦的暗示,人工智能也很难理解。

  为了加强其与新一代人工智能和语音技术研究人员的联系,亚马逊在一年前邀请了世界各地10几所大学工程专业的学生,让他们制造能进行20分钟对话的语音机器人。在今年11月截止之前,获得最大进展的学校将获得50万美元的奖金。

  研究人员在用一个周末的时间测试了6个这样的机器人,对他们提出各种问题,包括简单的请求和较为复杂的开放式观点陈说,而后者可能会有很多种回复方式。

  一个机器人问:你最近看了甚么电影吗?这是个良好的开局。

  是的,研究人员回答,我们看了《隐藏人物》。

  对这部讲述NASA早年历史,风格深入而辛辣的电影,机器人并没有做出与报刊影评类似的评论。相反,这个社交机器人回复说:我觉得《隐藏人物》对数学问题的处理上没有太多说服力。

  这可不是研究人员对这部电影的观点,但对一个人工智能程序来说,这样的回应仿佛很可爱,也很公道。以后的交谈很快结束了,但最少人机之间具有了一个短暂而美好的瞬间。可惜的是,其他机器人都没法做到这一点。最令人困惑的一个回答是你喜欢吃路边摊吗?而研究人员想跟他谈的话题和站有关。但当人类可能是说到了机器人的局限性时,这1话题恍如有点尖锐,却得到了驴唇不对把嘴地反问你们能进行集体协商吗?

  几天后,当研究人员向亚马逊公司的Prasad询问他对社交机器人的看法时,他却表示其实不为智能机器人初期的挫折而感到失望。这是一个非常重要的领域

  ,Prasad告诉我。而在这些领域Alexa可以继续提升,变得更智能。

  但這比下圍棋或象棋要難多了。由于在這些游戲中,即使有很多可能的動作,但你知道游戲最終的目標是什么。而在對話中,你可能乃至都不知道對方想要到達什么目的。當Alexa最終能夠解決這個問題時,我們就能實現真正的交換了。

济南租房网
贵阳科技网
新乐民生网站
分享到: