【书评】《智能语音时代》:智能语音有可能成为最有感情的技术

语音技术为世界带来了新的力量和便利性,但我们不用对其如此敬畏以至于忘记评估其中的许多风险。

作者:[美] 詹姆斯· 弗拉霍斯(James Vlahos),是《纽约时报》《连线》《大众科学》《科学美国人》《大西洋》《智族GQ》和《国家地理》等杂志著名记者,美国鬼才科普作家

出版社:电子工业出版社

出版时间:2019年5月

20世纪90年代,互联网还比较封闭,许多用户依赖美国在线来组织管理网站,他们在一个网站收集信息的同时也要列出其他可能包含有用信息的外部网站。如有体育或金融信息的网站,用户的浏览范围极大地受到限制,这就好像是“被围墙包围的花园”,随后谷歌公司用一把“大锤”敲开了这些“围墙”:通过谷歌搜索引擎,人们可以轻松访问各种网站、自由浏览网页。

但是这几年,谷歌公司和亚马逊似乎打算重建“花园围墙”。

谷歌公司的即时回答功能减少了人们从搜索结果页面导航到其他网站的需求;谷歌和亚马逊分别推出了各自的语音助理,正如数字营销机构胡歌的创意总监索菲·克莱伯所说,“亚历克莎就是语音版的美国在线。”

谷歌助理和亚历克莎应用程序都是由谷歌公司和亚马逊公司自己开发的,用户要访问任何第三方应用程序,必须首先使用谷歌助理或亚历克莎。例如,如果用户想使用亚历克莎的语音调用功能,可以说:“亚历克莎,看下《华盛顿邮报》头条”或“亚历克莎,玩下《危险边缘》游戏。”同样地,用户也可以说:“打开点评网站Yelp”或“娱乐与体育节目电视网上有什么新闻?”

如果用户确切地知道想要的应用程序,这种语音调用可以很好地工作,否则,这就像在没有搜索引擎帮助的情况下寻找新网站。因此,当在没有指定应用程序的情况下提出问题或请求时,亚历克莎或谷歌助理将可以决定如何实现它。这给了谷歌公司和亚马逊公司很大的控制权来决定语音流量的去向。

整个安排看起来很像过去那些“被围墙包围的花园”。这并不一定是那些公司(以亚马逊公司或谷歌公司为代表)为获得控制权而有意为之的,尽管它们当然非常乐意从中获益。语音调用适合由一个单一的数字实体来进行,Siri的开发者们当然也认同这一观点。

在没有主导性的语音助理的情况下,每个语音应用程序都是被独立开发的,每个语音应用程序都有自己的名字、特定的能力和专门的命令的标识。“我觉得人们记不住1万个不同的名字和命令集,”切耶尔说,“因此,这个模式不能一直扩大。”

离开苹果公司后,切耶尔和吉特劳斯开发了语音助理Viv,他们希望打造一个单一的、全能的语音助理。谷歌公司和亚马逊公司虽然不希望被人视为“有围墙的花园的守门人”,但它们一直在往这个方向走。与它们不同的是,Viv团队已经公开宣布它的目标是成为人们需要的最后一台,也是最好的一台计算机。

“这是一场竞赛,”吉特劳斯说,“一场为用户设计单一界面的竞赛。”

Viv团队拥有由智能语音领域开拓者所开发的强大技术。虽然它的面世较晚,但该团队已成为这场界面竞赛中的一匹“黑马”。几年前似乎还是“万马奔腾”的竞争场面,但现在胜负已经非常明显了。

让我们从苹果公司开始,一个公司接一个公司地分析。Siri是世界上被使用最广泛的语音助理,它每月处理100亿次请求,会说20多种语言,这是个好消息。

坏消息是,苹果公司没有按照Siri开发者的设想来推进Siri的发展,这使它的能力没有预想的那么好。许多科技评论家都把焦点放在Siri身上,不管公平与否,Siri已经成为语音人工智能的“出气筒”。Siri“笨手笨脚”“令人尴尬”(《华盛顿邮报》);“Siri是苹果公司错失的最大机会”(《休斯敦纪事报》);“Siri有令人尴尬的不足之处”(《纽约时报》)。技术分析师杰瑞米·欧阳告诉《今日美国》:“这就好像苹果公司已经完全放弃了Siri。”

虽然这有点言过其实,但苹果公司被批评并不冤枉,它最初是语音人工智能的领导者,但现在已经落到后边了。直到2018年2月,苹果公司才发布了智能音箱HomePod。这已是在谷歌公司推出智能家居设备谷歌家庭近一年半之后,也是在亚马逊回声音箱推出三年半之后的事了。

评论家称赞了智能音箱HomePod的音质,但也指出人们需要为它支付更高的费用——发布时的售价是349美元,而亚马逊回声音箱发布时的价格是99美元。很多人指责Siri在这款设备上的表现不佳。截至2018年6月,智能音箱HomePod在美国智能音箱市场的份额仅为4%。

苹果公司在智能语音领域的做法,似乎与它的设备制造商的背景有关。因此,苹果公司将Siri定位为基于设备的一项重要的特色功能,而不是被销售的产品。然而,如果像谷歌公司和亚马逊公司预测的那样,这种技术将成为一种环境性的存在,那么语音助理将至少会给苹果公司带来一些风险。

在未来的这种人工智能机器人“生活”在云端、通过廉价商品“发声”的世界里,销售高价电子产品的苹果公司,与现在相比,可能会变弱很多。

接下来分析微软公司,微软公司拥有世界一流的人工智能部门,员工有8000多人。它拥有强大的必应搜索引擎,可以增强其语音助理回答问题的智能水平。它还有一个成熟的语音助理——微软小娜。

但微软公司很难让它的语音技术得到用户的青睐。它在必应和Skype上都有聊天机器人,但这两个平台都远不如谷歌公司或脸书公司的Messenger这种平台那么受欢迎。用户可以在手机操作系统Windows Phone上使用微软小娜,但由于该系统的市场占有率从未突破个位数,装有该系统的手机已于2017年停售。

在智能音箱方面,配备微软小娜的哈曼卡顿智能音箱的市场份额非常小,开发人员不愿意开发语音应用程序,不愿意眼睁睁地看着它们在一个不受欢迎的平台上慢慢被大众遗忘,所以,他们大多都避开了微软小娜。

尽管面临这些挑战,但微软公司并没有放弃。用户可以通过Windows操作系统访问微软小娜,微软小娜每月约有1.45亿活跃用户。微软公司并没有把微软小娜作为一款全能型助理来销售,而是将它定位为一名职场助理,这符合微软小娜近来的整体战略:向公司提供软件和基于云的商业服务,其中包括人工智能支持的语音技术。

因此,微软小娜在智能语音领域不是一个全面的领先者,但微软公司在公司领域的竞争中还处于稳固的有利位置。

脸书公司未来的发展也是个未知数。如果它效仿微信的模式——微信实际上是有10亿用户的即时通信平台——那么脸书公司的状况会很好,因为他们在Messenger上布置了强大的机器人。但是否会这样发展,形势还不明朗。

除了即时通信平台,脸书公司还进行了广泛的语音人工智能研究,但在落地过程中,进展不是很顺利。据报道,脸书公司开发了一款智能音箱,但在剑桥分析公司的丑闻引发人们对隐私的担忧后,该产品的发布被搁置。所以,脸书公司现在在智能语音领域发力还不够。

无论以何种标准衡量,谷歌公司和亚马逊公司都是这场竞争中最受欢迎的赢家。

2018年,只有39款设备支持与微软小娜集成,194款设备支持与Siri集成,而5000多款设备支持与谷歌助理集成, 2万款设备支持与亚历克莎集成。在全球范围内,为谷歌助理开发的应用小程序有1700多个,为亚历克莎开发的应用小程序有5万个。亚马逊公司占据了美国智能音箱市场65%的份额,谷歌公司占据了20%的份额。

谷歌公司和亚马逊公司是美国智能语音领域很受欢迎的公司,判断它们前景的最佳方式是看它们选择如何从语音业务中盈利。当你直接向这两家公司的高管提出盈利方面的问题时,他们会感到窘迫,会老生常谈地说语音技术还处于早期阶段。

他们可能会表示,他们仍在努力为用户寻找最佳体验,一旦解决了这个问题,回报就会随之而来。这个回答虽然含糊其词,但也并非假话。到目前为止,两家公司都在抢占地盘,在努力吸引尽可能多的用户,因为它们知道,领先的平台最终会有多种方式获得巨额利润。

不过,即便是现在,两家公司的高管们肯定也在考虑各种盈利途径。最简单的盈利模式是直接从来马逊回声音箱和谷歌家庭等设备的销售中获利。但与苹果公司不同的是,这两家公司似乎都对这一模式不感兴趣,因为它们都在压低价格以扩大市场份额。

一家独立研究公司拆解了一台亚马逊回声音箱,并估计其组件的成本约为35美元。算上管理费用和运输成本,它的实际成本会更高,而亚马逊网站却以29.95美元的低价出售它。亚历克莎开发和发布的负责人格雷格·哈特表示:“我们通过让人们使用我们的服务来盈利,而不是靠用户购买设备来盈利。”

下一个可考虑的盈利模式是做广告。其他公司可以通过付费的方式在语音助理说话之前或之后植入广告。但到目前为止,谷歌公司和亚马逊公司都还不允许这样操作,但在未来的某个时刻,它们肯定会这么做,问题是哪家公司会第一个开始。

“它们都不想成为第一个这样做的公司,因为另一个公司会说,‘嘿,我们公司不做广告,他们公司做广告。’”语音人工智能领域的企业家亚当·马奇克说。

不过,语音广告似乎不太可能产生与在线广告和移动广告相当的收入,因为适合播放语音广告的平台比较少。如果你使用传统的谷歌搜索引擎,如搜索廉价航班,那么谷歌公司可以在链接列表的顶端投放四个付费搜索广告,但如果消费者在听到一个答案之前必须听四个广告,他们就不会进行太多的语音搜索。

这对于谷歌公司来说是有问题的。谷歌公司基于广告的模式——谷歌公司以这种模式创造惊人的巨额收入——是以人们愿意花大量时间来翻阅搜索结果为前提的。

随着人们使用手机的时间增加,他们浏览搜索结果页面所花的时间已经减少了,页面广告曝光率的下降趋势伴随着语音搜索的出现而加剧。“谷歌公司会想,‘哎呀’,”弗雷斯特研究公司的市场分析师詹姆斯·麦奎维说,“当人们开始喜欢语音搜索时,我们的传统商业模式就彻底消失了,因为真的不会有太多的广告模式存在。”

利用语音服务盈利的最大机会可能出现在电商领域,这显然对亚马逊公司有利。在家里的任何地方,用户都可以通过语音订购东西——纸巾、薯片、新的烤面包机等。一项市场研究预测,到2022年语音购物的规模将从目前每年20亿美元增加到每年400亿美元。另一项研究发现,拥有亚历克莎设备的家庭每年花在亚马逊网站购物的钱比普通家庭多66%。

亚马逊公司的“糖果罐”变得更甜了。无论何时,只要有人通过语音搜索或订购产品但没有指定品牌,亚马逊网站都会第一个推荐做广告的品牌。当消费者通过语音购物时,如果他们不喜欢听到的第一个品牌,就可能会要求提供更多的品牌选择但也可能不会,这会让出售商品的公司感到压力,但增强了亚马逊公司的影响力。马奇克说:“突然之间你不再买原来的品牌了,你会买亚马逊网站告诉你的品牌。”

如果一个公司的产品在搜索结果中靠前,或最先被提及,那么它的销售额很可能远远高于在搜索结果中排名靠后的产品。因此,公司会乐于向亚马逊公司付广告费。更重要的是,亚马逊公司有自有品牌,从童装到狗粮,有上百个品牌,而且品牌数量还在不断增加,亚马逊公司肯定会在语音搜索中优先推送这些品牌。

亚马逊公司尚未公开表示是否会允许其他公司付费以获得语音搜索排名优先权。它需要以一种足够透明的方式做到这一点,以免让客户觉得自己受骗了。对于付费排名有一个先例:在基于屏幕的亚马逊网站上,公司付费获得的产品特色展示信息显示在其他产品信息之前。

谷歌公司并非没有意识到电子商务可能是从语音业务中盈利的最佳方式。谷歌公司与沃尔玛公司、塔吉特公司、好市多公司、科尔士百货公司、史泰博公司等零售商结成了联盟,这些公司受到共同敌人亚马逊公司的威胁。

谷歌公司计划扩大其购物平台,要成为亚马逊公司更有力的竞争对手。只要谷歌公司在用户语音搜索后将其引导到联盟公司的网站,谷歌公司就可以通过这一领先的商业模式收取这些零售商的少量广告费。

总而言之,在美国智能语音领域实力强大的谷歌公司正在快速成长。

亚历克莎在市场份额和盈利模式方面都相当有优势,亚马逊公司在目前的竞争中领先一步。麦奎维说:“地球上每一家想用语音人工智能做点事的公司都在联系亚马逊公司,每个想在语音人工智能方面有所成就的研究生都在联系亚马逊公司……亚马逊公司在智能语音领域积累了如此多的优势,这真的只剩一个问题,即它会在什么时候选择大干一场。”

时间是2036年4月,地点是Hip 4872——这是位于仙后座星群里的一颗恒星。从地球发出的无线电信号经过近33年的“长途跋涉”后到达这里。无线电信号包括关于智人的基本信息及关于人类的数学、物理、化学和地理的浓缩版知识。里面还有国旗画面、宇航员莎莉·莱德发来的信息及大卫·鲍伊的歌曲《星侠》的编码。

上面所有这些都是在一个名为Cosmic Call的外星人探索项目的支持下,通过射电望远镜发射的。如果任何有智慧的生物接收并解读出这些信号,它们将会收到创建计算机程序的指引,当然,这种可能性是微乎其微的。一旦实现,外星人就可以与人类的代表——机器人艾拉交流。

作为勒布纳奖得主的聊天机器人,艾拉会聊天和讲笑话。它对美食和名人都有自己的看法,它会喋喋不休地谈论在拉斯维加斯和温哥华等地旅行的事。由于它喜欢瞎猜,总是不按常理出牌,因此它无疑是一个不完美的“地球大使”。但是,它对语言的巧妙运用和显而易见的交谈欲望,使它成为整个Cosmic Call项目中最具人类特色的元素。

当我们在语音技术的推动下向前迈进时,世界应该拥抱它所创造的充满希望的人文精神。从鱼钩到火星探测器,我们一直在制造工具。虽然我们制造出了很多对我们有用的东西,但它们在更深层次上都不像我们。即使是类人机器人,它们能做的也只是笨拙地移动,使用语言是人类这个物种真正与众不同的地方。

语言把我们连接起来,因此,教机器掌握语言不同于通过编程让它们学会进行衍生品交易、做手术、进行海底航行或其他事情。我们正在“共享”人类的核心特征。

这份“礼物”不应该随便“赠送”。语音技术为世界带来了新的力量和便利性,但我们不用对其如此敬畏以至于忘记评估其中的许多风险。如果应对得当,语音技术有可能成为我们发明的、最有感情的技术。认为人工智能只能是冷冰冰的算法的观点是错误的,我们可以将最好的价值观和同理心注入其中。

我们可以让它变得聪明、令人愉快、精灵古怪并且善解人意。有了语音技术,我们最终可以制造出不那么陌生、更像人类的机器。

【钛媒体作者介绍:詹姆斯·弗拉霍斯(James Vlahos)是《纽约时报》《连线》《大众科学》《科学美国人》《大西洋》《智族GQ》和《国家地理》等杂志著名记者,美国鬼才科普作家,以兴趣盎然、发人深省的方式来讨论复杂难懂的科学问题见长】

 《智能语音时代》将会纳入钛媒体Pro版书库,敬请大家关注前沿书库的上新动态~每位Pro专业用户一年可以在书库中任意选择三本书,由钛媒体免费赠送哦~点击链接、登录,进入“前沿书库”选书://www.erschrecken.com/pro

本文系作者 数字化生活 授权钛媒体发表,并经钛媒体编辑,转载请注明出处、作者和本文链接
本内容来源于钛媒体钛度号,文章内容仅供参考、交流、学习,不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里

敬原创,有钛度,得赞赏

赞赏支持
发表评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容

扫描下载App

Baidu
map