国际品牌资讯
您的位置:首页 >品牌 >

谷歌语音助手动作现在可以连续听特定的单词

时间:2020-06-29 12:02:09 | 来源:

谷歌今天为合作伙伴开发了新工具,这些工具在谷歌助手上发展,谷歌助手的语音平台每月有90多个国家的30多种语言的5亿人使用。Actions Builder是基于Web的集成开发环境(IDE),它提供图形界面来显示对话流并支持调试和培训数据编排。连续匹配模式允许Google Assistant通过识别指定的单词和短语来立即响应用户的语音。而且,像Nest Nest Max这样的智能显示器上符合AMP的内容可加快通过网络的浏览。

谷歌还透露,其AI聊天代理可以通过电话安排约会的Duplex,迄今已用于更新Google搜索和Google Maps中超过50万条企业列表。早在3月,首席执行官Sundar Pichai表示,Google将在可能的情况下使用Duplex与餐厅和企业联系,以便在大流行期间准确反映出营业时间,接送和送达信息。随后,该公司以有限的能力将Duplex扩展到了英国,澳大利亚,加拿大和西班牙,最后增加了对西班牙语的支持。

Google Assistant产品管理总监Payam Shodjai在博客中写道:“ [Assistant]增长的核心是人们想要一种更自然的方式来获得所需东西的简单见解。”“这就是为什么我们投入大量资金确保Google Assistant在各种设备和服务之间无缝运行并提供快速准确的帮助的原因。在过去的几个月中,我们已经看到人们的需求在变化,这体现在Google Assistant的使用方式以及它在帮助应对这些变化中所扮演的角色。”

媒体,连续匹配模式和AMP

借助主存储和连续匹配模式,Google旨在推动开发更多具有上下文相关性的Google Assistant应用。家庭存储为连接到家庭图形的设备(例如无线网络)提供了一个数据库,使开发人员可以为单个用户保存进度,例如益智游戏中的得分。至于连续匹配模式(它将在接下来的几个月中推出),它可以让Assistant识别开发人员定义的特定单词或单词集。

关于“连续匹配模式”的更多信息:在Google Assistant开始监听响应之前,它将宣布麦克风将保持启用状态,因此用户不必使用其他提示。根据Google发言人的说法,录制最多可以持续180秒-开发人员根据自己的要求设置持续时间-但用户可以通过说“取消”,“退出”,“退出”,“停止”或“暂停。”也许更重要的是,连续匹配模式尊重帐户级别的隐私设置,并且不会对语音数据进行任何不同的处理。

在媒体方面,Google Assistant的更新后的Media API支持更长格式的会话,并使用户能够在设备之间继续播放内容。(例如,您可以从特定时刻开始视频,音乐和播客,或者在上一个会话中停下来的地方接听。)今年夏天晚些时候,由Google Assistant支持的智能显示器将获得对AMP的支持(加速的移动页面)框架​​,从特定合作伙伴的新闻报道开始,然后扩展到其他Web内容类别。

AMP是一个旨在加快移动网页速度的开放源代码框架-Google宣称可以通过在用户点击结果的可能性与设备和网络限制之间取得平衡,将加载时间缩短到不到一秒钟。Shodjai相信它将使用数十亿个页面(包括VentureBeat)成千上万的Web域,将通过Web实现新的,更快加载的智能显示体验。他写道:“我们希望将强大的Web内容与简单而强大的AMP结合在一起。”

动作生成器和动作SDK

Actions Builder的目的是消除开发人员在Actions Console和Dialogflow(Google的自然语言理解(NLU)平台)之间进行切换,从而为Google Assistant构建语音应用程序(Google称之为“动作”)的需求。如前所述,它允许用户管理NLU培训数据并提供高级调试工具,并且具有本机Actions Console集成,从而可以在一处简化动作的构建,测试,启动和分析。

补充Actions Builder是一个更新的Actions SDK,它提供了基于文件的动作表示以及使用本地IDE的功能。现在,开发人员可以在本地编写NLU和对话模式,并批量导入或导出培训数据以提高对话质量,或者使用命令行界面通过现有的源代码控制和持续集成工具来构建和管理操作。

Actions Builder和Actions SDK都受益于新的对话模型和对Google Assistant运行时引擎的改进。例如,意图和场景使开发人员可以为特定的对话上下文定义训练数据和行为,其中场景充当构建块来描述活动意图,错误处理,基于提示的响应等。场景还将对话流定义与实现逻辑分开,因此它们在整个对话中仍可重用,并且转换指示何时将一个对话上下文切换到另一个对话上下文。

关于运行时引擎,谷歌表示,它现在可以提供更快的响应速度和更流畅的整体体验。就动作在相同数量的培训数据下更好地理解用户而言,它也是“更智能”的。“ [现在]设计和建立对话更加容易,用户将获得更快,更准确的回复。这套产品取代了Dialogflow,成为在Google助手上开发对话行为的首选方式,我们对此感到非常兴奋。” Shodjai说。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

猜您喜欢