研究人员提出了基于游戏的AI常识推理基准

发布时间:2020-07-22 10:26:04 【来源:

在上周的国际机器学习大会上接受的一篇论文中,伦敦大学学院和牛津大学的研究人员提出了一个WordCraft环境,以对AI代理的常识推理能力进行基准测试。他们基于《小炼金术2》(Little Alchemy 2)这款游戏,任务是让玩家混合各种成分来创造新的物品,他们说WordCraft既轻巧,又基于现实世界语义启发的实体和关系。

正如研究人员所指出的那样,私人助理和家用机器人需要能够快速学习并能很好地推广到新情况的代理。如果没有能力使用常识和关于世界的常识来推理,这是不可能的。例如,负责执行普通家务却没有看到肮脏的烟灰缸的特工需要知道一系列合理的措施,包括如何清洁烟灰缸并避免将其喂给宠物。

WordCraft通过使代理制作700多个不同的实体(成分),并结合先前发现的实体(例如“水”和“地球”)以创建“泥浆”,来测试代理的常识推理。WordCraft中有3,417个有效的项目组合,并且座席必须使用有关概念之间关系的知识来有效地解决游戏问题,而不必尝试所有组合。通过随机采样目标实体,有效组成实体和干扰因素实体来创建每个任务,并且可以通过增加干扰因素的数量或增加必须创建的中间实体的数量来调整任务难度。

除了WordCraft之外,研究人员还介绍了一种代理程序体系结构,该体系结构利用外部知识图中的信息来指导代理程序的策略。(知识图是由主题专家在AI模型的帮助下创建的域的模型。)鉴于WordCraft中的配方基于常见实体之间的真实语义,研究人员认为,对知识图的条件应该通过将代理的学习限制于偏向于具有常识性语义的交互的策略,从而使代理能够更有效地学习。

在实验中,研究人员专注于零镜头泛化性能,将所有有效配方集分为训练集和测试集。他们还以与WordCraft相同的难度设置收集了人类基线,该基线是对使用常识和常识可以实现的零击性能的估计。

根据该团队的说法,尽管他们的座席体系结构与没有任何知识图谱的座席在更少的培训步骤中达到了同等的成功率,但随着培训的进行,它最终达到了可比的性能水平。“我们计划进一步探索多种途径。研究人员写道,将WordCraft扩展到原始的《小炼金术2》的更长视界设置(用户必须在其中找到尽可能多的实体)可能是研究常识驱动探索的有趣设置。“我们相信这项工作中的想法可以使更复杂的强化学习任务受益于与大量特定任务知识相关的任务,例如NLE。

中国联通:已累计开通5G基站33.2万站 到今年年底预计超过38万个
饿了么现已入驻1000所高校食堂 校园内平均20分钟送达
谷歌在西雅图附近规划新园区 在亚马逊和微软总部所在地扩大触角
我国国家顶级域名“.CN”数量超过2300万个 IPv6规模化部署提速
邬贺铨:截至8月我国IPv6活跃用户达3.65亿 占互联网用户之比达40.32%
苹果、谷歌、英特尔等公司已经加入行业组织美国“6G联盟”
微软今天正式终止Win7嵌入式系统支持 花钱可买三年补丁
OPPO将发布首款概念级应用OPPO CybeReal 针对AR领域

[ 最新资讯 ]

始祖鸟之家双面派对,设计师系列惊艳亮相

  11月24日,被誉为户外爱马仕的始祖鸟(ARC’TERYX)全新概念店——始祖鸟之家在全国顶级商圈北京国贸开业了。现场门店实拍图片   ...

曝小米显示器34寸本月最后一单出货后将暂停供应 因三星无屏供应原因

  本月初,视讯堂消息称小米的 34 寸带鱼屏显示器型号,之后可能无法再保持 1999 元的价格进行销售。今天,视讯堂发布最新消息,称小 ...

微星Stealth 15M超轻游戏本纯净白即将上架 屏幕为15.6英寸

  根据微星笔记本官方的消息,微星 Stealth 15M (纯净白)即将上架预约,这款笔记本是首款采用 11 代低压酷睿 + RTX 2060 配置的 ...

EG7今天宣布收购《机甲战士5》开发商Piranha Games 增加其游戏公司种类

  Enad Global 7(EG7)今天(11 27)宣布收购《机甲战士5》开发商Piranha Games,增加了其游戏公司的种类。  EG7已同意以2410万美元的 ...

华米将推出GTS 2 mini手表:将于12月1日发布 外观更轻薄更精致

  根据华米创始人黄汪的消息,华米将推出 GTS 2 mini 手表,外观更轻薄更精致。    根据华米微博的消息, GTS 2 mini 手表将 ...

冬季必看的小黑裤穿搭指南|九牧王男裤专家

  伴随着秋冬而来的除了购物欲还有穿搭热情,但如果你正苦于衣服少、缺乏穿搭灵感,那么,一条百搭、舒适的九牧王小黑裤,或许可以帮到你,只 ...