Facebook的DEC AI在两年内发现了数亿个伪造账户

发布时间:2019-12-27 11:16:02 【来源:

Facebook首席执行官马克·扎克伯格(Mark Zuckerberg)经常喜欢断言,人工智能已经大大减少了数百万用户的滥用行为,而且他没有错-在其最新的《社区标准执行报告》中,Facebook表示,在2001年至2009年期间,该公司删除了超过32亿个虚假帐户4月和9月,去年同期为15亿多。增长的至少一部分归因于称为深度实体分类(DEC)的机器学习框架,Facebook在10月的2019 Scale会议期间首次详细介绍了该框架。

DEC自部署以来的两年内,使平台上的滥用帐户减少了20%,具体而言,这相当于“亿万个”帐户。Facebook软件工程师Sara Khodeir说,更简单的模型用于在注册时检测数百万个帐户,但是DEC在挑战案例中表现出色。

据Khodeir称,它旨在解决Facebook在其传统的自动伪造帐户检测方法中遇到的问题。从历史上看,团队将确定一组功能,例如帐户的年龄,朋友数量和位置,并将每个功能标记为“滥用”或“良性”数据,以用于训练帐户分类器模型。由于功能是由工程师手写的,因此功能空间相对较小,从而使攻击者更容易怀疑。最终,这些攻击者开始使用游戏的特定功能-例如,等到帐户到期后再使用它们发布有害内容。

相反,DEC通过汇总社交图中其他相关帐户的行为特征属性来提取帐户的“深层特征”。它本质上是递归的,为每个帐户提供超过20,000个功能,而不是数十个或数百个。它使用多阶段,多任务学习技术,该技术使用大量的低精度自动生成的标签与少量的高精度人工提供的标签,从而减少了训练前所需的注释工作。

DEC首先考虑实体类型的帐户直接特征,例如年龄和性别(用户实体),支持者数量和类别(页面),成员数量(组),操作系统(设备)以及国家和声誉(IP地址)散布到与该帐户进行交互的其他实体,例如页面,管理员,组成员,共享设备的用户,共享到的组以及注册的帐户。提取特征后,在进行一阶和二阶扇出结果之前,将数字(例如,平均好友组数)和分类(例如,最常见类别的百分比)应用于聚合实体聚合在一起。

该方法已使用三种不同的模型以及来自Facebook的大量生产数据进行了验证-一种仅具有直接特征的行为模型,具有数万种特征的DEC模型以及具有更大语料库的更复杂的DEC。结果表明,虽然基本行为模型无法预测伪造帐户的准确率超过95%,但两种基于DEC的模型都超过了这一点,并且识别出了更多的伪造帐户。

Khodeir说:“在DEC投入生产的过去几年中,我们已经看到平台上[滥用]帐户的数量已逐步减少。”“即使攻击者的数量增加了,DEC的捕获量也几乎相同。”

深圳罗湖打造“一个中枢五个中心” 建成中国黄金钻石交易中枢体系
广西黄金珠宝产业园优化全产业链发展 目前为止已入驻企业37家
国内知名珠宝企业齐亮相首届消博会 展现民族品牌新形象
吉尔吉斯斯坦或将取消珠宝产品生产设备进口的增值税 包括精矿砂、合金等
潍坊昌乐“中国宝石城”化身“潍坊市电商小镇 珠宝商变身为“直播网红”
广州发布全国首份围绕新发展格局支持钻石产业专项政策 培育壮大产业集聚带
未来5年 深圳罗湖构建全球竞争力和国际影响力的黄金钻石金融中心
中国珠宝成为首届中国国际消费品博览会唯一指定进口代理商

[ 最新资讯 ]

L Brands在第一季度的强劲销售提振

  这家零售公司宣布计划分拆 本月初的《维多利亚的秘密》,该公司公布 了截至5月1日的季度收入为30亿美元,比 去年疫情期间的16 5亿美 ...

L Brands在第一季度的强劲销售提振

  这家零售公司宣布计划分拆 本月初的《维多利亚的秘密》,该公司公布 了截至5月1日的季度收入为30亿美元,比 去年疫情期间的16 5亿美 ...

Shopee第一季度亏损4.22亿美元

  新加坡的海集团,旗下拥有电子零售商Shopee,今天报告说,其截至3月的三个月净亏损从去年的281亿$扩大至4 22亿$,日经亚洲写道。  这 ...

阿雷佐公司的第一季度利润增长了310%

  巴西鞋类和配饰集团在2021年第一季度的调整后净收入为2960万巴西雷亚尔(560万美元),比去年同期的720万雷亚尔(135万美元)增长了310 7% ...

专业调谐器称Apple TV的自动校准器无法提供

  苹果在四月推出了带有新Apple TV 4K的电视校准功能。颜色平衡选项使用带有Face ID的iPhone上的前置传感器来优化Apple流媒体盒(包括2 ...

华纳传媒与Discovery宣布合并 美国媒体行业其他公司不得不采取应对措施

  据报道,由于 AT&T 已经决定分拆华纳传媒并将其与 Discovery 合并,美国媒体行业的其他公司,尤其是规模较小的公司将面临新的压力 ...