(原标题:Facebook发布新AI模型,用机器学习来辨认假账号)
汹涌新闻记者 王心馨
交际网站上的假账号,一般会被诈骗者运用来传达垃圾邮件、网络垂钓链接或歹意软件。无论是渠道上的无辜用户仍是渠道自身,这类假账户都极端风险。
为了处理这样的一个问题,Facebook正式发布了能冲击假账号的东西——DEC,也称为深度实体分类体系(Deep Entity Classification)。这是一套运用机器学习来辨认假账号的东西。
据Facebook泄漏,这套东西不只会评价可疑帐户的行为,还会评价账号的周边信息,包含可疑帐户的交互帐户和阅读页面行为。Facebook称,运用这套东西后,垃圾邮件和诈骗账号的数量减少了27%。
从Facebook揭露的详细信息看,DEC能区别两类假账户。一类是过错分类的账号,这些账号的个人资料被包装成了商业信息页面。要处理这类假账号,相对简略,只需替换个人资料信息就能够。第二类是违法账号,这些账号触及诈骗、垃圾邮件和违反渠道服务条款等行为。关于这类账号处理起来愈加扎手,渠道需求赶快删去,又不能悉数删去相关账号,不然可能会误删实在账号。
那么,整套体系是怎么做到的?
DEC的首要方法是经过剖析用户的衔接形式来区别真假用户。这些形式被称为“深层特征”,这中心还包含用户朋友的均匀年龄或性别散布。Facebook运用了20000种深层特征来描写用户画像,经过这些深层特征,体系会了解每个用户的行为,也让攻击者难以改动战略来逃避侦办。
深层特征的提取,首要运用的是很多低精度机器生成的标签。这些标签由混合规矩和其他机器学习模型生成,可拿来判别用户是真仍是假。接着,将这些标签用来练习神经网络,再加上一小批高精度的手艺符号数据对整个模型进行微调,这部分数据是由世界各地了解本地文明的人手艺生成的。
终究体系能够辨认出四种类型的虚伪账号:不能代表个人的不合法帐户,诈骗者现已接收的实在账户,重复发送创收垃圾邮件的账户,以及操作账号走漏个人隐私信息的账户。
2019年,Facebook每个季度均匀删去20亿个假造账号。自从运用DEC以来,Facebook称,渠道上假账户的数量保持在每月活泼用户的5%左右。但即便是这样,状况也不达观,在每月有25亿活泼用户的状况下,整个渠道仍有1.25亿个假造帐户。
跟着2020年美国总统大选接近,Facebook此刻发布DEC体系的详细信息,好像有些偶然。此前,Facebook曾被责备放纵第三方,走漏用户数据控制推举。“这仅仅发现一般的违反法律规定的行为, Facebook并不专门针对任何推举主题。” Facebook社区诚信团队工程司理Daniel Bernhardt在承受媒体采访时称。