近日,第32届国际计算机学会信息与知识管理大会(The 32rd ACM International Conference on Information and Knowledge Management,CIKM 2023)公布论文接收结果,蚂蚁图计算团队图学习论文《FAF: A Risk Detection Framework on Industry-Scale Graphs》入选。
ACM CIKM 由美国计算机协会(ACM)和信息检索专业委员会(SIGIR)发起,是信息检索和数据挖掘领域顶级学术会议之一。CIKM对论文的录取代表了研究工作在信息检索、知识管理和数据挖掘等领域的重要性和创新性。
本次入选的蚂蚁图学习论文,有哪些前沿研究值得关注呢?
论文概述
存在一些欺诈者,包括地下放贷者和专业黑客,他们教唆借款人如何运用黑客技术来规避企业的风险控制系统。尽管风险控制系统在实际应用中极大地减少了商家的欺诈损失,但仍有相当数量的中介相关欺诈案件幸免于被揭穿。我们发现超过30%的欺诈案件直接涉及恶意中介。因此,我们提出了一种“反共犯欺诈检测框架”,称为“FAF(Fraud-Abettor-Fraud)”,专门设计用于在行业范围内打击中介相关欺诈,一系列在FAF框架下的算法优于常用的风险检测方法,并满足实际业务需求。在本文中,我们以支付宝App中的芝麻租物 (Zhima Credit Renting)的风险管理应用程序为真实案例(该应用程序已经部署了FAF超过1年),以展示FAF框架与现有方法相比的优越性。
背景挑战
首先,逾期付款的可能性不一定经过显式的边传递到一跳邻居。我们对多种边缘类型进行的分析表明,它们中没有一种存在于欺诈者之间,而其中四种在中介和欺诈者之间。这个发现非常重要,因为它推翻了图学习对欺诈进行建模的传统认知。因此,与其他欺诈检测图算法(如GraphRAD)不同,FAF并不假设欺诈者在芝麻租物中共享密集的联系。我们将这些中介称为“Abettor”,因为他们中的大多数协助别人进行租赁不当行为。令人意外的是,欺诈案件的一跳邻居不太可能是欺诈。逾期的可能性通过两跳连接传播,但跳过了中间的Abettor,他们不一定是芝麻租物的用户。这意味着像PageRank这样赋予一跳邻居高权重的算法,以及只聚合一跳邻居信息的图神经网络(GNN),在检测芝麻租物平台上的中介相关欺诈时可能无法起作用。
第二个挑战是“Abettor标签和特征的不足”。Abettor检测是该系统的重要组成部分,因为这些中介经常在促进欺诈活动中发挥关键作用。然而,缺乏足够的标签和特征阻碍了系统进行有效的监督学习。这使得使用传统风险管理系统中常用的特征来识别它们变得具有挑战性。因此,FAF算法必须依赖替代方法来识别这些中介。
解决方法
虽然缺少连环Abettor本身的特征,但他们为了从非法活动中获利,Abettor将扩大他们的教唆事件。因此,基于从原始数据中提取的历史交互子图,我们计算基于一跳的统计量,并推断出高可能性的Abettor(中介)。
我们开发了一个半监督中介拓展模块,从统计型中介扩展出一个Abettor池,而不需要知道确切的相关Abettor的特征或标签。
一旦我们得到了扩展的Abettor集合,我们可以将它们用作种子节点,找Abettor的一跳邻居,喂给GNN进行欺诈预测。
总结
通过在识别欺诈之前识别Abettor,开发半监督模块并采用分布式图处理和学习,我们可以有效地检测和防止Abettor相关的欺诈,并增强我们的整体欺诈检测能力。
👉TuGraph图学习框架现已开源,欢迎访问GitHub使用: https://github.com/tugraph-family/tugraph-db
点击“阅读原文”,下载论文~

欢迎关注 TuGraph 代码仓库
· https://github.com/tugraph-family/tugraph-db
· https://github.com/tugraph-family/tugraph-analytics
· https://github.com/TuGraph-family/TuGraph-AntGraphLearning