本文将向您介绍PolarDB for AI在游戏领域用户行为预测的客户最佳实践。
通过用户行为分析帮助某SLG游戏提升出海效率
背景
某游戏公司客户特别重视广告买量和用户运营方面的数据建设和算法优化,百分点位的算法效果提升带来的业务收益便足以覆盖IT资源支出。由于该游戏海外的用户属性较少,该游戏公司利用我们的算法,在多个场景中都投入使用,包括用户是否付费预测、用户付费金额预测、用户流失预测、大R流失预测、大R金额下降预测等等。
解决方案
- 任务:根据1天的用户行为预测未来7天内是否付费。
- 数据:某游戏共10万条数据。其中每个UID对应一条数据,其中付费与非付费的比例为1:90,为了保证有效性,我们对数据进行欠采样。
- 数据特征:
- 序列特征:序列中的元素是由每个事件id映射而成,如果总事件类型有100个,那序列就是0,1,2...,99。不考虑事件对应的其他参数。序列按事件发生的时间升序排列,考虑到有些用户的行为过长,为了防止内存或显存不足,截取最近的3000个行为。
- 非序列特征:近期每日付费金额、近期每日行为数、近期每日与付款有关行为数(比如点击上层)、近期每日付费金额的数量、当前等级、VIP等级、省份等。
- max_epoch=20
- 其他参数根据实际数据调节
- 实验结果:
方法 | 准确率 | 召回率 | Fscore |
lightGBM | 46% | 47% | 46.8% |
BST | 93.0% | 63.7% | 75.6% |
说明
可以看到,BST模型的效果会比传统的机器学习模型要好得多。
2. 用户流失预测
- 任务:我们采用“14测14”的策略,来做用户流失预测。也就是说观察用户14天的行为,来预测未来14天内是否会流失。
- 数据:某游戏共55万条数据。其中每一条样本数据即为一个用户14天的用户行为。标签是该用户接下来的14天内是否流失。训练数据中流失和非流失的比例为1:4。
数据特征:
- 序列特征:用户每个事件的序列,按时间升序排列,考虑到有些用户的行为过长,为了防止内存或显存爆掉,截取最近的3000个行为。
- 非序列特征:近期每日行为数、当前等级、vip等级等...
模型训练:
- max_epoch=20
- 其他参数根据实际数据调节
- 实验结果:(由于付费预测的传统机器学习的效果太差,为了节约成本,这个案例的后续模型没有详细与其他模型对比实验)。
方法 | 准确率 | 召回率 | Fscore |
BST | 69.09% | 76.64% | 72.67% |
- 任务:我们针对月付费>=X万的用户(X为大R用户的门槛金额),采用“14测14”的策略,来做用户流失。也就是说观察用户14天的行为,来预测未来14天内是否会流失。
- 数据:某游戏共4万条数据。其中每一条样本数据即为一个用户14天的用户行为。标签是该用户接下来的14天内是否流失。训练数据中流失和非流失的比例为1:60。我们做了一些欠采样将训练数据中流失何非流失控制的比例在1:3左右来保持样本的平衡性。
数据特征:
- 序列特征:用户每个事件的序列,按时间升序排列,考虑到有些用户的行为过长,为了防止内存或显存爆掉,截取最近的3000个行为。
- 非序列特征:近期每日行为数、当前等级、VIP等级等...。
模型训练:
- max_epoch=20。
- 其他参数根据实际数据调节。
- 实验结果:
方法 | 准确率 | 召回率 | Fscore |
BST | 69.09% | 76.64% | 72.67% |
案例总结
客户通过使用用户行为分析的算法:
该方案已在生产系统中使用。
通过用户行为分析帮助某抽卡类游戏提升效率
背景
某游戏公司希望在其数据平台上增加AI能力,帮助运营更好地分析游戏,了解游戏玩家的行为习惯。为此,希望PolarDB for AI能从多个维度分析用户行为。同时能够与客户的数据仓库打通,方便建立工作流。
解决方案
首先开通HTAP节点,方便和客户的数据仓库(OSS存储介质)打通,能拉取数据到AI节点进行分析。之后从用户是否付费预测、用户流失预测这两个任务着手去处理。本章讲述“用户流失预测”的细节实现。
- 任务:根据7/14/21天的用户行为预测未来7天内是否流失。也就是说观察用户7/14/21天的行为,来预测未来7天内是否会流失。
- 数据:某游戏共100万+条数据。每个uid对应一条数据,其中流失和非流失的比例为1:5左右。
- 数据特征:
- 序列特征:序列中的元素是由每个事件ID映射而成,如果总事件类型有100个,那序列就是0,1,2...,99。不考虑事件对应的其他参数。序列按事件发生的时间升序排列,考虑到有些用户的行为过长,为了防止内存或显存爆掉,截取最近的3000个行为。下表是一些事件说明(已脱敏)。
- 非序列特征:总行为数、每种行为出现次数、每种道具出现次数等。
- max_epoch=20
- 其他参数根据实际数据调节
- 实验结果:
任务 | 子任务 | 模型 | Precsion | Recall | Fscore |
流失预测 | 7测7 | BST | 62.12% | 82.21% | 70.77% |
14测7 | 83.93% | 82.97% | 83.45% | ||
21测7 | 86.8% | 79.64% | 83.07% |
案例总结
客户将PolarDB for AI作为基座AI平台,将数据平台和PolarDB打通,PolarDB for AI成为客户做数据运营的好帮手,帮助客户持续分析游戏用户,评估其付费、流失、LTV等情况,为游戏运营提供数据支持。




