1 .一种通过配置的方式生成标签的方法,其特征在于包括以下步骤:
1)用户基础多维指标传输至预先设置的用户衍生指标数据计算模块内,用户衍生指标
数据计算模块对接收到的用户基础多维指标数据进行指标扁平化,得到用户指标宽表;
2)将用户基础指标宽表同指标离散化参数相关联,对用户指标宽表中的每一个用户的
指标进行离散化,得到用户基础标签,并存储为用户标签位图的形式;
3)用户根据相应用户ID查询用户基础指标宽表和用户标签位图,获得每个用户的基础
标签;
所述指标扁平化是指将用户基础多维指标数据转化为能够用于用户画像分析的单一
维度指标数据的过程,包括以下步骤:
1 .1)加载用户指标扁平化参数,并判断是否有未加载的用户基础多维指标数据表,若
有未加载,则进入步骤1 .2),若没有未加载,则进入步骤1 .5);其中,用户指标扁平化参数包
括用户指标扁平化参数的结构和指标扁平化规则;
1 .2)继续加载用户基础多维指标数据表,并根据用户指标扁平化参数的结构和指标扁
平化规则计算各维度实例的指标计算规则;
1 .3)将各维度的指标扁平化规则同用户基础多维指标数据相关联;
1 .4)遍历用户基础多维指标数据中的每条记录,根据相关联的基础指标数据形式中的
指标计算规则计算衍生指标;
1 .5)合并所有已计算出的衍生指标数据集,将合并后的衍生指标数据集保存为用户指
标宽表。
2 .如权利要求1所述方法,其特征在于:所述用户基础多维指标是指存放在数据仓库中
的可用于用户分析的用户基本属性数据;这些数据包括明细数据以及按照不同维度的汇总
数据。
3 .如权利要求1所述方法,其特征在于:所述步骤1 .2)中,将指标扁平化规则按照指标
维度进行分组,得到各维度实例的指标计算规则:
指标维度1—>[(指标字段名称a,指标计算方式a) ,(指标字段名称b,指标计算方式
b,……)];
指标维度2—>[(指标字段名称a,指标计算方式a) ,(指标字段名称c,指标计算方式
c,……)]。
4 .如权利要求1所述方法,其特征在于:所述步骤1 .3)中,关联方法为:使用用户基础多
维指标数据中的维度字段与按照指标维度分组后的指标计算规则进行匹配,得到的关联后
的基础指标数据形式为:
(用户ID,(用户基础指标记录,指标扁平化规则))。
5 .如权利要求1所述方法,其特征在于:所述步骤1 .4)中,衍生指标计算包括以下两种
情况:
(a)对于指标计算规则中不需要参考其他基础指标数据即可进行计算的衍生指标,即
计算公式中的所有变量都能从当前基础指标记录中获得,则直接计算这些衍生指标;
(b)对于指标计算规则中需要参考属于同一用户ID的其他基础指标数据才可计算的衍
生指标,在遍历用户基础指标数据集的过程中,在遇到所需的基础指标记录时,从中获得所
需的基础指标数据,计算衍生指标中间结果,待遍历完成,则得到所有用户ID的衍生指标的
权 利 要 求 书
1/2 页
2
相关文档
评论