暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
一种通过配置的方式生成标签的方法及系统_CN111159204B_东方金信.pdf
42
14页
0次
2024-02-29
免费下载
(19)中华人共和国国家知识产
(12)发明专
(10)授权公告号
(45)授权公告
(21)请号 202010000755 .7
(22)请日 2020 .01 .02
(65)一申请的已公布文献号
布号 CN 111159204 A
(43)请公布日 2020 .05.15
(73)专利权人 北京东方金信科技有
地址 100062 北京市东城区桥大街15号
嘉禾国信大厦9层
(72)发明人 肖燏 
(74)专利代理机构 北京纪凯知识产权代理有
11245
代理人 孙楠
(51)Int.Cl .
G06F
16/22
(2019 .01)
G06F
16/245
(2019 .01)
G06F
16/25
(2019 .01)
G06Q
30/02
(2012 .01)
(56)文件
CN 108764663 A ,2018 .11.06
CN 109583651 A ,2019 .04.05
CN 109189774 A ,2019 .01.11
CN 109101652 A ,2018 .12.28
WO 2019024060 A1 ,2019 .02.07
审查 袁勤
(54)
置的签的
(57)摘要
发明置的
系统包括户基础多指标
至预先设置的用户衍生指标数据计算模块内
户衍生据计接收户基
多维指标数据进行指标扁平化得到指标宽
用户基础指标宽表指标离散化参数
用户指标宽表中的每一个用户指标进行
散化户基础户标签
位图的形式据相应用户ID查用户基础
指标宽表和用签位获得每个基础
发明业务程的
提高了数据对业务的支持效率。
权利要求书2页 说明书8页 附图3页
CN 111159204 B
2020.08.11
CN 111159204 B
1 .一种通过配置的方式生成标签方法其特征在于包括下步骤
1)础多维指标传输至预先设置的指标数据计算模块内生指
数据计算模块对接收到基础多维指标数据进行指标扁平得到用户指标宽表
2)础指标宽表同指标离散化参数相关指标宽表中的每一
指标进行离散化得到用户基础标签并存储为用户标签位图的形式
3)相应ID询用础指标宽表签位图获得每个
标签
指标扁平化户基础多据转用于户画像分
维度指标数据的过程包括下步骤
1 .1)加载户指标扁平参数判断加载的户基础多指标
有未则进入步骤1 .2)若没有未加载则进入步骤1 .5)其中指标平化参数包
用户指标平化参数的结构指标平化规
1 .2)加载基础多维指标数据表根据指标扁平化参数的结构和指标
平化规则计算各维度实例指标计算规则
1 .3)将各维度指标平化规则基础多维指标数据关联
1 .4)遍历础多维指标数据中的每条记录相关联的基础指标数据形式中的
指标计算规则计算衍生指标
1 .5)并所算出的衍生指标数据集将合并后的衍生指标数据集保存为户指
标宽表。
2 .如权利要求1所述方特征在于础多维指标是指存放在数据仓库中
用户分析的本属性数这些数据包括明细数据及按照不汇总
数据。
3 .如权要求1述方在于骤1 .2)指标扁平则按照指
维度进行分组得到各维度实例指标计算规则
1>[(指aa) (指b
b……)]
2>[(指aa) (指c
c……)]。
4 .如权利要求1所述方其特在于所述步骤1 .3)关联方法为使用户础多
维指标数据中的维度字段与按照指标维度分组后的指标计算规则进行匹配得到的关联后
基础指标数据形
(用户ID(用户基础指标记录指标平化规))
5 .如权要求1述方在于骤1 .4)衍生算包括以
情况
(a)计算则中不需参考指标即可算的
计算公式中所有变量都能从当前基础指标记录中获得直接计算这些衍生指标
(b)对于指标计算规则中需要参考属于同ID的其他基础指标数据才可计算的
生指标在遍历础指标数据集的过程中在遇到所需的基础指标记录时从中获得所
需的基础指标数计算衍生指标中间结果待遍历完成则得到所有ID衍生指标
权 利 要 求 书
1/2
2
CN 111159204 B
2
最终结果。
6 .如权利要求1至5任一项所述方其特在于所述步骤2)指标离散化是将
衍生指标中连续值按照定的规则转化为离散值得过程包括下步骤
2 .1)加载用户指标离散化参数指标宽表
2 .2)户衍生宽表户指标参数用户衍指标离散
得到用户标签数据集
2 .3)户标签集转签位图 户基础标数据中N
标数经过指标平化和指标离散化共计算得到M种不同的标签则为这M种标签各自
创建一个标签位图每个标签位图有N个标志位别对应N个户,对于从1至N的每个标志
如果对应的被打了这个标则将该标志位置位1则将该志位置为0
得到的标签位
7 .如权利要求6所述方其特征在于所述步骤2.2)离散化方法为
2 .2 .1)户衍指标录中指标名称集户指离散数中
指标称集合公共部分
2 .2 .2)于公共部分中的一个衍生指指标离散化参数中和该指标对应
离散化算法和离散化参数对该指标值进行离散化。
8.种通过配置的方式生成标签的系统特征在于包括指标宽表获取模块
标签获取模块和查询模块
户指标户基础多传输置的
据计算模块内衍生指标数据计算模块对接收到的础多维指标数据进行指标
平化得到用户指标宽表
所述础标签获模块将础指标宽表同指标离散化参数相关联
宽表中每一指标行离散化户基础标储为户标签位图的
形式
所述询模块是据相应ID询用础指标宽表标签位图得每
用户基础标签
指标扁平化户基础多据转用于户画像分
维度指标数据的过程包括下步骤
1 .1)加载户指标扁平参数判断加载的户基础多指标
有未则进入步骤1 .2)若没有未加载则进入步骤1 .5)其中指标扁平化参数包
用户指标平化参数的结构指标平化规
1 .2)加载基础多维指标数据表根据户指标扁平化参数的和指标
平化规则计算各维度实例指标计算规则
1 .3)将各维指标平化规础多标数据相关联
1 .4)础多维指标数据中的每条记录相关联的基础指标数据形式中的
指标计算规则计算衍生指标
1 .5)合并算出的衍生指标数据集将合并后的衍生指标数据集保存为户指
标宽表。
权 利 要 求 书
2/2
3
CN 111159204 B
3
of 14
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。