1
,档案表(
mv_tmnl_sp_info
)存储
将档案表(
mv_tmnl_sp_info
)中的电表
id
按照指定值(例如:
10
)取模后分组并对
每 组 的 值 进 行 排 序 形 成 一 个 有 序 文 件 , 上 传 到
HDFS
上 , 文 件 路 径 可 以
是
/smallTable/mv_tmnl_sp_info/0/data
/smallTable/mv_tmnl_sp_info/1/data
/smallTable/mv_tmnl_sp_info/2/data
/smallTable/mv_tmnl_sp_info/3/data
/smallTable/mv_tmnl_sp_info/4/data
/smallTable/mv_tmnl_sp_info/5/data
/smallTable/mv_tmnl_sp_info/6/data
/smallTable/mv_tmnl_sp_info/7/data
/smallTable/mv_tmnl_sp_info/8/data
/smallTable/mv_tmnl_sp_info/9/data
2
,原始数据存储
将原始表中的数据根据电表
id
按照指定值(例如:
10
)取模后分组并对每组的值进行排
序形成一个或多个有序文件,上传到
HDFS
上,文件路径可以是
1, E_MP_DAY_READ
表
/bigTable/E_MP_DAY_READ/20121017/0/data0.data
/bigTable/E_MP_DAY_READ/20121017/0/data1.data
...
/bigTable/E_MP_DAY_READ/20121017/1/data0.data
/bigTable/E_MP_DAY_READ/20121017/1/data1.data
...
/bigTable/E_MP_DAY_READ/20121017/9/data0.data
/bigTable/E_MP_DAY_READ/20121017/9/data1.data
文件路径:
/bigTable/E_MP_DAY_READ/
日期
/
模值
/
数据文件名
2, E_MP_POWER_CURVE
表
/bigTable/E_MP_POWER_CURVE/20121017/0/030000_040000.data
/bigTable/E_MP_POWER_CURVE/20121017/0/053000_072000.data
...
/bigTable/E_MP_POWER_CURVE/20121017/1/020000_043030.data
/bigTable/E_MP_POWER_CURVE/20121017/1/030000_042000.data
...
/bigTable/E_MP_POWER_CURVE/20121017/9/130100_145900.data
/bigTable/E_MP_POWER_CURVE/20121017/9/130300_152000.data
文件路径:
/bigTable/ E_MP_POWER_CURVE /
日期
/
模值
/
文件中的最小时间
_
文件中的最大时间
.data
3
,查询
对于第一个测试用例,因为查询条件是“某天”,这在
hdfs
路径中已经有了,所以直接从
hdfs
上读原始数据文件(有序)与档案表(
mv_tmnl_sp_info
)文件(有序)进行匹配就行
了。
评论