暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
尚硅谷大数据项目之电商数仓(1用户行为采集平台)V5.0.docx
107
31页
1次
2023-09-12
5墨值下载
尚硅谷大数据项目之电商数仓(用户行为采集平台)
—————————————————————————————
尚硅谷大数据
项目之电商数仓(用户行为
采集平台)
(作者:尚硅谷研究院)
版本:
V5.0
1
章 数据仓库概念
数据仓库(
Data Warehouse
),是为企业制定决策,提供数据支持。可以帮助企
改进业务流程、提高产品质量等。
数据仓库的输入数据通常包括:业务数据用户行为数据爬虫数据
业务数据是各行业处理事务程中产生的数据。比如用户在电商网站中登录
下单、支付等过程中,需要和网站后台数据库进行增删改查交互,产生的数据就是业务
业务数据通常存储在
MySQL
Oracle
等数据库中。
用户行为数据:用户在使用产品过程中,通过埋点收集与客户端产品交过程中产
的数据,并发往日志服务器进行保存。比如页面浏览、点击、停留、评论、点赞、收藏
更多 Java –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网
尚硅谷大数据项目之电商数仓(用户行为采集平台)
—————————————————————————————
用户行为数据通常存储在日志文件中。
爬虫数据:通常是通过技术手段获取其他公司网站的数据。不建议同学们这样去做。
2
章 项目需求及架构设计
2.1
项目需求分析
1
)采集平台
1
)用户行为数据采集平台搭建
2
)业务数据采集平台搭建
更多 Java –大数据 –前端 –python 人工智能资料下载,可百度访问:尚硅谷官网
of 31
5墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜