暂无图片
hive、spark一般处理的是什么数据?
我来答
分享
Jiang
2022-01-13
hive、spark一般处理的是什么数据?

和传统数据库(如oracle)处理的数据对比一下

我来答
添加附件
收藏
分享
问题补充
1条回答
默认
最新
沈克伟

hive数据来源有很多很多,比如业务数据经过初步处理(数据清洗、结构化)后存入Hive,为以后的报表分析、实时计算做好数据准备。也就是说,具有业务意义的,需要长期保存供后续处理和使用的都可以存入Hive中。这也体现出Hive作为数据仓库的一样,既为仓库,也就是储备,以备不时之需。

而spark它的计算对象都是针对同一个数据集(Dataset)来说的,可以对一个数据集反复操作,这也正发挥了内存速度上的优势.

一句话概述:以Hadoop作为分布式存储和计算的基石,由此演变出了支持SQL查询的离线分析的数据仓库Hive,以及基于内存计算的Spark.

暂无图片 评论
暂无图片 有用 1
打赏 0
暂无图片
回答交流
Markdown


请输入正文
提交
相关推荐
oracle到postgresql同步数据有工具推荐吗?
回答 1
已采纳
记得有OGG,也有 Ora2Pg,可以试试。
请问下PGA假如最大为10G,这10G是所有session总和加起来不能大于10G还是每一个session不能大于10G,所有session加起来可以。
回答 1
已采纳
是总和。一般来说一个会话消耗大约5M。你想啊,如果一个会话就10G。两个不就是20G。这还怎么用啊?
AWR分析报告问题求助:应用表示最近查询修改慢,分析报告除过2条业务相关sql存在性能问题,感觉其他没什么啥大问题
回答 4
大师相关报告已添加附件
Oracle创建PDB密码怎么包含&符号?
回答 1
已采纳
SQL>SetdefineOFF;SQL>createusertest2identifiedby“&test2”;Usercreated.SQL>grantconnectto
Oracle RMAN 中list能根据时间自动排序吗?
回答 1
已采纳
listbackupsetsummary;
oracle ACL安全访问列表
回答 3
这个就是ACL没进行配置,可以参考我的这几篇文章https://www.darkathena.top/archives/oracleaclhttps://www.darkathena.top/arch
Oracle有张表才几十条数据,但空间占了500多M,怎么解决?
回答 4
delete不释放空间,oraclemysqlpg都这样,其他的关系型数据库也这样。所以一般都是分区处理过期数据归档。碎片太多就是要整理了。
11g rac一个数据库实例未启动
回答 4
已采纳
这是没正常启动吧
Oracle数据库是怎么防止“SQL注入”的?
回答 1
已采纳
所谓“SQL注入”就是通过把SQL命令插入到Web表单接交或输入域名或页面请求的查询字符串,最终达到欺骗服务器执行恶意的SQL命令。如果开发人员接受来自最终用户的输入,把这个输入拼接到查询中,然后编译
oracle EBS打JWS补丁,是打在APP的服务器上还是DB的服务器上?
回答 1
打在应用服务器上