暂无图片
sparksql怎么优化?
我来答
分享
暂无图片 匿名用户
sparksql怎么优化?

6.5亿单表count都要7分钟

我来答
添加附件
收藏
分享
问题补充
1条回答
默认
最新
cdwas

可以在处理数据之前应用筛选、过滤和聚合等预处理步骤,以减少要处理的数据量。这样可以降低资源消耗和提高性能。

暂无图片 评论
暂无图片 有用 0
打赏 0
回答交流
Markdown


请输入正文
提交
相关推荐
电脑坏了,如何从mysql的安装目录拿出sql脚本?
回答 2
已采纳
电脑坏了是啥程度?开不了机器的话可以进安全模式或者pe系统拷贝mysql安装目录和data目录到其他机器上恢复一下
oracle 表DML审计触发器
回答 1
对业务表DML时,到底报什么错?另外,对于insert,应该只有:new值,而无:old值,所以应该写成:insertintoAUDITDMLTABVALUES (:NEW.ID,null,
集群中有一台服务器损坏卸载失败
回答 1
(1)修改/var/lib/gcware/DATASERVER文件,去掉损坏节点IP信息;(2)修改/etc/corosync/corosync.conf文件,去掉损坏节点IP信息。
服务器里的数据库如何外网连接?
回答 2
已采纳
服务器得外网可以访问到.....
mysql自查询中有主键使用in和主键使用=的区别
回答 3
外表和子查询的表都是t所以我们从语句中无法看出是关联子查询还是非关联子查询
用Servlet写的接口,想把实体类对象转成json格式发送出去,在哪可以下载json.jar包?
回答 1
已采纳
你说的是这个?https://sourceforge.net/projects/jsonlib/
SQL的三段分拆法?
回答 1
已采纳
如果要优化的SQL很长,可以将SQL拆分为三段,这要就能快速判断SQL在写法上是否容易产生性能问题。下面就是SQL三段拆分方法。select....第一段....from....第二段....wher
达梦数据库sqllog解析出来的表格中,执行时间的单位是毫秒吗?
回答 1
在达梦数据库的SQLLOG解析出来的表格中,执行时间的单位是微秒(μs),而不是毫秒(ms)。
一个亿的数据,做了分区 然后释放空间 我只知道truncate 有更好的方法吗?
回答 1
truncatepartition可以释放。还有droppartition
达梦数据库索引无效了要怎么重建索引?
回答 1
索引都已经无效了,那删除掉然后重新创建就好了。所有的数据库都可以这样操作,部分数据库只能这样操作。