暂无图片
什么是数据分析步骤中的处理数据?
我来答
分享
暂无图片 匿名用户
什么是数据分析步骤中的处理数据?

什么是数据分析步骤中的处理数据?

我来答
添加附件
收藏
分享
问题补充
1条回答
默认
最新
数据库小学生

处理数据的意思就是提取特征数据。在真实的工作场景中,除了数据格式不统一,数据的内容往往也参差不齐,很少能直接拿到 一份干净又完整的数据。比如有些样本数据会缺失部分特征、有些数据是明显的异常数据。

所以在开始分析之前,还需要 对数据做进一步的处理,比如用默认值填充缺失的值、过滤掉明显重复的或者异常的数据,这个步骤一般也叫“特征工 程”,需要耗费比较长的时间才能把数据整理好。

暂无图片 评论
暂无图片 有用 1
打赏 0
回答交流
Markdown


请输入正文
提交
相关推荐
PolarDB通过pg_dump备份后用psql -f恢复备份数据是覆盖恢复吗
回答 1
不是
传统数据库的部署方式是什么?
回答 1
有主库、备库和Standby,主备库之间通过流复制进行同步。节点扩展时,需要将数据全部进行复制,速度极慢。另外,主备之间复制一般使用异步复制,可能存在数据丢失。主备之间存在延迟,因此可用性较差。此外,
PolarDB-X在部署完之后,怎么指定他的NodePort?
回答 1
https://doc.polardbx.com/operator/ops/connection/3connectoutsidecluster.html 参考这个通过NodePort访问
polar_basebackup 备份工具是什么?和polardb是什么关系?
回答 1
可以参考下《PolarDBforPostgreSQL开源必读手册》电子书,点击https://developer.aliyun.com/ebook/download/7822可下载完整版
PolarDB MySQL慢SQ
回答 1
PolarDBX1.0将执行时间超过1秒的SQL定义为慢SQL。PolarDBX1.0中的慢SQL分为两种:逻辑慢SQL和物理慢SQL。在PolarDBX1.0中,一条SQL语句会在PolarDBX1
PolarDB是不支持5.7了吗?
回答 1
支持的。PolarDBX1.0新版分布式事务要求MySQL版本≥5.7,PolarDBX1.0版本≥5.3.4。如果您的MySQL或PolarDBX1.0版本不满足上述要求,建议您升级到新版
PolarDB-X支持只分表不分库吗?
回答 1
PolarDBX中的水平拆分包含了分库和分表两个层次。若您在创建数据库时,选择拆分模式为水平拆分,则PolarDBX为默认为每个私有定制RDS实例创建8个物理分库,每个物理分库上可以创建一个或多个物理
PG是什么结构的?
回答 1
PG本身是多进程的架构。
参数 --length 的最大值是否为20480,即20T,如果PFS需要超过20T,有什么解决方案?
回答 1
一般不联系违反规则
PolarDB-X有些表,读取的时候就需要所有分片都读取的场合,这样的表一般怎么处理好?
回答 1
你这是建表语句,就正常用呗
问题信息
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~