所以对于块大小的设置既不能太大,也不能太小,太大会使得传输时间加长,程序在处
理这块数据时会变得非常慢,如果文件块的大小太小的话会增加每一个块的寻址时间。
所以文件块的大小设置取决于磁盘的传输速率。
3
)
HDFS
分块目的
HDFS
中分块可以减少后续中
MapReduce
程序执行时等待文件的读取时间,
HDFS
支持大文件存储,如果文件过大
10G
不分块在读取时处理数据时就会大量的将时间耗
费在读取文件中,分块可以配合
MapReduce
程序的切片操作,减少程序的等待时间。
二、
HDFS
小文件问题处理方案
评论