1362| 9
|
HBase 数据文件在HDFS上的存储 |
在HDFS 上面最不明确的事情之一就是数据的冗余。它完全是自动进行的,因为无法得知其中详细的信息,我们需要做的就是相信它。HBase 完全相信HDFS存储数据的安全性和完整性,并将数据文件交给HDFS 存储。正是因为HDFS 的数据冗余方式对于HBase 来说是完全透明的,产生了一个问题:HBase 的效率会受到多大的影响?说的简单一点,当HBase 需要存取数据时,如何保证有一份冗余的数据块离自己最近?
当我们对HBase 做一次MapReduce 的扫描操作时,这个问题尤其显现出来。所有的RegionServer 都在从HDFS 上面读取数据,理想的状况当然是每个 RegionServer 要读取的数据都离自己很近。这个问题就牵扯到HBase 的数据文件是如何在HDFS 上面存储的。
购买主题
本主题需向作者支付 1 金币 才能浏览
| |
发表于 2015-5-5 21:40:24
|
显示全部楼层
| ||
发表于 2015-7-1 22:23:14
|
显示全部楼层
| ||
发表于 2015-7-2 22:19:59
|
显示全部楼层
| ||
发表于 2015-11-23 09:44:18
|
显示全部楼层
| ||
发表于 2015-12-2 08:13:56
|
显示全部楼层
| ||
发表于 2017-9-23 20:46:49
|
显示全部楼层
| ||
发表于 2018-5-20 09:04:11
|
显示全部楼层
| ||
发表于 2018-9-12 08:55:24
|
显示全部楼层
| ||