prince的文章

三十、保留已删除的HBase单元格

保留已删除的单元格 默认情况下,删除标记会向后扩展到开始时间。因此,即使 Get 或 Scan 操作指示放置删除标记之前的时间范围,Get 或 Scan 操作也不会看到已删除的单元格(行或列)。 ColumnFamilies 可以选择保留已...

赞(0)princeprinceHBase 教程 阅读(257)

二十九、HBase生存时间(TTL)

生存时间(TTL) ColumnFamilies 可以以秒为单位来设置 TTL(Time To Live)长度,一旦达到到期时间,HBase 将自动删除行。这适用于所有版本的行 – 即使是当前版本。在该 HBase 行的中编码的TTL时间以...

赞(0)princeprinceHBase 教程 阅读(235)

二十八、HBase支持的数据类型

数据类型支持 HBase 通过 Put 操作和 Result 操作支持 “byte-in / bytes-out” 接口,所以任何可以转换为字节数组的内容都可以作为一个值存储。输入可以是字符串、数字、复杂对象、甚至可以是图像,只要它们可以呈...

赞(0)princeprinceHBase 教程 阅读(235)

二十七、HBase版本数量

HBase版本数量 HBase最大版本数量 HBase 通过 HColumnDescriptor 为每个列族配置要存储的最大行数版本。最大版本的默认值为1。这是一个重要的参数,因为如数据模型部分所述,HBase 也没有覆盖行的值,而是按时间...

赞(0)princeprinceHBase 教程 阅读(210)

二十六、Rowkey(行键)设计

本节介绍了 HBase 中的行键(Rowkey)设计。 Hotspotting # HBase 中的行按行键按顺序排序。这种设计优化了扫描(scan),允许您将相关的行或彼此靠近的行一起读取。但是,设计不佳的行键是 hotspotting ...

赞(0)princeprinceHBase 教程 阅读(258)

二十五、HBase列族数量

HBase列族数量 HBase 目前对于两列族或三列族以上的任何项目都不太合适,因此请将模式中的列族数量保持在较低水平。目前,flushing 和 compactions 是按照每个区域进行的,所以如果一个列族承载大量数据带来的 flush...

赞(0)princeprinceHBase 教程 阅读(237)

二十四、HBase表格模式经验法则

HBase表格模式经验法则 在HBase 中有许多不同的数据集,具有不同的访问模式和服务级别期望。因此,这些经验法则只是一个概述。 目标区域的大小介于10到50 GB之间。 目的是让单元格不超过10 MB,如果使用 mob,则为50 MB ...

赞(0)princeprinceHBase 教程 阅读(213)