Hbase适合存哪些数据?
一、HBase 基本介绍
HBase 是 BigTable 的开源 Java 版本。是建立在 HDFS 之上,提供高可靠性、高性能、列存储、可伸缩、实时读写 NoSql 的数据库系统。
它介于 NoSql 和 RDBMS 之间,仅能通过主键(row key)和主键的 range 来检索数据,仅支持单行事务(可通过 hive 支持来实现多表 join 等复杂操作),主要用来存储结构化和半结构化的松散数据。
Hbase 查询数据功能很简单,不支持 join 等复杂操作,不支持复杂的事务(行级的事务) Hbase 中支持的数据类型:byte[] 与 hadoop 一样,Hbase 目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。
二、HBase 特征简要
1、海量存储
Hbase 适合存储 PB 级别的海量数据,在 PB 级别的数据以及采用廉价 PC 存储的情况下,能在几十到百毫秒内返回数据。这与 Hbase 的极易扩展性息息相关。正式因为 Hbase 良好的扩展性,才为海量数据的存储提供了便利。
2、列式存储
这里的列式存储其实说的是列族存储,Hbase 是根据列族来存储数据的。列族下面可以有非常多的列,列族在创建表的时候就必须指定。
3、极易扩展
Hbase 的扩展性主要体现在两个方面,一个是基于上层处理能力(RegionServer)的扩展,一个是基于存储的扩展(HDFS)。通过横向添加 RegionSever 的机器,进行水平扩展,提升 Hbase 上层的处理能力,提升 Hbsae 服务更多 Region 的能力。备注:RegionServer 的作用是管理 region、承接业务的访问,这个后面会详细的介绍通过横向添加 Datanode 的机器,进行存储层扩容,提升 Hbase 的数据存储能力和提升后端存储的读写能力。
4、高并发
由于目前大部分使用 Hbase 的架构,都是采用的廉价 PC,因此单个 IO 的延迟其实并不小,一般在几十到上百 ms 之间。这里说的高并发,主要是在并发的情况下,Hbase 的单个IO延迟下降并不多。能获得高并发、低延迟的服务。
5、稀疏
稀疏主要是针对 Hbase 列的灵活性,在列族中,你可以指定任意多的列,在列数据为空的情况下,是不会占用存储空间的。
以上就是关于Hbase的知识希望对大家有帮助。

相关推荐HOT
更多>>
数据结构里的逐点插入法、排序二叉树是什么?
一、数据结构里的逐点插入法、排序二叉树逐点插入法三角剖分是一种研究方法。三角剖分≠TIN三角剖分是代数拓扑学里最基本的研究方法。 以曲面为...详情>>
2023-10-16 23:58:04
为什么链表读取慢删除却很快?
一、链表读取慢删除却很快的原因链表是一种线性数据结构,它将数据元素存储在称为节点的独立对象中,并通过指针将这些节点连接在一起。链表在读...详情>>
2023-10-16 23:09:51
递归有什么优缺点?
一、递归的优缺点递归是什么程序调用自身的编程技巧称为递归( recursion)。递归做为一种算法在程序设计语言中广泛应用。一个过程或函数在其定...详情>>
2023-10-16 21:49:27
编写简单电脑应用程序用什么软件和语言?
一、编写简单电脑应用程序用的软件和语言编写电脑应用程序可以使用各种不同的软件和编程语言,具体选择取决于应用程序的功能和需求,以及程序员...详情>>
2023-10-16 21:01:36热门推荐
技术干货






