Golang中国

纵观数据库发展的几十年,从网状数据库、层次数据库到 RDBMS 数据库,在最近几年的 NewSQL 的兴起,加上开源的运动,上云的特性,可以说是日新月异。在 20 世纪 80 年代后,大部分的业务确定了使用 RDBMS 数据为存储基础。随着互联网的发展,数据量的增大,慢慢 RDBMS 数据库撑不住,就出现了读写分离策略。随着压力增加,Master 撑不住,这时就要分库了,需要借助中间层。随着数据量的进一步增加,一个表的记录越来越大,查询就变得很慢,于是又得搞分表…

免费申请云数据库 HBase: https://cn.aliyun.com/product/hbase
在不同的场景下,就出现各自优秀的分布式数据库,比如在文档型存储下的 MongoDB,KV 类型的 Redis,到本文介绍的列族类型的 HBase。

为什么要上云,需要了解到 HBase 本身比较复杂,这涉及到分布式、数据存储、响应延迟,索引等一些分布式、数据库的知识,对于运维好这个复杂系统还是有一定的难度;要有很好的使用姿势,虽然 API 比较简单,但是各种组合情况下,畅玩好 HBase 还是需要一定的功力;上云是趋势,自己去基于 ECS 建设又不太了解云环境下,怎么正确部署 HBase,怎么跟 OSS 等云上组件配合。

为此,我们提供云 HBase 加上专家服务解决以上 3 个问题 HBase 在阿里集团使用了 6 年之久,已经在 HBase 的性能、运维等积累了大量的经验,我们希望把这些回馈给客户,例如:单条低字节高频写入情况就比社区版本高出 30%+的性能。

已提供的价值点有:

高可靠:至少三个副本,数据可靠性 9 个 9 高可用:Master 节点强制 HA 机制,出现问题后直接切换 易运维:增加节点、修改配置、重启、健康大盘、监控报警 高性能:比开源性能大幅度提升 30%+ 低成本:后续本地盘、云盘、OSS 分级别存储

技术架构

从技术架构层面看,大致如下: 基础资源层: 底层使用了 ECS 及本地磁盘的架构,保证在低成本的同时又具备高性能 基础软件层: 使用了 Ali-JDK 及 Ali-Linux,背后是源码级团队维护 HBase 内核层: 与阿里集团一致的版本,阿里内部所有的性能优化、功能增强在公共云的客户都可以享受到。 这些包括但不限于:提升读写性能、增强稳定性、降低磁盘等 运维平台方面: 逐步完善,后续会包括 监控报警、配置管理、健康诊断等,易于运维的功能

目前支持两种访问网络类型,第一种是经典网络;第二种是 VPC 网络。区别就是 VPC 再加了一层网络隔离。

使用场景

HBase 作为默认的大数据时代的存储,基本解决以下三大类的场景: 平台类,存放是平台的产品,就是其它软件的存储,比如目前很就行的 Kylin,阿里内部的日志同步工具 TT,图组件 Titan 等。此类存放的往往平台的数据,有时候往往是无业务含义的。作为平台的底层存储使用。 用户行为类,此类主要是面向各个业务系统。这里的用户不仅仅指的人,也包括物,比如物联网。在阿里主要还是人产生的数据,比如:淘宝收藏夹、交易数据、旺旺聊天记录等等。这里使用比较直接,就直接存放 HBase,再读取。难度就是需要支持千万级别的并发写访问及读取,需要解决服务质量的问题。 报表类的需求,比如报表、大屏等,如阿里巴巴的天猫双十一大屏。

免费申请云数据库 HBase: https://cn.aliyun.com/product/hbase

0 回复
需要 登录 后方可回复, 如果你还没有账号你可以 注册 一个帐号。