关于架构之争,做了这么多年IT,数据类技术架构基本是围绕如何做跨节点的双活/多活负载均衡。其实本质上就三种:
1,A-A(Active-Active)均衡架构,各节点都是可以对外提供负载均衡的访问,包含读写。其一般实现方式就是数据切片打散均衡,单LUN空间切片几十MB,按片轮转工作在每个控制器节点,因为粒度很小,针对整LUN就实现了均衡访问,当然还结合了硬件的前端口共享架构,避免了跨节点路由转发,减少了时延的损耗。A-A架构要实现很难,在这个星球上就那么2~3家厂商真正实现了A-A均衡架构。
2,A-A/A(Acitve-Active/Asymmetric)非对称的AA均衡架构,也就是单LUN粒度对外是都可以负载均衡访问的,内部其实是有工作控制器/节点的概念,如果IO发到非工作节点,内部转发到工作节点来实现跨节点访问,就增加了IO时延。
3,A-P(Active-Passive)即主从架构,对外就只有主节点可访问,从节点是不可访问,或者可读不可写模式,当主节点故障,系统切换到从节点实现高可用。但是主从架构做不到负载均衡。当然可以在配置管理策略上做互为主从,就是分多个片或者分多个LUN,有些LUN工作在控制器节点1,有些LUN工作在控制器节点2,等等以此类推,这样通过人为配置的方式实现了均衡,但是因为LUN粒度较大,本质上还是A-P主从架构。
显而易见,A-A架构是最优的,可以实现多节点负载均衡和高可用切换,节点数量不用多,利用率高,避免资源浪费。类似Oracle RAC集群和存储A-A均衡架构。其次是A-A/A非完全对称的均衡架构,最差的就是A-P主从架构。
而当前数据库的架构都是什么样的呢?基本都是1主多从架构,A-P架构,多副本,分片很大TB级,这个就是咱们很多厂家讲的分布式架构,本质上都是A-P主从多副本架构,技术上是做不到负载均衡的,资源利用率低,1个人干活,N个人看,浪费就很严重,美其名曰“分布式架构”,恰好走了最差的一条路线。
查了下分布式系统的特征:分布性,空间中随机分布:对等性,分布式系统中的节点没有主从之分,所有节点都是对等的;并发性,并发访问共享资源。这不就是存储领域讲的A-A架构吗?存储厂家20年前做的A-A均衡架构跟现在流行讲的分布式架构,技术是同源的,只是换了一个名称,可以认为A-A架构是分布式架构的祖师爷。反而现在分布式架构真正落地的是主从副本根本不符合对等性要求,属于假冒的分布式系统。
而主从多副本架构带来的问题有,跨节点对网络质量要求极高,误码抖动怎么隔离,如果盘故障需要踢出CPU和节点,这是什么逻辑?需要从其它节点网络复制重建副本,影响生产系统性能,重构也慢,而本地盘就那么几块盘,存储IO能力挑战大,备份时间很长,因为IO能力不足和容量不足需要扩CPU,成本反而更高。 所以目前看到下一代数据库架构必然演进到数据库节点+共享数据存储,包含OceanBase,openGauss都会这样演进,多副本干掉,节约资源,就不需要频繁跨节点同步数据,盘的故障交给专业存储来确保可靠,不需要切节点这么严重的故障,数据库节点不带持久化数据,是无状态的,切换就更快。这个才是真正的分布式架构,是数据库架构的终极目标,就是类似Oracle RAC+共享存储架构。
折腾一圈主从副本架构,又走回到真正的A-A架构。所以,不要否定硅谷大佬这套技术架构,专业公司干专业的活儿,继承演进,才是正确的出路,不然就是折腾,然后去解决莫名其妙的问题,超时问题,Hang死问题,时延大,切换慢,备份慢,堆资源运维难,利用率极低等,浪费大量人财物和时间,反而拉大了科技差距。
文章来源:毕须说