大数据环境下,数据逐渐增多,分布式存储系统应运而生,分布式存储系统是将数据分散存储在多台独立的设备上,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
分布式存储系统已大量应用于各行各业,在使用分布式存储系统的时候我们需要考虑以下5大问题。
一、数据如何分布
一般是将数据等量分布存储,衡量一个数据分布算法好不好就看他是否分得足够均匀,使得所有机器的负载方差足够小。
二、读写过程一致性如何保证
一致性的概率很简单,就是我更新/删除请求返回之后,别人是否能读到我新写的这个值。对于单机系统,这个一致性要达到很简单,大不了是损失一点写的效率。
但是对于分布式系统,这个就复杂了。为了容灾,一份数据肯定有多个副本,那么如何更新这多个副本以及控制读写协议就成了一个大问题。
一般一致性有如下几种定义,除了强一致性以外,其他几种一致性并不冲突,一个系统可以同时满足一种或者几种一致性特点。
1.强一致性
不用多说,就是最严格的一致性要求。任何时候任何用户只要写了,写请求返回的一霎那,所有其他用户都能读到新的值了。
2.会话一致性
这个也很容易理解,能满足很多场景下的需求。在同一个会话当中,用户感受到的是"强一致性"的服务。
3.最终一致性
这个也是提得很多的一个概念,很多系统默认提供这种方式的一致性。即最终系统将达到"强一致性"的状态,但在之前会有一段不确定的时间,系统处于不一致的状态。
4.单调一致性
这个比会话一致性还要弱一点。他只保证一个用户在读到某个数据之后,绝对不会读到比上一次读到的值更老的数据。
三、如何保证横向扩展
横向扩展是指一个集群的服务能力是否可以通过加机器做到线性扩展。
四、如何容灾
分布式系统一个很重要的定位就是要让程序自动来管机器,尽量减少人工参与,否则一个分布式系统的运维成本将不可接受。
容灾问题非常复杂,有很多很成熟的系统也不敢保证自己做得特别好,一般可能会出现机器宕机、网络故障等问题。
五、如何提高性能
分布式系统设计之初就是为了通过堆积机器来增加系统整体性能,所以系统性能也非常重要。性能部分一般会受一致性/容灾等设计的影响。
立尔讯LB4241高密度刀片存储服务器是集分布式文件系统和智慧管理功能于一体的分布式存储产品,专门针对大数据及高并发IO应用场景设计,有效解决大家对单一分布式存储系统的顾虑。
深圳市立尔讯科技有限公司始终专注服务器行业应用定制服务,立尔讯主要提供:存储服务器,塔式服务器,刀片服务器,机架服务器等服务器定制服务和相关产品解决方案,研发能力强劲,多项专利打造定制化服务器应用,致力打造高端服务器云智能应用平台。
服务热线:0755-23104880。
文章来源: 立尔讯科技www.learsun.com一家专注服务器研发、定制的生产厂家,转载请注明出处。
咨询热线:0755-28199376
传真:0755-28199376
邮箱:sales@learsun.com
地址:深圳市龙华区大浪街道高峰社区创艺路66号亿康工业园3楼