专家谈中小企业存储系统设计
【 服务器学院】
编者按:在中小企业的IT基础设施建设中,存储系统设计是最为复杂的工作之一:这里不仅有硬件的选型,有软件的配合,还有存储策略的制定,如果再与中小企业在IT人才和资金上的不足交织在一起,给中小企业的信息 安全带来的挑战更为严峻。作为中小企业IT系统建设解决方案系列的第一期(后续还会有电子商务与ERP、企业无线解决方案等),我们首先锁定在存储系统设计这个话题,希望能对您的工作有所帮助。
中小企业数量众多,IT预算有限,技术力量与大企业相比也相对薄弱,在企业信息化中,对存储方案的设计需要更加注重实用性、注重投入产出比。企业需根据自身的应用类型合理选择不同档次、不同容量的存储。本文通过分析中小企业在存储方面需求的特点,介绍了当前可选的存储技术,给出了中小企业存储解决方案的一些方法和思路。
存储容量计算
存储容量估算是存储系统设计的第一步,只有对自己的存储需求有了了解才能选择合适的存储架构和存储设备。中小企业行业背景各异,存储的需求也各不相同,典型的应用主要有: 流媒体、文件服务、Web服务、邮件服务等。不同的应用对存储系统的需求是不同的。存储系统的设计应根据应用的不同进行灵活的选型、配置和设计。
在进行磁盘容量计算的时候,必须将各方面因素考虑在内,并在规划期间内给出一个合理的扩展空间。
操作系统、数据库软件、应用软件一般保存到主机自带的硬盘中,其存储容量的计算可参考应用软件安装手册和实际情况进行。一般情况下,可以按照以下方式进行初始配置的估算,在后期再根据实际情况做进一步的修正:
● 操作系统按照1GB估算;
● 数据库软件按照1GB估算;
●临时文件空间按照200MB~500MB估算;
● 用户文件空间按照每用户50MB估算;
● 数据库交换数据空间按照2GB估算;
● 操作系统日志文件按照500MB估算。
数据库系统中,数据量的计算还要考虑数据库(主要是索引)的开销,索引大小和数据表之间的关系变化比较大,小的索引占用10%的数据表本身的空间,多重索引、多个索引存储容量加起来几乎和整个数据表空间一样。因此需要针对不同表空间和索引的不同情况判断。一般情况下,可以按照以下方式进行初始配置的估算,然后再根据实际情况做进一步的修正:
简单索引:数据容量×110%
复杂索引:数据容量×200%
在存储容量的计算中,还要考虑独立磁盘冗余阵列(RAID) 的影响。磁盘阵列中针对不同的应用会选择使用不同的技术,即RAID Level,而每一Level代表一种技术,目前常用的标准是RAID 0、RAID1、RAID01、RAID10和RAID 5。
存储系统的整合
众多周知,目前主要有三种存储技术,分别是DAS(直接连接存储)、NAS(网络连接存储)和SAN(存储区域网)。有关这些技术的优缺点,本文不再赘述。这里提醒读者注意的是存储系统的可扩展性。中小企业IT系统发展到一定的阶段,系统数量逐渐增多,存储管理和维护的工作量剧增,就涉及到存储的整合到SAN的问题。
SAN比较适合大数据量的存储,这是因为:
1.可利用存储设备的大容量Cache提高磁盘阵列的性能,现代存储阵列可以配置大容量Cache,提升性能。
2.多平台之间的数据共享。SAN存储可以支持多主机平台之间的数据共享,可以配置整个SAN统一作为备用磁盘。在SAN中,当任何一台主机的磁盘需要扩容时候,直接将磁盘空间调拨给那个主机,业务不中断,进行RAID等操作不停机,避免DAS下每台主机配置过多备用磁盘而造成浪费。
3.轻松有效的管理。SAN存储有着图形化界面管理,扩容升级、调度都很方便。
4.更高的可用性。SAN存储一般所有结构都是冗余的,配置内置电源,大大提高可靠性,其可用性是随着存储设备的硬件结构的全冗余而大大提高。
中小型企业选择SAN的主要原因之一是服务器和存储的结合。根据AMI的报告,在中型企业中减少服务器的数量,将节省5到10万美元的许可证费用和运行开支。SAN的另一个主要优势在于其大大减少或消除了停工期,尽管很多中小型企业难以估计停工期的损失。据AMI的预计,在今后几年里,中小型企业SAN市场将以43%的年复合增长率(CAGR)增长,而企业SAN市场的增长率将为5%。中小型企业SAN市场的CAGR,加上预计将会剧增的中小型企业所要处理的数据,以及向可扩展的存储基础设施转移的需要,意味着SAN面临着巨大的潜在机遇。为了完全满足中小型企业市场的需求,SAN厂商正在克服以下困难:包括向市场宣传SAN的优势、展示从DAS向SAN体系迁移在财务和技术上的益处、简化SAN的实施过程以及与中小型企业合作以确定FC技术适用的应用。
这里还要注意,存储系统只是整个IT系统的一部分,在设计存储解决方案中,还需要了解从主机到磁盘的存储数据通道,在通道的各个环节保持一致的带宽,避免出现“木桶效应”。存储通道需要考虑如下设备的带宽:服务器总线、内存带宽(DMA)、I/O带宽、HBA卡带宽、SAN Switch、智能存储设备的Cache、存储内部总线等。
数据备份方式的选择
目前数据备份主要方式有:LAN 备份、LAN Free备份和SAN Server-Free备份三种。LAN 备份针对所有存储类型都可以使用, LAN Free备份和SAN Server-Free备份只能针对SAN架构的存储。
基于LAN备份 传统备份需要在每台主机上安装磁带机备份本机系统,采用LAN备份策略,在数据量不是很大时候,可采用集中备份。一台中央备份服务器将会安装在 LAN 中,然后将应用服务器和工作站配置为备份服务器的客户端。中央备份服务器接受运行在客户机上的备份代理程序的请求,将数据通过 LAN 传递到它所管理的、与其连接的本地磁带机资源上。这一方式提供了一种集中的、易于管理的备份方案,并通过在网络中共享磁带机资源提高了效率。
LAN-Free备份 由于数据通过LAN传播,当需要备份的数据量较大,备份时间窗口紧张时,网络容易发生堵塞。在SAN环境下,可采用存储网络的LAN-Free备份,需要备份的服务器通过SAN连接到磁带机上,在LAN-Free备份客户端软件的触发下,读取需要备份的数据,通过SAN备份到共享的磁带机。这种独立网络不仅可以使 LAN 流量得以转移,而且它的运转所需的 CPU 资源低于 LAN 方式,这是因为光纤通道连接不需要经过服务器的 TCP/IP 栈,而且某些层的错误检查可以由光纤通道内部的硬件完成。在许多解决方案中需要一台主机来管理共享的存储设备以及用于查找和恢复数据的备份数据库。
SAN Server-Free备份 LAN Free备份对需要占用备份主机的CPU资源,如果备份过程能够在SAN内部完成,而大量数据流无需流过服务器,则可以极大降低备份操作对生产系统的影响。SAN Server-Free备份就是这样的技术。
目前主流的备份软件,如IBM Tivoli 、Veritas,均支持上述三种备份方案。三种方案中,LAN备份数据量最小,对服务器资源占用最多,成本最低;LAN free备份数据量大一些,对服务器资源占用小一些,成本高一些;SAN Server-free备份方案能够在短时间备份大量数据,对服务器资源占用最少,但成本最高。中小客户可根据实际情况选择。