关于计算机云存储中数据迁移的分析
数据迁移问题是企业选择云存储方式最为重要的环节,文章从多个方面分析云存储中如何有效地进行数据迁移并提出一些自己的看法,旨在共同研究数据迁移的实施方案。
1 引言
云存储作为云中的一项重要服务,它通过集群应用、网格技术或分布式文件系统等将各种存储设备通过应用软件集合起来,对外提供数据存储和业务访问。云存储中,信息使用者并不要求知道服务器的具体型号或接口类型等信息,只要获得授权就可以对云存储中的数据进行访问,这隐藏了复杂程度,为用户提供了一个更为便捷的访问数据的方式。
2 云存储中数据迁移分析
当我们从一个物理环境和单个阵列过渡到完全虚拟化的、高度动态的存储环境时,数据的迁移就成了云存储方案中最为基础、关键的步骤,它在整个方案中占有了举足轻重的作用。
2.1 数据迁移中的网络连接
数据云迁移必须面对云的网络连接能力的考验。企业与云之间数PB的数据的来回切换是比较困难的。目前大部分的操作模式是通过一个局域网或者广域网进行数据传输。根据企业数据量大小不同以及网络连接能力的高低,初次的数据迁移可能会持续相当长一段时间,因此,响应延迟是阻止云存储被采用的一个最重要因素。这里,建议各个机构在做数据云迁移前仔细检查本机构的网络情况并对内部网络的安全现状进行评估。目前,提高现有网络连接能力已经成为了一个新的研究方向,只有当网络足够好时,数据迁移才会更便捷。虽然有些云供应商提出了用物理迁移的方法来代替网络传输数据,但是我们要看到,由于工作性质的原因,有些类似于病人病历、企业核心数据等敏感数据是不能被复制或采取物理迁移的方法带走的。
鉴于此,要把企业的数据转移到云中,针对不同的实际情况这里我推荐两种方法:当企业的数据吞吐量较大但是数据量不是特别多,对传输延迟也沒过多要求时,云供应商可以提供从企业到供应商某个存储节点之间的私人链接,方便企业迁移数据。企业可以根据自己的时间,在不影响公司正常运行的情况下做数据的转移安排;当企业的数据可以提供拷贝,那么我们可以采用sneakernet的方式,即人工网络模式,将数据通过磁盘、移动存储设备等从企业服务器拷入到云数据中心或者从云数据中心拷贝出来,目前一些云供应商为了加快数据的转移,在给企业进行数据转移时会采取一些切实有效的人工网络模式,例如Nirvanix公司,他们在给客户进行数据转移时会提供一个配置了双千兆级以太网接口的存储服务器,当客户的数据拷贝完毕,公司就会带走服务器并将数据拷贝到云数据中心。而在初始备份之后,网络带宽压力将得到缓解,以后企业只要做增量备份即可。
2.2 数据迁移中的数据结构化和迁移工具的选取
为了将数据仓库有效地转移到云端,我们需要适当结构化数据并使用正确的数据分析工具及云迁移工具。传统关系型数据库中的数据要转移到云端非关系型数据库需要面临很多的问题,一是要解决如何从关系型数据库中快速有效地抽取大量的数据到云文件系统和数据库,二是数据的转换问题。这里推荐基于Windows 和.NET的Microsoft Windows Azure。使用Microsoft Windows Azure作为云平台,应用程序可以很轻松地迁移到云中。以目前常见的ASP.NET+SQL Server的开发模式为例,由于SQL Azure和SQL Server之间的高度兼容性,因此迁移数据将会变得容易起来,我们只用留意数据库的最大尺寸即可。一般来说数据库的大小不宜超过50GB。当数据超过此大小时,可使用SQL Azure Migration Wizard 来协助分析和迁移数据。它可以分析你当前的模式并找出与SQL Azure的不兼容之处,协助开发者修改。同时,可在后台使用BCP,把需要迁移的数据迁移到云中。
2.3 数据迁移过程中的安全问题
在数据云迁移过程中,制定一套安全有效的数据迁移方案对数据迁移进行安全管理是十分重要的。在安全管理的事项中,有三点是必须要考虑的。首先是数据,企业中不是所有的数据都适合放到云环境中去,若“敏感信息一旦受到危及,就有可能危害企业甚至决定企业存亡”的数据,企业在选择时就该更加谨慎,要考虑是否保留。其次是安全,不管是什么服务、什么样的存储技术,都要确保云提供商的安全措施可靠而明确。最后是加密,事实上,企业无法从云存储提供商的承诺中确保数据的安全,应该采取一切措施,特别是加密来防止敏感数据泄露。对于许多公司来说,信息就是核心资产,如果员工和客户无法获得信息,或者信息被非法使用,公司就会陷入困顿。对此,我们有一些方法来解决云迁移过程中的安全问题,比如我们可以先将用户分为若干部门并建立每个用户的树型结构标签,将其保存到存储云中的中央节点。同时,将存储云中的数据节点划分为若干机组建立存储云系统的树型结构标签,并将其保存到存储云中的中央节点。然后,我们建立上述两个树型结构标签点对点的关联关系,得到每一部门数据迁移过程中的目标机组安全选择策略,并将其保存到存储云中的中央节点。最后,中央节点根据此安全策略,确定每一待迁移数据块要迁移的目标数据节点,执行迁移命令进行迁移。
不管我们采用什么安全性数据转移方案,数据的备份工作都是必不可少的。企业应做好数据迁移过程中的数据备份工作,虽然一些云供应商会做这一步操作,但是我们还是建议企业自己备份,不管备份在什么地方,我们都必须确保在数据转移过程中受到严密的保护,并且要求云供应商提供监控功能,监控访问数据的人员以及对核心数据的加密。
2.4 数据迁移中的云供应商切换
最后,如果企业对当前云供应商提供的服务不满意需要更换服务商,如何在两家服务商的云之间转移数据?这应该是当前一个很棘手的问题。由于目前云存储还处在初级阶段,各个云供应商都采用自己的加密或传输机制,因此沒有一个规范和约束的统一标准。很多云存储供应商无法直接将客户数据迁移到另一家供应商。当服务出现故障时,数据将返还给客户,然后客户要再找另一家云供应商,或者将数据存储在本地服务器。这里建议各个云供应商提供一组云数据管理的应用编程接口API,让不同云供应商之间的数据迁移更加便捷。
3 总结
数据迁移需要精心谋划,不合理的方法会导致企业资金超过预算、数据不完整等问题,我们应尽可能的规避这个过程中的数据迁移错误。这里给大家几点建议:一是在迁移过程中必须确保包含了全部数据源;二是优化存储;三是尽可能的采用“自动化转移”的方式;四是应该根据不同环境有区别的复制,这样可以尽可能的回收孤立的数据或者将他们移动到更有效的平台。