专访微软专家:SQL Server 2014内幕揭秘

2015 年 2 月 9 日4370

  【IT168评论】大家好,我是主持人皮皮,欢迎大家关注第119期名人堂。在云优先和移动优先的战略下,微软利用“组合拳”,推出了大数据解决方案。如果把Power BI和Excel称为“数据的UI”,那么SQL Server和Azure则构成微软大数据平台的后端。怎么降低技术的门槛,让普通人也能玩转大数据?本期特别邀请微软专家做客IT名人堂,韩凯Chris Han(社区ID:Chris_Han0015)和他的同事Super Rao联袂讲述“微软SQL Server 2014不可不知的那些事儿”,其中SQL部分内容由Super Rao提供。

  皮皮(Q1):您好,很高兴有机会采访到您,能否向网友介绍下自己?

  Chris(A1):大家好,我是微软技术中心的架构师,主要负责微软最新应用及数据平台在客户业务场景落地方面的技术支持。具体来讲,我的工作核心涵盖了从面向业务决策者的商业与IT战略简报、到面向架构设计、治理者的关键技术POC的执行。

  皮皮(Q2):我了解到,在微软之前,您曾经在美国华尔街、黑石集团工作过,拥有非常丰富的工作经历,能否和我们分享下您在职业生涯中的心得?对年轻一代的码农有什么样好的建议?

  Chris(A2):技术发展是呈现周期性上升的,需要听从内心的声音,坚持自己的兴趣,扎根沉淀。我做过前端到后端的开发,也做过项目管理。无论哪个位置,选择你喜欢的最重要。我是一个由兴趣驱动而对技术极端痴迷的人,特别喜欢技术带来的“魔力”。我信奉付出就会有回报,虽说不一定是功名上的回报,自我能力上也会有长远的提高。

  皮皮(Q3):伴随着可穿戴设备、机器人、3D打印、智能家居等新潮设备的不断涌现,物联网、云计算、大数据将成为2015年的技术主角,您觉得它们究竟有什么样的关系?大数据是否能为物联网保驾护航?

  Chris(A3):我个人认为,与其说大数据为物联网保驾护航,不如说物联网让更多大数据的应用场景变成了可能。物联网的英文定义是Internet of Things.(aka IoT) ,微软对IoT的技术定义是:“一个由带有嵌入式技术的物理物体构成的网络;并通过嵌入技术就物体内部及其环境状态实现沟通与交互。”大数据的价值最终是靠机器智能实现的,但它的基础是数据。数据从哪里来呢?物联网!举个例子,微软的智能助手小娜,可以根据交通状况提醒您出门时间。这个交通状况就是路网系统的繁忙状态。这个系统状态很可能是通过很多部车(Things)对它自身状态(行驶速度)的报告汇总统计得出来的。大数据系统积累了足够多的历史经验后,就能预测道路交通的未来状况,进而推荐你出行的路线。

  皮皮(Q4):谈到云平台,大家很容易想到Azure,那么Windows Azure为何要更名为Microsoft Azure呢?Azure云是目前全球惟一同时提供公有云、私有云和混合云的云服务,相比于OpenStack等其它云平台,它有哪些亮点?能否结合企业案例分享下它的应用场景?

  Chris(A4):谈及Azure的更名,从两个方面看我觉得是水到渠成的。首先它的开放性与完整性。Azure不仅提供IaaS服务,还提供PaaS和存储服务。此外,IaaS服务中不仅提供预制Windows的虚机,还有预制Linux, 甚至不止一个版本;其次,微软在战略规划上把Azure放到了首要位置。CEO提出的“移动为先、云为先”的战略反应在产品上,自然就不是“Windows”这样一个容易让人联想到操作系统品牌所能涵盖的了。

  

  微软的云战略确实如你所说,它提供了从公有云到私有云甚至混合云的全面解决方案。那么它究竟与其他云方案相比,到底有什么区别呢?我们在这里引用第三方的数据,也许会更加的客观一些。在2014年Gartner 四个与云相关的魔力四象限评比中,微软云方案都处于领导者地位。Infrastructure as a Service, Server Virtualization, Application Platform as a Service and Cloud Storage Services. 无论是IaaS、PaaS、私有云、还是到云存储,纵观微软的所有产品,总能牢牢抓住一个核心关键词:Enterprise Ready——或者说微软提供的是“企业级产品”。与“企业级产品”对应的自然是“消费级产品”。怎么理解它们的区别呢?简单地说,前者是生产工具,而后者,正如它的字面意思,用于消费。对于生产工具的要求是安全、稳定、高效。微软对自己的云服务提供99.95%的SLA保证。

  对于开源社区,微软是持拥抱态度。微软对OpenStack on Hyper-V做出了主要贡献(https://wiki.openstack.org/wiki/Hyper-V)。不过需要澄清的是,与OpenStack对应的微软产品,其实是用于私有云的Windows Azure Pack技术, 而不是Azure公有云。对于已经拥有Windows Server/System Center的微软客户,Windows Azure Pack是没有额外收费的。

  皮皮(Q5):微软将SQL Server 2014定位为混合云平台,它能够轻松整合到Microsoft Azure中,在什么样的情况下,适合将SQL Server 2014迁移到Microsoft Azure中?能否结合具体的案例,讲讲SQL Server 2014在云端Microsoft Azure中的应用场景?

  微软专家(A5):谈到SQL Server 2014混合云,它典型的场景主要有三类,分别是云备份、云端灾难恢复和应用扩展。

  首先来说云备份,数据库管理员(DBA)可以借助SQL 2014 内置的Management Studio管理工具轻松将本地数据库备份到微软Azure公有云中,并且提供了手动和自动的数据库同步方式,供用户灵活选择。即便是不熟悉Azure的用户,也能轻松完成部署。备份采用实例级别,这就意味着实例下所有数据库都能够完成云端备份。云备份方案帮助用户轻松实现异地灾难备份,极大降低了固定资产对资本的占压和自主运维成本。传输过程中可以对备份文件进行加密,从而确保数据的安全性。

  云端灾难恢复是SQL Server 一项突破性的技术。早在SQL Server 2012中,引入了AlwaysOn的高可用功能,SQL Server 2014将这个功能拓展到了云端,发挥得更加淋漓尽致,它支持将AlwaysOn可用性组的备节点部署到云端,这意味着一旦本地主节点数据库服务器宕机了,云端备节点可以根据策略接管数据库服务,从而实现了真正的混合云部署。此外,AlwaysOn功能还支持将备节点作为可读副本,实现主备节点的混合云负载均衡。

  第三种场景是内部应用的云端扩展。当用户业务量出现季节性或周期性峰值时,可以将应用数据库服务扩展到云端;常规时期则释放公有云资源,仅靠私有云资源支撑业务。这种方式既保证了企业对季节性计算能力的需求,又保护了现有的IT投资。

  皮皮(Q6):在微软的整个大数据解决方案中,SQL Server2014到底扮演了一个什么样的角色?SQL Server 的下一个版本将何时发布?会有哪些新的突破?

  Chris(A6):SQL Server 2014是微软大数据整体解决方案非常重要的一个组成部分,它主要定位在大数据3个V特性中的Velocity方向,即解决高速率数据的响应问题。对于大数据量(Volume)的问题,SQL Server 2014在解决方案上也有所增强,但它专注于结构化数据。对于非结构(Variety)、海量数据(Volume)的部分,微软也有基于Hortonworks的Hadoop发布——HDInsight和一体机方案APS。这里暂不展开。应对高速响应的问题, SQL Server 2014有许多策略。这里主要介绍两个方面。一个是内存计算,一个是混合负载。内存计算解决了与存储系统数据交换时的IO瓶颈,极大提高了“写”的操作速度。这对OLTP的应用场景而言,性能得到了极大的提高。我们自己在非实验室环境的保守测试中、在不修改任何DML代码的情况下,可以看到20倍以上的吞吐量提升。非常值得一提的是,对于SQL Server的现有用户,SQL Server 2014的内存计算方案与之前版本的管理和应用开发差别不大。知识、技能延续性非常高。对“读”操作的优化,不仅体现在内存计算带来的更直接的记录索引,而且支持压缩的列式存储,已经从2012版的附加索引变为原生存储方式。这就使得大数据量环境下的混合负载能力在SQL Server 2014中得以轻松实现。

  熟悉SQL 的朋友都清楚,SQL Server2014 继续沿袭之前版本的产品策略,内置BI功能,这就意味着SQL Server2014既可以应用于OLTP交易型系统,也可以应用于OLAP分析型系统。但之前的产品考虑到读写竞争的原因,通常建议的最佳实践是,将负载实例分离部署。这中间的数据迁移和聚合,无疑都会延长客户查询请求的响应时间。有了SQL Server 2014,老的“最佳实践”就要改写了。多数业务场景不需要分离。当然对于确实需要读写分离的场景,比如跨地理区域的只读服务(查询、报表),SQL Server 2014通过基于AlwaysOn可用性组提供多达8个的只读节点,大大提高了IT投资利用率。

  SQL Server下一版本具体的发布时间不便透露,但更新周期明显比以前短了。新版本的方向与奥运会的目标是一致的——更快更高更强。比如为了加快吞吐速度,用户可以选择Delayed Durability,在有损服务场景应用非常广泛,比如互联网服务或电商。再比如对关键业务OLTP服务,增强了对内存计算的高可用的保证。

  皮皮(Q7):从最早的SQL Server 2000到现在的SQL Server 2014,15年的演变过程中有哪些创新?您能否从业务应用场景的角度来谈谈SQL Server 2014的亮点?

  微软专家(A7):根据微软内部的一个统计数据,从SQL Server 2005到现在的SQL Server 2014,SQL Server提供了120多项的功能创新,在这十个版本的演进中,SQL Server从最早只支持中小用户应用的数据库平台,到现在转变为了一款强大的数据库产品,支持大型核心OLTP/OLAP业务和混合云部署,同时也赢得了更多用户的认可。具体新功能亮点及应用场景请大家参考: http://http://www.zjjv.com///zh-cn/server-cloud/products/sql-server/default.aspx ,上面有非常详细的描述,同时大家也可以通过这个链接下载SQL Server 2014试用版亲身体验这些新功能。

  皮皮(Q8):索尼数据库被黑,12306数据泄密等一连串事件将数据库安全推到了风口浪尖上,我们知道,SQL Server 2014在全球的市场份额将近半壁江山了,号称五年来是漏洞最少的数据库,那么它究竟在安全性方面有哪些优势?

  微软专家(A8):SQL Server 2014提供了非常多的安全机制,包括CC 高担保等级认证、改进的职责分离、透明数据加密、加密密钥管理、支持 Windows Server Core部署等等。以数据加密这一项为例,就可看出SQL Server 2014 对用户数据的保护能力,除了刚提到的透明数据加密之外,还提供字段级加密、SQL Server对象定义加密、备份加密、SQL Server连接加密、通过Windows EFS实现的数据文件级加密和BitLocket驱动器加密多种方式供用户选择。上述这些其实只是手段。安全的根本保证在于前期架构设计。微软所有产品设计都遵循“职责分离”的架构设计理念。不会简单把收购的产品粘合进来。哪个部件负责哪些功能前期都分工明细,然后有机地集成在一起。这样的先期设计除了本身减少对潜在威胁的暴露,更重要地是,如果需要打补丁,可以非常及时、不会捉襟见肘。

  皮皮(Q9):早在2009年,Oracle的内存数据库TimesTen通过改变数据在运行时驻留位置的假设来提供实时性能,而SQL Server 2014与之相媲美,也引入了内存技术,能否结合实际的例子,为我们分享下数据库操作的性能指标?

  微软专家(A9):准确地说,Oracle早在2005年就买入了TimesTen,但从第三方评测看SQL Server 2014内存数据库技术性能却大有后来居上的趋势。下图是权威评测组织TPC (Transaction Processing Performance Council) 对OLTP场景的评测结果。你可以看到,SQL Server 从2012版开始包揽了TPC-E榜前十名。SQL Server 2014更是在最近的评测上配合Lenovo服务器创造了新的世界纪录(http://http://www.zjjv.com///tpce/results/tpce_perf_results.asp)。

  

  同时在OLAP数据仓库赛场,SQL Server 2014则创造了TB级以上全部三项新纪录。并且从性能(查询/小时)和性价比都超过了Oracle 11g R2。

  http://http://www.zjjv.com///tpch/results/tpch_perf_results.asp?resulttype=noncluster&version=2%25¤cyID=0

  

  当然,各家产品发布周期不同,你很难有一个绝对静态的对比。但结果是好的,技术的不断进步为我们的客户带来了更多的选择、更好的服务。

  皮皮(Q10):有人觉得云端将是大数据的最终归宿,那么对微软而言,提供了哪些方式让用户迈入云端,享受云端数据库带来的服务?用户升级到SQL Server 2014的过程是简单还是复杂?有哪些好处?

  微软专家(A10):对于“云端是大数据的最终归宿”的说法,我加一个小小的限制条件——这个云,一定是混合云。数据会在企业私有云与微软公有云之间分布、融合、迁移。所以微软的云平台管理应对这样的场合提供了例如统一身份认证、统一授权管理的能力。通过微软的混合云平台,企业的开发人员可以使用任何语言、工具或框架构建应用程序,而不必在意数据服务层的物理拓扑。除了刚才提到的三种混合云场景之外,微软还在Azure上提供了两种数据库服务,基于虚拟机的SQL Server数据库以及PaaS层的Azure SQL 数据库服务。对比而言,基于Azure虚拟机的SQL Server数据库具有完整的 SQL Server 功能和虚拟机控制权,适合现有应用的云端迁移以及新应用的开发/测试。PaaS层的Azure SQL 数据库服务内建 HA 可提供高达99.99% SLA(http://http://www.zjjv.com///zh-cn/support/legal/sla/),无需为操作系统或数据库打补丁,更适合需求多变的新应用。

  用户从SQL Server低版本升级到SQL Server 2014的过程非常简单,SQL Server management studio内置的数据库升级向导以及微软提供的系列免费升级评估工具能够帮助用户轻松完成数据库升级,尽享SQL 2014内存数据带来的性能飞跃。

  皮皮(Q11):自2012年以来,900多家企业从其他平台迁移到Microsoft SQL Server。其中金融服务行业占据了96家;零售制造业占据70多家。而SQL Server 2014内置内存技术,能够实现数据的实时更新,尤其对于大型的零售商而言,性能提升效果极为显著,能否和我们分享下SQL Server 2014的成功案例?

  微软专家(A11):用户从其它数据平台迁移到微软SQL Server的原因主要来自几个方面,包括:

  1)SQL Server 2012/2014对用户核心业务的支撑能力,在性能、安全性、扩展性及高可用性均能满足用户需求;

  2)SQL Server 产品本身有很强的易用性;

  3)内置BI功能,具有更高的性价比;

  4)所提供的混合云解决方案是其他任何一家厂商所不具备的。

  在这里,我分享一个微软在零售行业客户的数字,采用SQL Server 2014内存技术后,数据15分钟写入2亿行数据,提升了35倍的事务处理速度,实现前端交易数据和后端库存数据的事实同步。至于成功案例,国内官网地址http://http://www.zjjv.com///partnerancasestudy/case-studies/ 有图有真相, 微软全球官网上更多,我就不再赘述了。

  互动时间:2015年1月27日-2月6日

  互动奖励:本期名人堂微软专家坐镇,为大家答疑解惑,欢迎各位踊跃提问,活动结束后我们将评选最优会员10名赠送微软logo的收纳包一个。点击链接参与互动http://http://www.zjjv.com///thread-1907019-1-1.html

更多嘉宾信息,请查看名人堂栏目:http://http://www.zjjv.com///star/作为国内数据库与大数据领域最大规模的技术盛宴,2015第六届中国数据库技术大会(DTCC)即将于2015年4月16日-18日在北京新云南皇冠假日酒店震撼登场。大会以“大数据技术交流和价值发现”为主题,云集了国内外顶尖专家,特别开设了SQL Server 专场,欢迎大家报名:http://http://www.zjjv.com///

0 0