扫去彩云的乌云边

随着新年钟声的敲响,2012终于来到我们面前。回首2011,经济危机的阴影仍未散去,欧元区和美国经济的疲软让更多的企业选择捂紧钱包过冬。在这样的情形下,“按需使用,计量付费”的云服务日益成为企业IT的主流。越来越多的CIO/CTO开始思考、着手将自己的基础设施与应用迁移到云上。然而,2011年发生的几起云服务事故却给这一锦绣蓝图镶上了乌云边。云服务的可用性如何保证?如何开发可靠的云应用?成为很多人心中迫切需要解开的疑虑。

2011年4月份,Amazon EC2美国东部数据中心发生故障,众多应用变得无法访问;2011年10月份,RIM黑莓服务的“宕机”事件,让重度依赖的企业用户们损失惨重;再联想此前2011年3月份,Google邮件服务与企业套件的不可用……这一桩桩、一件件,是否意味着云服务遭遇了“滑铁卢”?云服务提供厂商采取了哪些措施来提高自身服务的可用性和可靠性?他们是否采取了有效的监控与报警措施?假如云服务宕机,云服务提供厂商又有哪些措施来确保数据的不丢失与回滚?从运维中积累了丰富经验的云服务提供厂商显然胸有成竹。

正如硬币的两面,一方面云服务提供厂商在确保基础设施与服务上面投入了大量的精力,另一方面,为了让自己的应用能够屹立不倒,云应用开发商也是有大量的工作要做。如何在满足业务功能的前提下,预防可能的云服务不可用风险?云应用的架构如何应对可能的风险?如何让“捣乱猴”等基础设施帮助自己及早发现系统抵抗云服务不可用的能力?另外,对于底层的云基础设施和存储,如何备份以及提高回滚、恢复能力?这些问题,云应用开发商必然需要深思和采取行动。

“太阳底下无新雪”,网络、系统、服务等运维积攒下的丰富经验与知识,正是新时代云服务需要借鉴与汲取的。云服务的可用性问题并非无解:云服务提供商与云应用开发商都需要及早考虑、规避、预警服务不可用的风险,并及时妥善做好恢复工作。两者各司其职,“上帝的归上帝,凯撒的归凯撒”,又需要紧密合作、双向共赢。

在这个商业创新越来越快的时代,DevOps、持续交付是必然的趋势,开发与运维、服务商与开发商的合作、交流越来越紧密。晴空依旧,彩云涌起,何处有乌云?

http://www.infoq.com/cn/minibooks/architect-jan-10-2012

Leave a Reply

Your email address will not be published. Required fields are marked *