人们抱怨过网络延迟吗?云计算账单会让管理人员感到震惊吗?这些迹象都预示着组织的混合云战略需要进行一些更新和调整。

IT行业中有一个格言,“IT领导者和架构师的最佳计划有时会出错。”这个基本原则已成为永恒:即使采用精心设计的策略,事情也可能出错。

然后,关键是组织需要定期检查其计划,并在警告标志表明组织可能偏离业务发展轨道时进行修改。这也是混合云成功的重要原则,这很好地表明组织首先有一个计划。但是策略并不是不变的。

混合云策略:4个警告迹象

成功的混合云计划需要一些正在进行的调整。如果这些警告信号开始出现,则可能是进行检查并纠正航向的时候了。

1. 最终用户的抱怨

用户有时似乎有一种天生的抱怨倾向。但当其投诉量开始飙升时,可能有潜在的原因。

瞻博网络(Juniper Networks)高级主管兼多云技术传道者Scott Sneddon说:“第一个表明出现问题的迹象很可能是来自用户的抱怨。通常情况下,在本地以外的位置运行应用程序所带来的额外延迟会对性能产生难以预测的影响。”

网络延迟和其他潜在的性能问题应该成为组织是否将其特定工作负载迁移到云平台评估的一部分。而且需要关注迁移之后的情况。如果用户不满意,特别是一些应用程序可能让很多用户投诉,那么这表明可能是进行战略审查的时候了。

Sneddon说:“在远程工作的这段时间内,如果最终用户被迫通过虚拟专用网连接到中心位置,然后再将流量通过全球互联网发送回运行应用程序的云平台,则网络延迟会变得更糟。而端到端性能监控是关键。”

虽然在家远程工作环境特定于内部用户,但延迟问题通常也会影响外部或面向客户的应用程序。

2. 云计算账单中出现意外情况

从长远来看,云计算账单中的一两次意外超支并不会立即引起恐慌。但是,如果组织经常对收到高额帐单感到措手不及,尤其是如果无法解释为什么比预期的要高的话,那就出问题了。

Red Hat公司首席技术官Gordon Haff说,“云计算成本控制是一个普遍的问题,随着云计算应用越来越广泛,这只会变得越来越困难,”

Haff补充说,处理公共云成本可能特别棘手,很多组织通过顾问的帮助减少云计算成本。但是,即使寻求外部帮助,这也表明其战略需要重新审视。

Haff说:“IT部门必须密切注意潜在的重大事件,例如数据输出、出于某种目的而启动但从未关闭的昂贵资源,以及在多个位置运行的服务。计费警报是一种有用的工具,但更普遍的是,成本的增长速度快于对云计算的需求需要进行关注。”

Sneddon认为,不断增长的公共云账单是组织需要重新制定混合云计划的标志,尤其是在监控、治理和应用程序特征等领域。

Sneddon说:“如果不对部署进行监控,并且如果应用程序的部署方式没有受到限制,则应用程序的蔓延会很快发生,成本可能会上升。如果事先不完全了解或不密切监视与应用程序相关的这些变量,则网络I/O和存储的高昂成本也可能令人震惊。”

尽管出乎意料的账单表明组织需要重新考虑策略,但当组织的团队对公共云平台缺乏经验时,这些账单尤其重要。

Sneddon说:“这些成本对于IT部门和财务部门来说令人惊讶,因为他们习惯了与建设私有基础设施相关的更可预测的成本。”

3. 曾经可靠的应用程序在新的环境中出现问题

可靠性和弹性是混合云和多云策略的共同目标。如果应用程序开始遇到比以前更多的停机或其他问题,那么这显然应该表明组织策略可能存在问题,尤其是与将正确的工作负载匹配到正确的环境有关的时候。

Sneddon说:“组织通常对他们的应用程序在不同环境中的行为并不完全了解。”

这已成为容器化、持续集成(CI)/持续交付(CD)和Kubernetes的驱动吸引力之一,确保开发人员的代码在任何环境中都能正常运行的能力。但是,并不是每个应用程序都是以云原生的方式构建的。因此,组织需要查看并重新访问不同工作负载在不同环境中的表现。

Sneddon指出,在将原有应用程序迁移到云环境后,有时会弹出警告标志。这可能表明组织需要重新考虑采用提升和转换方法的初始决定(在这种方法中,应用程序的代码和组件保持相对不变),而不是进行重构以充分利用新环境的特性。

Sneddon说:“如果不重构这些应用程序,则应用程序还可能遭受公共云基础设施中意外中断的影响,这些应用程序在私有云中可能不会遇到。”

Sneddon表示,其原因之一是私有云基础设施通常被构建为“5个9”的可靠性,并且通常不会超额订购。

Sneddon说:“以这种方式构建可能会成本高昂,但是其可靠性是不可否认的。公共云基础设施通常旨在以更少的容量容纳更多用户,并且通常以较低的可靠性构建以降低基础设施的成本。人们期望与传统的应用程序相比,构建在云平台上运行的应用程序更具弹性,并且可以承受基础设施层的故障。”

与此相关的是,网络延迟不仅仅是应用程序对用户的问题(反之亦然)。延迟也可能在应用程序的各个组件之间发生,并在性能方面引起类似的问题。Sneddon指出,如果遇到延迟问题,这可能是组织需要重新构建架构的信号,并查看是否存在应用程序不同组件之间的速度减慢的情况,而这些组件可能以比以前更分散的方式运行。

Sneddon说:“存储的位置是非常重要的,这也影响了存储的性能。在新位置移动或启动应用程序模块以解决用户投诉可能相对简单。移动应用程序需要运行的数据并不是那么简单。”

4. 没有评估和衡量标准

另一个潜在的警告信号:没有警告信号。如果没有关于混合云战略做出初步和持续决策的标准,那么实际上就没有有效的方法来确保一切按计划进行。当然,高得离谱的账单或更多的性能问题最终还是会告诉哪里出了问题,但重点是,组织不应该等待更紧急的问题发生。

Laserfiche公司云计算基础设施高级产品经理Daniel Herndon说,“明确定义的目标和成功指标应该是系统审核和混合解决方案选择过程的关键部分。目标和成功指标应代表对现有系统的改进,并在新系统的合理性和收益中发挥作用。”

Herndon指出,这是评估新平台以及衡量采用结果的可靠方法。

他说:“成功指标也是获得组织高管人员的支持,保持对项目信心以及在项目生命周期内提供状态更新的关键工具。”

凯捷公司北美云卓越中心主任Dave Newell建议,组织需要为混合云架构中的任何环境设定基准目标。这些标准包括:成本、技术、许可证管理、支持能力、数据安全性、应用程序寿命、性能,以及内部/外部接口。

当然,对特定供应商或工作负载适合特定环境的初步评估很重要。Newell还建议组,织在混合云中的任何环境中连续使用指标或关键绩效指标(KPI)。 以上提到的中断或停机时间增加的示例(尚无充分的解释)是一个基本的示例,但还有其他示例。这些将成为组织自己的内置预警系统,该系统可能不会按计划进行,然后可以采取相应措施。

Newell说,“当服务等级协议(SLA)故障开始增加,升级开始消耗更多管理人员参与,计划外的技术更新影响组织的成本模型,IT资源的培训要求显著增加或安全控制失败时,需要重新调整其混合云目标,以满足业务期望。”