长期以来,大型电信公司和网络供应商利用 服务水平协议(SLA) 过度承诺,交付不足,导致客户面临严重的服务问题和不达标的连接。 供应商当然有义务履行他们与客户签订的任何协议,但电信业却经常让客户对协议条款一头雾水。 Aryaka Networks 公司首席技术官 Ashwath Nagaraj 说,供应商可以编写合同以确保他们逃避责任,从而使客户无法获得他们认为已经支付的连接。 在 Covid-19 大流行的情况下,云服务对企业来说变得更加重要,因此重新评估 SLA 非常重要。 现在的挑战是如何重塑协议,以便在这个新环境中为客户提供服务。勉强度日 在我们的数字时代,每家企业都依赖于保持联系。 制造业、医疗保健业、金融服务业乃至任何行业都需要可靠的网络基础设施来运行。 在许多公司加快数字化转型计划的时候,这一点尤为重要。 在业务转型的过程中,客户希望网络不会因压力而崩溃。 本应专注于业务转型的时间不应浪费在解决网络问题上。 服务水平协议在其中扮演什么角色? SLA 是提供商对性能的合同承诺。
客户应能计算出所交付的 SLA 对业务的影响。
SLA 还会告诉客户,如果供应商无法满足正常运行时间保证,会受到怎样的惩罚。
如果供应商违背承诺,客户可以通过协议要求赔偿。
客户基本上是在权衡利弊,在宕机对业务影响很大的情况下,为尽量减少宕机时间而支付更高的 SLA 服务费。
一份好的 SLA 几乎不会留下任何疑问;而一份糟糕的 SLA 则会使用充满术语的描述来模糊其含义。
在 SLA 中应注意四个重要事项:
- 承诺–必须清晰明确,不能令人费解
- 测量和验证合规性的能力
- 对不履行承诺的处罚
- 收取罚金的能力(又称服务积分)
承诺大多数 SLA 都承诺 “正常运行时间”。
承诺还包括停机时间的定义。
供应商会承诺若干个 “9”,5 个 9 相当于 99.999% 的正常运行时间(每年约 6 分钟,每月约 30 秒),4 个 9 相当于 99.99% 的正常运行时间(每年约 60 分钟,每月约 5 分钟),以此类推。
五个九是电信 SLA 的常见标题数字。
问题是,当您查看详细说明时,会发现引用的数字范围更广。
其他承诺包括延迟、抖动等。
所有这些都需要明确定义。测量供应商如何测量停机时间?
测量的采样分辨率是否能捕捉到违反承诺的正常运行时间?
它真的与您所经历的网络宕机时间相符吗?
误导性 SLA 的一个例子是:声称正常运行时间为 99.999%,每月测量一次(即每月宕机时间为 30 秒),但实际上每分钟检查一次网络,并以分钟为单位计算宕机时间。
网络可能每分钟停机 35 秒,即正常运行时间为 0%(您从未有过 30 秒的连续正常运行时间),而供应商可以声称正常运行时间为 100% (他们的探针没有一分钟出现故障)。
请注意,服务水平协议应规定足够精细的测量,以显示真实的正常运行时间,而不是一个毫无意义的数字来奉承供应商。惩罚为兑现承诺,必须对故障进行有意义的惩罚。
连接故障会严重影响生产率,阻碍企业的业务执行能力。 这就是许多供应商设法掩盖其无法兑现承诺的地方。
例如,有一家供应商声称正常运行时间为 99.999%,但如果网络可用性在 97.9% 到 99.999% 之间,就会受到 5%的惩罚。
因此,如果您每月有 15 个小时的停机时间,相当于承诺停机时间的 1800 倍,您就会得到 5%的优惠。
如果您为 99.999% 的正常运行时间支付了高昂的费用,因为 30s 的停机时间对您来说代价高昂,那么 15 小时的停机时间很可能会扼杀您的业务。
这不是 5 个 9 的服务,而是低于 2 个 9 的服务。
有些提供商只提供每日电路费的 2%,这对提供商来说几乎可以忽略不计,无论客户是否执行,他们都要承担客户的大部分费用。
要求更高的百分比是解决这些问题的一个显而易见的策略。
建议至少在协议中加入一项条款,允许在供应商经常违反 SLA 时解除合同。获得信用确保供应商对历史和当前的 SLA 衡量保持准确记录,并确保您作为客户可以获得这些数据。
许多供应商规定,客户有责任持续监控网络,并在几周后证明发生了故障。
当然,如果服务提供商自己不对正常运行时间进行测量,或者对这些数据感到尴尬,那么这种情况就不会发生。
本文最初发表于iot-now 网站