云呼叫中心应着眼大局 —— 具备高可用性

摘要:对于大规模、分布式的呼叫中心或托管/基于云的服务提供商,每一分钟的非计划工作中断都会造成巨大的损失。这就促使大家寻找一款极为可靠的软件,确保最高的正常运行率——99.999%如何?

对于大规模、分布式的呼叫中心或托管/基于云的服务提供商,每一分钟的非计划工作中断都会造成巨大的损失。这就促使大家寻找一款极为可靠的软件,确保最高的正常运行率——99.999%如何?

就算我们相信一些厂商的大肆宣传,我们还是不难发现这些宣传指的都是软件。但是,在虚拟、托管和基于云的呼叫中心中,绝大多数的工作中断是由硬件和网络故障造成的。但实际(在市场营销部以外)中,没有人想要区别故障的原因。无论什么原因,中断就是中断。所以,用户需要询问的问题不是“有多少个9’s”,而是“你的软件能否应对基础设施故障?” 让我们看看潜在的风险,以及软件供应商(应该)如何回应:

风险1 – 软件故障

是的,软件有时会出现问题。呼叫中心软件不是在过去密封、特殊的环境中运行的;基于IP的技术不受这些因素的影响,而是受制于所有分散原件和高容量的网络使用率造成的停运和问题。

但软件供应商可以使用多种方法最大限度的降低软件故障的影响:

自动故障恢复——如果由于某种原因,该软件无法应对某种情况,它应该以影响最小的方式、在无需人工干预的情况下自动重启并完成中断的工作。

分割——将产品分割成尽量小的离散数据块,因此任何故障的影响都可以被最小化。

集群——在许多实体物件之间用使用自动负载均衡功能分散负荷。这样,单个元件故障对系统的影响也就最小

风险2 – 硬件/网络故障

为什么像Sytel这样的软件厂商关心与他们无关的问题?因为任何一个负责任的供应商都希望为终端用户提供尽量高的生产率,尽量避免麻烦。这意味着他们要提供备份和冗余能力以减轻除软件以外的故障带来的破坏。

正如在停电后发挥作用的备用发电机一样,整个链条中的每个组件——从服务器、电源,到语音和数据网络——都应该有一个备用设备,随时准备在硬件或网络中断后接管相关工作。在服务器/虚拟机的情况中,这并不一定意味着’1:1′的冗余。因为不太可能发生两台及以上设备同时故障的情况,因此配置一个备用设备即可。

为了自动接管,任何备用设备都必须按时维护,以准确反映主服务器的状态。这体现出了优秀的软件设计能力。它可以提供一种机制,当基础设备无法正常运行时,它能立即启动备用设备完成工作接管。

不妨问供应商一些尖锐的问题,例如“如果发生地震会怎样?”如果他们回答“这不是我们的问题!”那你就应该寻找其他具有大局观念的供应商了。