首页 > 智能制造

容错,让数字化关键应用“永远在线”

作者:www.cechina.cn2021.11.22阅读 1489

         ——专访美国容错Stratus)技术有限公司大中华区总经理余秀琍

      随着工业4.0时代的到来,数字化、智能化已经成为各个行业的发展趋势,越来越多的数字化系统在企业的生产经营中承担起更加关键的作用。特别是IT和OT不断融合,企业对IT基础设施的依赖越来越高,因此企业非常重视关键应用的“故障预防”能力和强调数据的完整性。
      那如何保证这些基础设施的高可靠性使得数字化关键应用“永远在线”,最大程度减少系统的停机成本呢?CONTROL ENGINEERING China为此专门采访了长期致力于打造更高可用性解决方案的硬件厂商,美国容错(Stratus)技术有限公司的大中华区总经理余秀琍女士,请她来谈谈数字化时代如何保证系统的高可用性。


美国容错(Stratus)技术有限公司大中华区总经理余秀琍女士

      容错,是一家公司也是一项技术
      容错,其实是一项IT技术,是指一个系统容纳错误的能力。它和工业上常见的“冗余”技术类似,都是提高系统可靠性的方法。
      但容错和冗余的实现原理却并不相同,冗余是通过同时运行两台一模一样的设备,当一台出现问题的时候切换到另一台设备上,尽管切换时间能做到毫秒级,但还是存在一定的延时。而采用容错技术的话,是容许系统出现一定的故障或者错误,系统会自动以某种方式弥补错误,不存在切换时间。所以两者虽然很接近,但实际上有着本质的区别。
      容错技术起初是应用在证券、电信等关键领域,进入21世纪后,容错技术开始进入制造业、能源、物流、交通及有着“7×24”不间断运营需求的行业。
      其实提到容错技术,就不得不提到一家公司——美国Stratus公司。Stratus公司不仅是最早提供容错技术的厂商之一,二期也是容错技术领域的全球标准制定者和技术领先者,可以说Stratus就是容错服务器的代名词。为此,Stratus公司的中文名称就直接被称作了美国容错公司。
      从99.99%到99.999%,不仅仅是差一点
      对于一个IT系统来说,可用性是衡量其运行水平和可靠性的重要指标。对于可用性等级,通常用几个"9"来划分。如果一个系统在99%的时间内都是可用的(2个9水平),那就意味着它在1%的时间内是不可用的,那么您可以预测到“2个9水平”的系统一年会有不超过88小时处于停机状态。如果是99.99%的可用性,那就意味着一年的停机时间不会超过53分钟,这样的系统可以称为“高可用性”系统。
      而如果系统的可用性达到99.999%,也就是5个9的水平,那一年的停机时间不会超过5分钟,这时就可称之为“容错”系统。
      “一般的商用或者工业服务器,大致可以做到3个9或者4个9的可用性,但是要达到5个9的水平是非常困难的,而我们的容错技术可以达到5个9以上的水平,这是因为我们40多年来积累了大量经验和专利技术,这一点也是其他公司不可比拟的。”余秀琍表示,“尽管只提高了0.009个点可用性,但对于越来越重要的关键IT基础设施来说,任何细微的停机时间的代价可能就是非常昂贵的。”
       不同的容错方式满足不同的应用需求
      自上世纪80年代,第一代容错技术开始进入应用领域,美国Stratus公司就以独特的硬件级容错技术占领了主要的市场份额。如今,美国Stratus公司已经具备硬件容错和软件容错等多种解决方案,为客户提供多样的服务。
      Stratus ftServer ,是Stratus公司的硬件容错产品,可以为各种关键业务处理器和数据密集型应用,包括高级SCADA、MES、SCM、AI和ML等系统提供最高等级的可用性。ftServer采用专用同步芯片设计,实现CPU、芯片组、内存、PCI总线、SAS总线等几乎全部部件的冗余,可以保证在任何硬件损坏的情况下,服务器不间断运行。
      对此,余秀琍表示,“ftServer 是一个全面整合的持续可用平台,帮助企业实现收入、质量和生产力的最大化。没有计划外的停机时间,无数据损坏或数据丢失,而且部署起来非常简单,无需修改软件应用程序或编写故障转移脚本。”
      对于数据存储,Stratus提供ftScalable容错存储系统,ftScalable配合ftServer组成一个系统,可为企业的数据中心等IT基础设施提供真正高靠性的应用方案。
而对于一些不使用ftServer服务器的用户,Stratus可以用软件容错的方式帮助用户打造一个容错系统。“everRun 是一个高度通用且价格合理的持续可用性软件解决方案,它与行业标准的 x86 系统相结合,可快速、轻松地保护您的虚拟化工作负载和数据。”余秀琍介绍说。
      ztC Edge——边缘计算的容错解决方案
      为了实现更高效、安全的卓越运营,在工业系统中,计算越来越多的在数据收集和分析的实际位置附近进行,而不是在集中式服务器或云中进行。边缘计算成为实现运营方式数字化转型的领先方法。
      据Gartner分析,目前91%的数据是在集中化的数据中心产生和处理的,而到2022年,约有75%的数据需要在边缘进行分析并采取措施。为此,Stratus推出了边缘计算的容错解决方案ztC Edge。
      “Stratus ztC Edge 是一款安全、耐用、高度自动化的边缘计算平台,可以快速、可靠且高效地实现业务关键性工业应用。借助内置虚拟化、自动重启和数据保护、自动本地恢复、简化安全操作,以及基于云的系统运行情况监测和托管支持服务,企业可以提高效率,降低对IT的依赖,同时最大程度降低现场机器设备的停机风险。”余秀琍介绍说。
      不同于IPC和IT服务器,ztC Edge更适合作为一个边缘计算服务器使用,比如部署到OEM机器里面,使其成为一台智能的机器。IPC虽然适合工业等级,但不提供任何冗余,这意味着不得不定期手动干预机器和客户的操作。而传统 IT服务器不适合工业等级,需要放置在环境较好的位置,如服务器室,这不利于智能制造。
      ztC Edge在硬件设计上是非常特殊的,用的是一款无风扇的,并且是纯固态的硬件设计,十分轻便但坚固耐用,适合在工业现场恶劣的工况环境下使用。而且,利用ztC Edge双节点的解决方案,可以构建一个更加稳定、可靠、安全的冗余系统。
      余秀琍强调,ztC Edge同时也是一个高度自动化的平台,工程师能够在30分钟内为智能机器部署冗余 SCADA/HMI系统,快速、轻松、可靠地提供工业物联网和控制应用程序。
      容错,让数字化关键应用“永远在线”
      成立于1980年的美国Stratus公司,在上世纪90年代就进入了中国市场,其产品在国内的通信、金融、医疗、市政、交通以及制造业都有了广泛的应用。
      据余秀琍介绍,在国内某大型钢铁公司,容错的ftServer几乎成为了他们二级系统的服务器标配,保证了钢铁厂最重要的二级系统连续在线运行。在制药行业,如信达生物制药、上海天伟生物制药等,ftServer保证了制药产线的连续可靠性。在水处理行业,比如九溪水厂、上海迪斯尼水处理系统等,也都在用ftServer在线收集数据进行实时监控。
      “随着国内所有行业都朝着高、精、尖的方向发展,我们的产品应用的范围越来越广,不仅在传统的通信、金融和制造行业,而且在新兴的电商物流、智能楼宇和智慧城市等领域都有了应用。”余秀琍表示,除了一些关键应用,一些客户为了保证系统的“永远在线”,甚至在自己的OA系统、邮件系统、呼叫中心等数字化应用上都用上了容错的产品。
      之所以能够取得如此广泛地应用,其实和Stratus公司一贯的开放的合作生态分不开的。Stratus一直以来不仅有渠道合作伙伴、OEM 合作伙伴,而且还十分注重与解决方案构建商、系统集成商建立广泛的合作关系。在中国,Stratus一直拥有强有力的渠道合作伙伴,而罗克韦尔自动化、施耐德电气等OT大厂则是其全球战略合作伙伴。在今天这个永远在线的全球经济中,几秒钟很重要。关键业务应用的停顿会产生深远的经济、安全和法律后果。从故障中恢复,无论多快,都不再是一个选项。我们可以笃信,容错技术将在越来越数字化的关键业务领域发挥重要作用,而容错公司,凭借其全球领先的容错技术,可以让这些数字化关键应用“永远在线”。