一次前所未有的“蝴蝶效应”
一只在亚马逊雨林中的蝴蝶偶尔扇动几下翅膀,就可以在两周以后引起美国得克萨斯州的一场龙卷风。这个本来是气象学方面的研究,指的是在一个动态系统中,初始条件的微小变化,将有可能带动整个系统长期且巨大的链式反应。
因为动态系统较为复杂混沌,比较典型的蝴蝶效应并不多见。但最近“微软蓝屏事件”却生动诠释了什么是蝴蝶效应,以及如何影响我们每一个人。
7月19日下午,全球的微软产品陆续出现了宕机,一次安全软件的更新,竟然引发了全球停摆。航班停飞,银行宕机,全球打工人摸鱼狂欢,我们亲眼见证了这场「史上最大规模IT故障」。
据报道,事故或源于CrowdStrike发布的软件代码更新与Windows系统的交互方式有误而崩溃,导致大量用户出现“蓝屏死机”。
CrowdStrike开发的被称为 “端点检测和响应”软件的产品比传统杀毒软件有效得多,但与其他网络安全产品不同的是,CrowdStrike的软件需要更深层次地访问计算机的操作系统来扫描威胁,而这种访问权限使其有能力破坏它们试图保护的系统。所以才会引发Windows系统大量蓝屏死机。
讽刺的是越需要保护的东西反而在这次事故中受冲击最大。
CrowdStrike的技术是抵御勒索软件的有力手段,但其成本(在某些情况下每台机器可能超过50美元),意味着大多数企业不会在所有电脑上安装,而安装了该软件的电脑是最需要保护的电脑,如果它们瘫痪,关键服务也会随之瘫痪。
所以才能由一个小小的代码错误,从而引发一次全球性的从网络到现实的全面性安全危机。
据介绍CrowdStrike是美国的网络安全龙头公司,因其在检测和防御高级网络攻击方面的能力而闻名,世界500强企业中有271家是其客户,其软件被包括微软、亚马逊AWS在内的一些最大的云服务公司提供商所使用,也包括主要的全球银行、医疗保健和能源公司,帮助它们检测并阻止黑客威胁,许多政府机构(例如美国顶级的网路安全机构和基础设施安全局)也都使用其软件。
对于航空公司而言,这次故障导致飞机和地面控制台沟通遇阻,旅客出行受到影响。FlightAware显示全球超过21,000个航班延误。目前,美联航、达美、 美国航空、汉莎航空、法荷航、瑞安航空正在逐步恢复,但速度缓慢。
供应链咨询公司 Xeneta 的首席空运官 Niall van de Wouw 在与一份声明中表示:“飞机和货物不在它们应该在的地方,(这个问题)需要几天甚至几周的时间才能完全解决。它提醒大家,我们的海运和空运供应链面对IT 故障是多么不堪一击。”
据媒体援引的CrowdStrike与一位客户的沟通中,CrowdStrike的技术支持团队建议说,可能需要将受影响的系统重启多达15次。
保险经纪公司Marsh McLennan称,超过75家客户可能会因为CrowdStrike全球性崩溃事件而提出网络故障索赔。而对于故障造成的经济损失程度以及谁将承担这些损失,在一段时间内还不得而知。据悉,大多数软件供应商对其程序造成的损害不承担法律责任,这些程序是授权的,而非出售的。但他们通常与最大的客户签订了服务协议,可能需要帮助补救、给予折扣或其他补偿。
对于金融行业,有交易所已经表示受到Windows系统崩溃的影响。
泛欧交易所通过电邮发送声明称,一些基于北美市场股票的指数目前发布有误,周四的收盘水平也不正确。将在标准计算恢复时通知客户。
经营伦敦证券交易所的伦敦证券交易所集团(LSE Group) 当天也表示遇到了一个全球性的技术问题,导致新闻无法发布。
澳大利亚当地银行Suncorp、NAB、Bendigo Bank和Commonwealth Bank,南非Capitec银行和新西兰多家银行也受到影响。