19日,微软Windows系统及公司其他一些应用程序和服务出现大面积中断,导致许多国家的航空、铁路、航运、金融、医疗、酒店等行业无法正常运转,很多企业和个人用户的工作和生活受到严重扰乱。
微软首席执行官萨蒂亚·纳德拉当天在社交媒体X发文证实,为微软提供服务的安全技术公司CrowdStrike发布的软件更新是导致此次全球性断网事件的主要原因。
此次宕机事件的范围和严重程度极为罕见,给政府、行业和个人用户敲响了警钟。英国工程技术学会网络安全专家朱奈德·阿里指出,此次宕机事件的规模可能“史无前例”,对全球信息技术(IT)行业团队构成重大挑战,但也为软件工程专业人士提供了重要的经验。
完全消除影响需要时间
据外媒报道,总部位于美国的CrowdStrike公司在全球拥有超过2万家客户,其中包括微软、亚马逊等科技巨头。该公司首席执行官乔治·库尔茨19日在社交媒体X上发文称,此次事件并非网络攻击,而是由该公司针对微软Windows发布的软件更新中的“缺陷”引起的。目前问题已经确定、隔离,并部署了修复措施。
库尔茨当天接受媒体采访时还表示,“我们对给客户、旅客和所有受影响的人造成的影响深表歉意。”该公司正在努力解决这一问题,但一些系统可能需要“一些时间”才能从故障中恢复。
尽管 CrowdStrike 已与微软合作快速恢复了大部分服务,但专家认为,此次中断的长期影响还有待进一步评估。英国计算机协会网络安全专家亚当·史密斯指出,修复必须应用于全球大量计算机,这需要一些时间。但如果计算机进入蓝屏和无限循环,恢复可能会更加困难,需要几天甚至几周的时间。
Junaid Ali 认为,CrowdStrike 正在将此次事件作为首要任务处理。“此次中断的长期影响尚不完全清楚,但它们将影响未来及时采用关键安全更新。”
警惕IT系统风险
专家认为,此次中断事件凸显了全球互联网基础设施的脆弱性,我们需要对IT系统的复杂性以及高度依赖网络基础设施的各领域的潜在风险保持警惕。英国工程技术学会专家伊恩·科登表示,全球发生的重大IT系统中断事件反映了经济、国防和国家安全对数字服务的依赖程度不断提高,因此凸显了数字服务安全性和弹性的重要性。
英国布里斯托大学计算机学院专家奥莫罗尼亚认为,我们需要对云基础设施和其他“我们每天都依赖的”关键系统保持警惕。当今的网络基础设施非常复杂,依赖关系广泛,而这些风险对于负责构建它们的人来说往往并不明显。
此次事件中也有复杂情况,公众目前尚不明确。例如,多家外媒提到微软Windows和该公司其他一些应用程序及服务出现问题。有媒体援引微软发言人的话称,7月18日至19日夜间微软365服务出现的问题与“中机”的软件更新无关。总体而言,业内人士普遍认为,微软Windows大规模宕机的原因是“中机”在软件更新中出现失误。
业内人士表示,这表明企业在部署安全软件之前,应该彻底审查其网络安全解决方案的潜在风险。数字安全公司 IDEE 创始人兼首席执行官 Al Lakhani 在一份声明中表示:“这里的教训很明显:投资网络安全不仅仅是为了获得最新或最受欢迎的工具,还要确保这些工具可靠且有弹性。”
应急能力有待提升
此次事件影响波及全球,也暴露出一些“命脉”行业和高度依赖IT系统的大型企业应急能力不足。例如,全球航空业受到此次宕机的严重冲击。美联社援引航班追踪网站数据报道称,截至美国东部时间19日晚,美国有近2800个航班被取消,近1万个航班延误,全球约4400个航班被取消。
业内人士指出,企业应建立完善网络故障应急预案,并定期进行演练,确保发生故障时能够快速响应、快速恢复。
Corden 指出,为了减轻网络故障的影响,企业应该安装备份系统,在基础设施中留有冗余,定期进行灾难恢复测试,并制定严格的软件更新协议。此外,企业还应使用先进的监控工具,培训 IT 人员如何应对停机等紧急情况,并与第三方供应商密切合作,以确保制定强大的安全策略。
澳大利亚国立大学计算机专家汤姆·沃辛顿警告称,此次大面积断网事件表明,依赖单一技术提供重要服务存在风险,应使用不同的软件建立备用通信链路。这确实会增加安全和维护成本,但“如果你把所有鸡蛋都放在一个篮子里,最终可能会丢脸。”
评论(0)