解码路由中断:保护网络连接的 7 个技巧

IT运维2023-12-11 14:17:38

 

网络中断已成为一个可怕的现实,扰乱了企业、个人生活和沟通渠道。虽然没有任何网络能够幸免于这一不幸事件,但最近澳大利亚电信中断事件清楚地提醒我们此类中断可能产生的影响。这次停电持续了几个小时,给澳大利亚全国范围内的企业、基本服务和日常生活造成了干扰。

这个例子凸显了现代电信网络的复杂性以及发生中断的可能性。即使拥有最先进的基础设施和强大的冗余措施,软件故障、硬件故障或自然灾害等不可预见的事件也可能导致网络瘫。

网络中断可能会发生在我们最优秀的人身上。因此,以下是导致此类中断的原因以及如何保护您的网络免受此类中断的影响。

了解澳大利亚电信中断的根本原因

中断的根本原因是技术问题的复杂相互作用,主要集中在软件升级及其引入的过多路由信息上。

过多的路由信息​​破坏了边界网关协议 (BGP) 的稳定性
中断的根本原因源于例行软件升级期间所做的更改。具体来说,这些更改无意中断开了核心路由器的连接,从而将过多的路由信息​​引入电信网络。过多的路由信息导致BGP变得不稳定。

不堪重负的路由器和安全阈值

路由问题给电信提供商网络内的关键路由器带来了巨大的负载。这些负责处理和管理大量路由数据的路由器变得不堪重负并超出了预设的安全阈值。这些阈值定义了网络路由器可以处理的路由数据量的可接受限制。

路由器的默认配置和保护机制为了应对超出的安全阈值,大约 90 个受影响的提供商边缘 (PE) 路由器激活了供应商默认保护机制,将自己与电信提供商的 IP 核心网络断开。这种自我隔离机制有效地切断了路由器参与路由数据的能力,导致网络连接中断。

级联故障影响整个网络基础设施这些关键路由器(尤其是负责核心网络路由的路由器)的断开引发了级联故障,导致整个电信基础设施大范围中断。

是什么延长了网络停机时间?

恢复大规模网络中断可能是一项复杂且耗时的工作。可能加剧澳大利亚电信中断等情况并延长恢复过程的关键因素包括:

1. 缺乏稳健性:在上述 IP 路由问题中,网络需要足够的保护措施来防止大量路由信息涌入导致路由器过载。

2. 监控不足:如果没有有效的网络监控系统来及时发现问题,网络管理员可能会在识别根本原因和启动纠正措施方面遇到延迟。

3. 手动恢复:如果没有配置管理工具,恢复过程可能需要手动重新配置受影响的路由器,这非常耗时且费力。

保护您的网络免受中断事故的 7 个最佳实践

 

虽然网络中断是一个不幸的现实,但个人和组织可以采取一些措施来尽量减少其影响。以下是七个关键考虑因素:

1.实施强大的网络监控系统:全面的网络监控系统提供对网络基础设施的集中可见性和控制。它使您能够监控网络性能、识别潜在问题并及时采取纠正措施。

2.建立清晰的配置管理程序:这包括版本控制、变更管理和文档。正确的配置管理有助于防止未经授权的更改并确保配置在整个网络中保持一致。

请注意路由器的默认供应商配置,并采取相应措施,以避免在网络基础设施中部署更新时出现问题。例如,为了避免路由器自我隔离,网络管理员可以在ManageEngine网络配置管理器中创建合规性规则,以确保最大前缀配置(即安全阈值)仅记录警告消息,并且不会完全隔离路由器。

3.流量工程和容量规划:采用流量工程技术来有效管理网络流量,并确保路由器能够处理峰值负载和意外的数据流量峰值。这涉及分析流量模式、识别潜在瓶颈以及实施拥塞控制机制。进行容量规划练习,以确保网络基础设施能够支持预期的增长和流量需求。

4.实施全面的备份和恢复计划:这可确保您在发生中断或灾难时能够快速将网络恢复到工作状态。该计划应包括关键数据的定期备份、恢复网络配置和自动化的过程以及测试恢复过程的过程。

5.BGP 配置和故障排除:为 BGP 实施严格的配置管理实践,确保正确的路由重新分配、环路预防和社区过滤。保持 BGP 漏洞的最新知识并实施适当的缓解措施以防止路由攻击。

6.冗余网络基础设施:设计和实施冗余网络基础设施,包括多个核心路由器,以提供故障恢复能力,并在发生中断时更快地恢复。这包括设备级、链路级和路径级的冗余,以确保在面临硬件或网络中断时的连续连接。网络管理员还应该为网络管理和通信启用多种通信运营商选项。

7.定期进行网络评估和漏洞扫描:定期安排的网络评估和漏洞扫描可以帮助识别网络基础设施中可能被攻击者利用或导致意外中断的弱点和漏洞。这些评估应涵盖网络的物理和逻辑安全方面。

即使是一流的网络也可能成为路由和配置问题的受害者,澳大利亚电信中断就是一个发人深省的例子。现代网络基础设施中的漏洞使得企业必须加强其网络基础设施以防止发生事故。实施全面的网络监控系统、清晰的配置管理程序、流量工程和容量规划至关重要。

ManageEngine OpManager Plus是增强网络弹性和降低风险的一种强大解决方案。确保不间断的连接并从意外挑战中快速恢复。立即与我们的产品专家联系,快速了解功能。

 

路由中断服务程序
本作品采用《CC 协议》,转载必须注明作者和本文链接
人类社会的发展史就是一部信息的发展史,从人类诞生之初的巫师、商人等职业就可以看出信息之于人类何其重要,这也是为什么美国国安局(NSA)会如此嚣张的窃取全球隐私的原因。
1Docker 迁移存储目录默认情况系统会将 Docker 容器存放在 /var/lib/docker 目录下[问题起因]?今天通过监控系统,发现公司其中一台服务器的磁盘快慢,随即上去看了下,发现?由上述原因,我们都知道,在?中存储的都是相关于容器的存储,所以也不能随便的将其删除掉。设备进行扩容来达到相同的目的。的详细参数,请点击查看?但是需要注意的一点就是,尽量不要用软链, 因为一些?容器编排系统不支持这样做,比如我们所熟知的?发现容器启动不了了
随着工业物联网逐步走向成熟,数据成为整个生产流程中的关键因素。数据驱动 的工业系统从终端和其他业务系统收集数据,加以分析和优化,在提升效率的同时减少劳 动力。想要做出可靠的生产和业务决策,系统内部和跨系统工业数据的完整性和一致性显 得尤为重要。区块链和分布式账本技术拥有以分布式方式来维护数据的加密完整性和不可 抵赖性,因此,利用区块链对工业系统进行数据问责验证是很自然的。在工业物联网场景 中,对于
 网络中断已成为一个可怕的现实,扰乱了企业、个人生活和沟通渠道。虽然没有任何网络能够幸免于这一不幸事件,但最近澳大利亚电信中断事件清楚地提醒我们此类中断可能产生的影响。这次停电持续了几个小时,给澳大利亚全国范围内的企业、基本服务和日常生活造成了干扰。这个例子凸显了现代电信网络的复杂性以及发生中断的可能性。即使拥有最先进的基础设施和强大的冗余措施,软件故障、硬件故障或自然灾害等不可预见的事
CenturyLink事件导致Cloudflare,Reddit,Hulu,AWS,暴雪,Steam,Xbox Live,Discord等数十家网站瘫痪。电信公司说,事件的根本原因是错误的Flowspec公告。在处理诸如BGP劫持或DDoS攻击等安全事件时,通常使用Flowspec公告,因为它使公司可以更改整个网络以在几秒钟内做出反应并缓解攻击。Cloudflare从远处观察到这一事件,认为CenturyLink宣布了一组全新的BGP路由,然后通过错误配置的Flowspec规则意外丢失了所有路由,从而有效地将其整个网络带入了一个循环。
我想问一下路由模式、网桥模式、旁路模式它们的作用跟区别都是啥,哪位可以帮我解答一下? 路由模式 (Routi
受到网站中断影响的企业涉及非常广泛,其中包括Discord、Medium、Coinbase、NordVPN和Feedly等科技巨头。
继10月5日长达6小时的宕机之后,Facebook、Instagram、Whatsapp、Massage于10月9日再次宕机。这可能是Facebook有史以来持续时间最长、影响范围最广的一次故障。Facebook也不得不再次在其竞争对手Twitter上发布致歉声明。不仅如此,Facebook的内网也受到了影响,员工之间只能通过Outlook等方式进行交流协同办公。
攻击者声称站队瓦格纳集团黑客组织还声称,已经篡改了四个俄罗斯网站,用于发布支持瓦格纳集团的信息。上周末,瓦格纳集团发动了一场未遂兵变,震惊全球。2016年美国总统大选和2018年美国中期选举期间,俄罗斯发动大规模干预行动。互联网研究所深度参与,遭到了美国政府制裁。截至目前,外媒CyberScoop未能联系上Amtel-Svyaz和瓦格纳集团对此事进行评价。如果确认属实,这将是俄罗斯卫星网络又一次遭受黑客攻击。
仿真结果表明Spam DIS攻击是一种非常严重的DoS攻击。这消耗了合法节点的能量资源,并最终导致合法节点无法通信并遭受拒绝服务。此处,等级用于表示节点相对于DODAG根相对于其他节点的位置。将父列表中所有节点中排名最小的节点选为首选父节点。否则,当收到不一致的DIO消息时,发送速率会增加。在这里,“请求的信息”选项用于节点从相邻节点请求DIO消息。
IT运维
全栈IT运维管理软件,发现运维更多可能