当地时间10月4日,Facebook 及其旗下 Instagram 和 WhatsApp 等应用全网宕机,停机时间近 7 小时 ,浏览器在尝试打开时显示 DNS 错误。
宕机期间,Facebook 在欧洲、美洲、大洋洲几乎完全下线,在亚洲的日本、韩国、印度等国也无法访问。除了让数十亿用户陷入困境之外, Facebook 服务中断还使得其员工无法使用内部工具相互交流。Facebook 首席技术官 Mike Schroepfer 只能通过推特向用户道歉。
1. 宕机故障原因
由于 Facebook 的架构设计是根据服务器可用性来扩展或缩减 DNS 服务,当服务器可用性因网络故障而降至零时,就会停用所有 DNS 服务器。这种停用通过 Facebook 的 DNS 名称服务器向互联网边界网关协议(BGP) 路由器发送消息来完成的,这些路由器存储用来抵达特定 IP 地址的路由方面的信息。这些路由通常被公告给路由器,让路由器了解如何适当地引导流量。
在此次宕机事件中,由于整个骨干网都已陷入瘫痪,因此各 DNS 服务器位置均上报连接状态问题并撤回边界网关协议(BGP)通告。最终结果是,Facebook 的 DNS 服务器虽然仍在运行但却无法正常访问,导致其他互联网用户也无法正常接入其服务器。
在此过程中,我们可以看出DNS在其中扮演了很重要的角色,DNS的故障是导致Facebook宕机的主要原因。
2. 什么是DNS?
简单来讲DNS就是翻译官,把baidu.com这样简单易记的域名翻译成220.181.111.188的IP地址让机器理解,从而实现域名和IP之间的相互转化。
由此可见,DNS是网络上一种非常重要和基础的功能,DNS故障会对整个网络的正常访问和运行造成严重影响,从此次Facebook宕机事件中就可见一斑。
除此之外,DNS系统也是网络攻击的重点对象,DNS劫持、DNS污染等针对DNS的攻击手段层出不穷,给各行各业都带来了严重危害。因此加强DNS安全防护能力,在网络攻击日趋频繁的今天已是刻不容缓。
3. 云解析——DNS解析新趋势
(1)采用分布式云架构体系,可有效分摊超大流量访问和恶意DDoS攻击,提升域名解析系统承载能力和系统容灾能力,保障域名系统的安全性和稳定性。
(2)支持智能解析和负载均衡,可根据访客地址和IP智能划分解析节点和线路,实现用户的就近选择和低延迟接入,有效提升域名解析和网站访问速度,保障用户的访问和使用体验。
(3)采用高防DNS集群技术,支持更高的DDoS攻击和QPS查询防护,全面提升网站域名的抗攻击和防劫持能力。
(4)分布式监测节点,实时监测网站域名状态,24小时轮询监测,发现异常情况及时作出响应,实现快速容灾切换,保障网站服务的连续性。
与传统单节点解析相比,云解析系统无论是在解析速度、解析稳定、安全防护等多方面均有了显著提升,可有效提升域名管理能力、解析能力、抗攻击/防劫持能力以及故障恢复能力,为广大政企客户的域名及网站安全保驾护航。
相关推荐:
干货分享 | 一文读懂DNS原理及解析过程什么是DNS?DNS解析的原理是怎样的?
中科三方DNS云解析产品常见问答