新年伊始,重大通信故障又发生了。
2022年2月1日,日本移动运营商NTT DoCoMo发生全国范围内的重大通信故障,导致部分4G和5G用户在长达5个小时内无法上网和进行VoLTE语音通话。2月7日,NTT社长召开新闻发布会,就本次事故表示道歉,并公布故障原因。
故障描述
1. 故障发生时间:
2022年2月1日早上7点30分至下午0点13分
2. 故障影响:
部分移动用户无法使用移动互联网服务和语音通话服务(VoLTE)
3. 故障原因:
因引入IPv6单栈模式时,服务器负荷陡增,并向终端发送控制与网络通信的信令。
4. 影响用户数量:
约18000名
5. 影响范围:
全国
6. 解决措施:
针对本次IPv6单栈网络升级失败,为快速恢复服务,DoCoMo采取了回退到"IPv4/IPv6双栈模式”的临时措施。未来,该运营商表示将采取增加服务器容量以及优化设计等方式,重启IPv6单栈模式升级。
为何引入IPv6单栈模式?
众所周知,IPv4的地址长度为32位,约42亿(2^32)个IP地址,相当于世界上平均3个人共用2个IP地址,随着PC和智能手机的普及,目前已基本分配殆尽,发展已到极限。而IPv6的地址长度为128位,可提供的IP地址数量非常多,可"让地球上每一粒沙子都有一个IP地址"。
如今,随着物联网设备增多和5G普及,接入互联网的设备数量不断增加,对IP地址的需求也越来越大。为此,运营商、ISP、云商等各界均积极推动IPv6升级,以解决IPv4地址耗尽问题。
在IPv4向IPv6过渡阶段,大家一般都采用IPv4/IPv6双栈模式,即:为终端分配IPv4和IPv6两套IP地址,如果对端是IPv4服务器,就用IPv4通信;如果对端是IPv6,就用IPv6进行通信。
然而,在双栈模式下,要求移动网络中的所有设备都支持IPv4/IPv6两套协议栈,存在升级周期慢、维护成本高等问题,且无法根本解决IPv4地址短缺问题。
在此背景下,为了最大限度地提升IPv6利用率,DoCoMo提出在2022年春季在移动网络中引入IPv6单栈模式。
IPv6单栈,也叫纯IPv6或者IPv6-only,即:在移动数据通信中仅为终端分配IPv6地址。
不过,由于IPv6协议和IPv4协议是不兼容的,如上图所示,在升级为IPv6单栈的移动网络后,网络仅为终端分配IPv6地址,如果终端访问的目标服务器仍然为IPv4,需通过DoCoMo移动网络中的服务器或交换机设备进行地址转换处理,将IPv6地址转换为IPv4,才能实现终端访问只有IPv4地址的目标节点。
对此,DoCoMo采用了DNS64/NAT64和464XLAT两种IP地址转换方法,前者可解决Native IPv6用户连接IPv4服务器的问题,后者允许终端上的IPv4-Only应用在IPv6单栈网络上进行通信。
根据DoCoMo官方通报,本次通信故障正是因为其在移动网络中引入“IPv6单栈”模式,导致服务器负荷增加,并向终端发送控制与网络通信的信令,从而造成部分移动用户无法接入ISP(sp-mode)和IMS(VoLTE),无法进行数据通信和语音通话。随后,该运营商采取了回退到"IPv4/IPv6双栈模式”的紧急措施,约在5个小时后恢复正常。