混合云场景下BGP冗余门路失效
这是一份基础网络运维的意外复盘报告。
由于一些历史要素,我司各个环境之间的互联互通驳回了串行衔接,并且外围链路和转发节点经常使用了共享资源,既下图中白色局部。由于共享资源的牢靠性和稳固性表现不佳且缺点场景下的权限无余,倍受困扰后下定信心要扭转这种局面。在梳理了现有资源之后,基础网络架构跃迁历程如下:
于是疑问排查的重心调整到高可用方向。
优先确认了一切EBGP街坊的相关形态,确保均为established。
其次审核办公环境和托管IDC内网进口方向的路由宣告概略,确认两侧BGP进程路由宣告成功。
再次则区分排查内网进口方向的前缀列表,确认已失效的过滤逻辑不存在误杀状况。
2.4 手搓新网段,触发路由更新
最后尝试在办公环境内网进口设备上新增loopback,性能并颁布一个新的子网和相应的路由,随后审核EBGP街坊的路由收发状况,发现状况照旧。
经过上述测试排查,发现如下特色————
综上,办公环境和托管IDC内网进口方向,两端设备都向云上L3节点宣告了本地路由,云上L3节点也能反常收到路由消息并参与自身的路由表,但是,云上L3节点并不会把这些路由消息再转发到远端的云下设备。折腾了近2个小时,环节中我甚至想到了古早概念-水平宰割,但想到产品经理明白强调过:“专线接入点就是个渠道,当成链路看待就可以了”,加之方案设计时还额外参与了子接口的性能,结果还是在防环上踩了坑。最终又拉上云服务商的售后更新确认,才真正破案。万万妹想到哇,555555
针对疑问状况,揪着售后一同确认了各种细节后,敲定了处置方案————
全体看上去,疑问其实很便捷,以为有了子接口,又是不同as之间的EBGP街坊,不会遭到as-path、水平宰割这类防环逻辑的限度,但其实是思想定势的误区,形成了前面的周折和期间损耗。
固然,BGPv4仍是当代互联网的基础,但云服务带来了新颖内容,基于云的各种才干和产品,相较企业网和数通的传统技术概念有了显著变动,应该在掌握基础的前提下,明了新产品和新个性的更新迭代,真歪了解这些不同之处的关联场景和针对的痛点,才干正确的施展长处表现价值,给下层服务提供稳固和耐久的撑持。
宛景瑞,转转基础设备运维担任人。