天旦NPM,教你如何实现自动化抓包分析

抓包是目前网络管理员在遇到网络故障时,都会选择的手段。获取一段时间内的网络数据包,密密麻麻地呈现在一个界面里。即使是专家,能够借由这些不那么直观的信息判断出故障位置,但相信也会觉得,在IT无所不能时代,为什么抓包工具还滞留在需要人工分析的程度。不是懒于动用经验,而是有限的专家在有限的工作时间内要处理无限的问题,实在是压力山大。而对于普通网管员来说,他们缺少经验的陈年累积,要用大众化的抓包工具应对各种怪癖的网络问题有时候真的是力不能及。要是能有一种工具既可以抓包,又能够自动化分析问题,那简直是不敢想象的美好。

天旦NPM,让不敢想象的事情变为现实。银行对业务连续性的要求尤其之高,容不得网络有一点闪失。因此,本文以2家银行用户为例,带你体验,对系统0影响的旁路式抓包,加上自动化的分析能力,这是一种多么美妙的感受。

案例一 2分钟定位故障位置

背景:某城商行,连接银联的异步双工长连接通道发生了异常,导致在那个时间段通过该城商行收单发往银联进行转接的业务请求全部失败。该银行前期已经部署了天旦NPM,并且监控覆盖到了该银行和银联之间的连接通道。

天旦NPM诊断:由于服务端Reset,建连成功率过低。

分析:首先,天旦NPM刻画了从银行到银联的一条网络服务路径,该服务路径囊括防火墙和路由交换设备。当问题发生时,在该银行卡服务器到银联的服务路径通道上,NPM自动给出“建连成功率过低”的分析结论:服务端Reset,导致建连不成功,如。同时,NPM还会附上数据包样本供参考验。

天旦NPM自动给出“建连成功率过低”的分析结论

同样,在某股份制商业银行的某省级分行,通过部署天旦 NPM也取得了同样的卓效。这不仅仅是建立了和上层应用对应的网络服务视图,实时监控了该省分行和人行、银联之间的连接通道,更重要的是运维视角的转变,把对网络运维的高度提升到了以服务为中心,而不是传统的以设备或流量为中心。

案例二 精确告警,网络性能波动早知道

背景:11月份,由于该省分行与银联连接的前置机发生问题,导致网络服务异常。

天旦NPM告警:因为前置机的异常,有新建连接发生,触发天旦NPM告警,及时告知网络运维人员进行处理。

分析:在正常情况下,该省分行和银联之间并发4个连接,在天旦NPM中定义的告警触发条件是超过4个并发连接即告警。天旦NPM自动告警“并发连接数持续高于阈值”,并触发告警。天旦NPM的告警可以通过Syslog发送到银行的统一运维管理平台或事件管理平台进行集中处理。经查看详细指标,确实在该时间点发生了并发连接数异常现象。

同时,通过天旦NPM,我们在该时间点看到了TCP SYN和FIN的参数变化。正常情况下,前置机与银联之间的连接通道是异步长连接,在连接建立成功以后,是不会有任何TCP SYN和FIN发生的,但在长连接通道看到TCP SYN和FIN,说明连接发生了重建和关闭,产生异常情况。

如以上两个案例,天旦NPM可以实时统计与网络可用性、性能和负载量息息相关的指标,同时,支持指标阈值加持续时间点复合告警,除了并发连接数外,还支持以下重要指标告警:流量、客户量、TCP重传、TCP零窗口、TCP SYN、TCP FIN、TCP RST等。另外,天旦NPM还支持对长连接异常终止的告警,包括长连接被RST和长连接超时告警。

天旦NPM,不仅仅是抓包那么简单

天旦NPM(Network Performance Manager)是以服务为导向的网络性能管理系统,通过直接体现网络设施对业务应用的支撑能力,为评估、判定网络服务质量提供可以信赖的数据依据,让IT运维变得简单。具体来说,NPM帮助企业构建以数据为中心的IT运维管理方式,广泛适用于在广域网边界、局域网或者是弹性扩缩的云环境下采集数据,在数据包捕获、存储方面能达到零遗漏,在按规则提取的效率方面超越其他同类NPMD工具的两倍以上。同时,天旦NPM在进行复杂的数据包检测计算时表现出极高的稳定性。在同等存储的情况下,提供数倍于同类产品的原始数据报文保存时间。其会话存储、多维度统计、检索性能也达到同业领跑水平。

如此敏捷、准确的网络性能管理工具,其建设却非常简单快速。天旦NPM的建设只需通过在交换机做镜像获取相关流量,把多段的镜像流量汇总接入NPM智能探针(Smart Probe)即可。

天旦NPM部署拓扑图

天旦专利技术的服务路径图发现(Service Path View Discovery)功能,利用网络真实数据中蕴含的实时应用服务器之间的连接关系和属性,通过机器学习对行为进行判断和聚类,用象征着宇宙和星空的重力图来呈现结果。用户通过方便地拖拉拽操作,马上可以梳理清楚复杂业务系统里的访问关系,将原本数以月计的工作时间缩短到几个小时,而且梳理结果还可以实时展示和长期维护。不论是新增、减少或者架构的调整,都可以在WEB界面,通过鼠标拖拉的方式即刻快速进行。

天旦的服务路径发现:全旁路,自动发现应用组件交付设备之间的连接性和访问关系,快速创建服务路径视图

某城商行网络科长使用天旦NPM后曾发表评价:“天旦NPM的自动化故障诊断非常有用,原来我们发生过一次和财政局之间的连接异常问题,我们的工程师和集成商的工程师两个人花了一个月的时间才排查清楚,没想到类似的问题用NPM几分钟就搞定了,为我们节省了宝贵的服务恢复时间,这就是在保障我们的业务持续性,非常好!”