一个网络管理员也能轻松搞定的天旦NPM部署和变更

提到网络管理员,脑海中不免浮现出这样一个场景。一位笃定的工程师、一个黑色的终端,轻快地敲入一组指令,OK,网络通啦!的确,网络工程师保障着网络连接的稳定和高效,也保障着当下信息社会中的各种生产、经济和文化活动。假想一下,好不容易刷到的一张春运返乡火车票,在提交订单时因为网络拥塞被超时退出;股市行情火爆时,因为网络延迟大,买卖股票错失良机;在银行想办个理财,接待的理财经理一边输入资料一边报怨着系统回应太慢......这些场景,无不关系到各种生产、业务所依赖的的网络运营。如果你鲜有遇到,那在这背后,一定有无数尽职尽责的网络管理员正做着建设、变更、扩容、排障、规划、升级等等一系列的工作。而在他们背后,也一定会有NPM这样的系统实时检验和分析网络的运行水平,对异常作出及时响应,并且帮助网络管理员定位和分析问题。

随着网络设备和通道吞吐能力的急速发展,网络虚拟化和SDN技术的落地和普及,以及新业务新系统的频繁上线和变更,网络规模越来越大,网络架构越来越复杂。相应的,达到对全网运行状况实时感知的目标是不是就越来越困难呢?天旦NPM给您的回答就是,一个网络管理员也能轻松搞定。

天旦NPM网络性能管理平台通过对网络数据的深度解析,使得网络传输性能可测量、可展示、可评估。而网络数据则最常用、最方便的网络镜像,无论是普通的交换机SPAN,还是ERSPAN,亦或是虚拟交换机或者云环境中通过GRE隧道导出流量都可以直接接入NPM的流量采集器Smartprobe。也就是说,只要一个网络工程师会配置交换机镜像,即可完成NPM最主要的网络数据采集工作。

这里,可能会有工程师顾虑:

1)镜像资源太少不可能把每个业务区域或者网络区域的流量都分别做镜像,只能做一个汇总的镜像,那么就不能区分各区域了;

2)对于按业务区域来划分的情况,没有太多时间和条件来配置复杂的规则来做一个精细化的镜像(比如使用TAP来配置流量过滤),是否针对特定业务流量的分析就不可行了;

3)为了配置方便,镜像流量中不可避免会包含重复流量,势必会影响流量分析的准确性。

天旦NPM可以打消上述顾虑,首先产品支持按照VLAN、VxLAN、MPLS(1至8层标签)、QoS、IP子网的方式来定义区域,只要对不同区域的流量打上相应的标签,则可以把各区域或者业务从汇总的流量里区分出来。NPM还支持QinQ这样双层VLAN标签,可以自定义是按照内层还是外层的标签来区分。其次,NPM在天旦推荐的主流服务器配置下可以达到12Gbps的流量抓存和分析能力,而且通过分布式部署还可以方便的横向扩展。即使不对输入流量做精细筛选,天旦NPM一台流量采集系统SmartProbe的处理力能也完全能满足从12Gbps流量中梳理、分析、监控、提取指定业务流量的需求。而关于重复流量这个NPMD业界的老大难,也被天旦攻克。对于重复流量,一种办法是去重。天旦对于重复流量的产生原因进行了深入的研究,可以针对不同的用户场景做针对性的重复流量检测和去除。在同类产品开启去重功能导致系统资源开销飙升超过30%,严重影响产品稳定性和性能时,天旦NPM把系统资源开销控制在10%以内,能够保障单台SmartProbe系统在12Gbps流量下去重功能的可用和稳定。另一种办法就是不做干预,但是同类产品大多会把重复包判为重传,严重干扰了对网络传输质量的判断。一般正常的网络重传控制在万分之几的水平,如果流量中有大量的重复包被判断为重传,则会误导网络管理员认为是网络传输质量下降继而去追查线路、网络设备是否出现故障。天旦NPM通过优化的算法准确区分重复和重传,同时还提供了TCP乱序的指标,使网络管理员对是流量镜像有问题,还是网络传输性能有问题做到一清二楚、胸有成竹。

简单说来,只要一个网络管理员能做镜像、能配置标签,就能完成流量的导入工作。

此外,天旦NPM还支持Netflow数据(v10版本即IPFIX)作为网络数据输入,提供与基于数据包的网络数据一致的分析和监控能力。这仅需要把Netflow的输出指定为Smartprobe流量采集系统即可。

既然说到部署,另一个重要的考虑则是部署在哪里,是否能按需灵活变动?我们先了解一下NPM的系统部署模式。NPM系统由三个子系统组成,分别是WEB系统NPMW,提供统一的Web访问;数据分析系统 NPMD,提供通过数据包解析后的网络性能数据的计算、查询和存储功能;流量捕获系统Smartprobe,提供网络数据的抓取存储功能。而这三个系统的实际部署位置可以根据用户的需要灵活组合,NPMD与Smartprobe可以形成一对多的模式,同样NPMW与NPMD也可以是一对多的模式,实现多中心多区域分布式部署。

比如,对于一个对总行数据中心和各分行都有需求的场景下,可以在总行分别部署一台Smartprobe、NPMD和NPMW。同时在各分行部署一台Smartprobe,分行采集的流量经解析后送到总行的NPMD上计算和存储,这样可以通过总行一套平台管理到总行和分行的网络运行水平。而对于主备数据中心或者多中心的情况,则可以分别在多个中心部署各自的Smartprobe和NPMD,用同一套NPMW来管理。这样的部署模式,使得扩展和变更非常的方便。当需要再集中管理一个物理上隔离的网络区域时,只需要在该区域安装一台Smartprobe系统并对接上原有的NPMD系统即可。

这里,可能网络管理员又一个疑问产生,在分布式部署的情景下,需要采购这么多套Smartprobe和NPMD、NPMW系统吗?由于天旦支持软件的交付模式,NPM License是按照流量和服务路径捕获点来约束的,那么在总体流量未超过License授予流量大小的情况下对于扩展部署规模没有限制和门槛。NPM系统的构建仅需在服务器上安装相应的NPM软件即可完成。

一个网络管理员,会做镜像,会配标签,会装软件,NPM的部署和变更就能轻松完成。