用于应用会话故障排除的应用会话特定的网络拓扑生成的制作方法

未命名 07-23 阅读:65 评论:0

用于应用会话故障排除的应用会话特定的网络拓扑生成
1.本技术主张2022年9月27日提交的美国专利申请第17/935704号的优先权,该申请主张2022年1月14日提交的美国临时专利申请第63/299733号的优先权,其全部内容通过引用并入本技术。
技术领域
2.本公开总体上涉及计算机网络,更具体地,涉及计算机网络的监测和故障排除。


背景技术:

3.商业场所或地点,例如办公室、医院、机场、体育场或零售店,通常在整个场所安装复杂的无线网络系统,包括无线接入点(ap)网络,以向一个或多个无线客户端设备(或简称“客户端”)提供无线网络服务。ap是物理的电子设备,使其他设备能够使用各种无线网络协议和技术(例如符合一个或多个ieee 802.11标准的无线局域网协议(即,“wi-fi”),蓝牙/低功耗蓝牙(ble),网状网络协议(例如zigbee)或其他无线网络技术)无线连接到有线网络。许多不同类型的无线客户端设备,例如笔记本电脑、智能手机、平板电脑、可穿戴设备、电器和物联网(iot)设备,都结合了无线通信技术,可以被配置为当设备处于兼容无线接入点的范围内时连接到无线接入点,以便接入有线网络。在客户端设备运行基于云的应用程序的情况下,例如互联网协议语音(voip)应用程序、流媒体视频应用程序、游戏应用程序或视频会议应用程序,在应用程序会话期间,数据从客户端设备通过一个或多个ap和一个或多个有线网络设备(例如交换机、路由器和/或网关设备)进行交换,以到达基于云的应用程序服务器。


技术实现要素:

4.总体来说,本公开描述了一种或多种用于网络管理系统(nms)的技术,使用从客户端设备到基于云的应用程序服务器的应用程序会话专用拓扑,以应用程序会话级别提供了粒度的故障排除工作流。在基于云的应用程序的应用程序会话期间,例如,voip或视频会议呼叫、流媒体视频观看会话或游戏会话,运行应用程序的客户端设备通过一个或多个接入点(ap)设备、有线网络边缘的一个或多个交换机和一个或多个网络节点(例如交换机、路由器和/或网关设备)交换数据,以到达基于云的应用程序服务器。
5.根据本公开的技术,对于特定的应用程序会话,nms基于从在特定应用程序会话的持续期间内涉及特定应用程序会话的网络设备子集(例如,客户端设备、ap设备、交换机、路由器和/或网关)接收到的数据生成拓扑。更具体地,nms可以基于从网络的时态图数据库中检索到的特定应用程序会话的数据来构建应用程序会话专用拓扑。时态图数据库被配置为存储在一段较长的时间内(例如数周或数月)以应用程序会话级别的粒度从网络设备收集的历史数据中提取的实体和连接信息。通过这种方式,本公开的技术可以实现特定应用程序会话的回溯查找故障排除,即使当前网络拓扑在特定应用程序会话结束后发生了变化,或者当前应用程序会话没有经历与特定应用程序会话相同的问题。
6.本公开的技术使得能够通过识别涉及特定应用程序会话的网络设备子集中的一个或多个网络设备处的连接性问题来对特定应用程序会话进行故障排除。例如,nms可生成代表用户界面的数据,以提供给用户(例如站点或网络管理员)应用程序会话专用拓扑的可视化,包括颜色编码、图标或在特定应用程序会话持续期间内拓扑内的连接问题的其他标记。响应用户输入选择表示被识别为在特定应用程序会话期间有连接问题的网络设备的图标,nms可以进一步生成针对该网络设备的故障排除用户界面,或可以将用户重定向到特定于该网络设备的客户洞察(insight)或推荐动作用户界面。
7.此外,本公开的技术使得能够识别涉及特定应用程序会话的第三方应用程序服务器和其他第三方网络设备,以提供从客户端设备到基于云的应用程序服务器的完整拓扑。例如,nms可以基于在特定应用程序会话期间从交换机、路由器和/或网关接收到的数据中包含的上行链路数据(例如,lldp通告)来确定哪些交换机、路由器和/或网关连接到第三方应用程序服务器、第三方服务提供商服务器或其他第三方网络设备。然后,nms可以确定第三方网络设备的实体id数据(例如,ip地址或接口地址)。在一些示例中,nms可以与第三方应用程序/服务性能监测(apm)供应商进行一些集成,以便经由应用程序编程接口(api)为应用程序服务和/或服务提供商检索洞察数据,以便确定应用程序服务和/或服务提供商是否故障或遇到问题。
8.在一个示例中,本公开描述了一种网络管理系统,包括存储器,存储从被配置为在网络中提供客户端到云连接的多个网络设备接收的网络数据;以及一个或多个处理器,与存储器耦接,并且被配置为:接收标识运行在客户端设备上的应用程序的应用程序会话的查询,其中,客户端设备包括多个网络设备中的一个;从时态图数据库中检索针对应用程序会话的实体信息和连接信息,其中,实体信息表示来自多个网络设备、在应用程序会话期间涉及应用程序会话的网络设备子集,并被存储为时态图数据库的节点,其中,连接信息表示在应用程序会话持续期间内网络设备子集之间的连接,并被存储为时态图数据库的边,其中,时态图数据库表示在一段时间内以应用程序会话级别粒度的网络的至少一部分的历史;基于应用程序会话的实体信息和连接信息生成用于应用程序会话的应用程序会话专用拓扑;至少基于在应用程序会话期间从网络设备子集接收到的网络数据,识别应用程序会话期间网络设备子集内的至少一个连接问题;以及生成用于在管理员设备上呈现的代表用户界面的数据,用户界面包括在应用程序会话持续期间内的应用程序会话专用拓扑的可视化,包括至少一个连接问题的指示。
9.在另一个示例中,本公开描述了一种方法,该方法包括通过网络管理系统,接收标识运行在客户端设备上的应用程序的应用程序会话的查询,其中,客户端设备包括被配置为在网络中提供客户端到云连接的多个网络设备中的一个;通过网络管理设备,从时态图数据库中检索用于应用程序会话的实体信息和连接信息,其中,实体信息表示来自多个网络设备、在应用程序会话期间涉及应用程序会话的网络设备子集,并被存储为时态图数据库的节点,其中,连接信息表示在应用程序会话持续期间内网络设备子集之间的连接,并被存储为时态图数据库的边,其中,时态图数据库以应用程序会话级别粒度表示在一段时间内网络的至少一部分的历史;通过网络管理设备,基于应用程序会话的实体信息和连接信息生成用于应用程序会话的应用程序会话专用拓扑;通过网络管理设备,至少基于在应用程序会话期间从网络设备子集接收到的网络数据,识别应用程序会话期间网络设备子集内
的至少一个连接问题;以及通过网络管理设备,生成用于在管理员设备上呈现的代表用户界面的数据,用户界面包括在应用程序会话持续期间内的应用程序会话专用拓扑的可视化,包括至少一个连接问题的指示。
10.在另一个示例中,本公开描述了一种计算机可读存储介质,包括指令,该指令在执行时导致网络管理系统的一个或多个处理器:接收标识在客户端设备上运行的应用程序的应用程序会话的查询,其中,客户端设备包括被配置为在网络中提供客户端到云连接的多个网络设备中的一个;从时态图数据库中检索用于应用程序会话的实体信息和连接信息,其中,实体信息表示来自多个网络设备、在应用程序会话期间涉及应用程序会话的网络设备子集,并被存储为时态图数据库的节点,其中,连接信息表示在应用程序会话持续期间内网络设备子集之间的连接,并被存储为时态图数据库的边,其中,时态图数据库以应用程序会话级别粒度表示在一段时间内网络的至少一部分的历史;基于应用程序会话的实体信息和连接信息生成用于应用程序会话的应用程序会话专用拓扑;至少基于在应用程序会话期间从网络设备子集接收到的网络数据,识别应用程序会话期间网络设备子集内的至少一个连接问题;以及生成用于在管理员设备上呈现的代表用户界面的数据,用户界面包括在应用程序会话持续期间内的应用程序会话专用拓扑的可视化,包括至少一个连接问题的指示。
11.本公开技术的一个或多个示例的细节在随附的附图和下面的说明中阐述。本技术的其他特征、目标和优势将从描述和附图以及权利要求中明显可见。
附图说明
12.图1a是示例网络系统的框图,其中,基于本公开的一种或多种技术,网络管理系统使用从客户端设备到基于云的应用程序服务器的应用程序会话专用拓扑,以应用程序会话级别提供粒度的故障排除工作流。
13.图1b是说明了图1a的网络系统的进一步示例细节的方框图。
14.图2是基于本公开的一种或多种技术的示例接入点设备的方框图。
15.图3是基于本公开的一种或多种技术的示例网络管理系统的方框图,该网络管理系统被配置为使用从客户端设备到基于云的应用程序服务器的应用程序会话专用拓扑,以应用程序会话级别提供粒度的故障排除工作流。
16.图4是基于本公开的一项或多项技术的示例用户装置设备的方框图。
17.图5是基于本公开的一种或多种技术的示例网络节点(例如路由器或交换机)的方框图。
18.图6a至图6c说明了网络管理系统的示例用户界面,用于可视化应用程序会话专用拓扑以及涉及应用程序会话的网络网关设备的相关故障排除工作流。
19.图7a至图7b说明了网络管理系统的示例用户界面,用于可视化应用程序会话专用拓扑以及涉及应用程序会话的ap设备的相关故障排除工作流。
20.图8说明了网络管理系统的示例用户界面,用于可视化包括服务提供者服务器的应用程序会话专用拓扑。
21.图9说明了网络管理系统的示例用户界面,用于可视化用于特定的一组应用程序会话的故障排除工作流。
22.图10是说明基于本公开的一种或多种技术的示例操作的流程图,该操作使用从客户端设备到基于云的应用程序服务器的应用程序会话专用拓扑,以应用程序会话级别提供粒度的故障排除工作流。
具体实施方式
23.图1a是基于本公开的一种或多种技术的示例网络系统100的框图,其中,网络管理系统(nms)130使用从客户端设备到基于云的应用程序服务器的应用程序会话专用拓扑,以应用程序会话级别提供粒度的故障排除工作流。示例网络系统100包括多个站点102a至102n,网络服务提供商在这些站点处分别管理一个或多个无线网络106a至106n。虽然在图1a中,每个站点102a至102n示为分别包括单个无线网络106a至106n,但在某些示例中,每个站点102a至102n可包括多个无线网络,且本公开在这方面不受限制。
24.每个站点102a至102n包括多个网络接入服务器(nas)设备,例如有线网络边缘内的接入点(ap)142,交换机146,或路由器(未显示)。例如,站点102a包括多个ap 142a-1到142a-m。同样地,站点102n包括多个ap 142n-1到142n-m。每个ap 142可以是任何类型的无线接入点,包括但不限于商业或企业ap、路由器或连接到有线网络并能够为站点内的客户端设备提供无线网络访问的任何其他设备。
25.每个站点102a至102n还包括多个客户端设备,或称为用户装置设备(ue),通常称为ue或客户端设备148,代表每个站点内的各种无线使能设备。例如,多个ue 148a-1到148a-n目前位于站点102a。同样地,多个ue 148n-1到148n-n目前位于站点102n。每个ue 148可以是任何类型的无线客户端设备,包括但不限于移动设备,例如智能手机、平板电脑或笔记本电脑、个人数字助理(pda)、无线终端、智能手表、智能戒指或其他可穿戴设备。ue 148还可包括有线客户端侧设备,例如物联网设备(例如打印机、安全设备、环境传感器)或连接到有线网络并被配置为通过一个或多个无线网络106进行通信的任何其他设备。
26.为了向ue 148提供无线网络服务和/或通过无线网络106进行通信,ap 142和站点102的其他有线客户端侧设备通过物理线缆(例如以太网线缆)直接或间接地连接到一个或多个网络设备(例如交换机、路由器等)。在图1a的示例中,站点102a包括交换机146a,站点102a的每个ap142a-1到142a-m都连接到该交换机。同样地,站点102n包括交换机146n,站点102n的每个ap 142n-1到142n-m都连接到这个交换机。虽然如图1a所示,似乎每个站点102包括单个交换机146,并且给定站点102的所有ap 142都连接到该单个交换机146,但在其他示例中,每个站点102可以包括更多或更少的交换机和/或路由器。此外,给定站点的ap和其他有线客户端侧设备可以被连接到两个或更多的交换机和/或路由器。此外,一个站点的两个或更多的交换机可以相互连接和/或连接到两个或更多的路由器,例如,通过轴辐(中心-分支,hub-and-spoke)架构中的网状(mesh)或部分网状拓扑。在一些示例中,相互连接的交换机和路由器在站点102上包括有线局域网(lan)来承载无线网络106。
27.示例网络系统100还包括各种连网组件,用于在有线网络内提供连网服务,包括例如,用于认证用户和/或ue 148的认证、授权和计费(aaa)服务器110,用于在认证时动态分配网络地址(例如ip地址)给ue 148的动态主机配置协议(dhcp)服务器116,用于将域名解析为网络地址的域名系统(dns)服务器122,多个服务器128a至128x(统称为“服务器128”)(例如,web服务器、数据库服务器、文件服务器等),以及网络管理系统(nms)130。如图1a所
示,网络100的各种设备和系统通过一个或多个网络(例如互联网和/或企业内网)134耦接在一起。
28.在图1a的示例中,nms 130是基于云的计算平台,其管理一个或多个站点102a至102n处的无线网络106a至106n。如本文进一步描述的,nms 130提供了本公开的集成的管理工具套件以及实现各种技术。总体来说,nms 130可以提供基于云的平台,用于无线网络数据采集、监测、活动日志记录、报告、预测分析、网络异常识别和警报生成。在一些示例中,nms 130向与管理设备111交互和/或操作管理设备111的站点或网络管理员(“admin”)输出关于无线网络问题的通知(例如警报、警告、仪表板上的图形指示符、日志消息、文本/sms消息、电子邮件消息等)和/或建议。此外,在某些示例中,nms 130响应于从与管理设备111交互和/或操作管理设备的管理员收到的配置输入而操作。
29.管理员和管理设备111可以包括it人员和与有线网络边缘处的交换机146和/或站点102相关联的管理员计算设备。管理设备111可以被实现为任何适合于呈现输出和/或接受用户输入的设备。例如,管理设备111可以包括显示器。管理设备111可以是计算系统,例如由用户和/或管理员操作的移动或非移动计算设备。例如,基于本公开的一个或多个方面,管理设备111可以代表工作站、膝上型电脑或笔记本电脑、台式电脑、平板电脑或任何其他可由用户操作的和/或呈现用户界面的计算设备。管理设备111可以与nms 130在物理上分开和/或位于不同的位置,使得管理设备111可以经由网络134或其他通信手段与nms 130通信。
30.在某些示例中,一个或多个nas设备(例如ap 142、交换机146或路由器)可以经由物理线缆(例如以太网线缆)连接到边缘设备150a至150n。边缘设备150包括云管理的、无线局域网(lan)控制器。边缘设备150中的每一个可以在站点102处包含本地部署设备,该设备与nms130通信,以将某些微服务从nms 130扩展到本地部署nas设备,同时使用nms 130及其分布式软件架构进行可扩展和弹性的操作、管理、故障排除和分析。
31.网络系统100的每一个网络设备(例如服务器110、116、122和/或128、ap 142、ue 148、交换机146)以及附接到或形成网络系统100的一部分的任何其他服务器或设备,都可以包含系统日志或错误日志模块,这些网络设备中的每一个在系统日志或错误日志模块中记录了网络设备的状态,包括正常运行状态和错误状况。在本公开中,网络系统100的一个或多个网络设备(例如服务器110、116、122和/或128、ap 142、ue 148和交换机146)当其属于与nms 130不同的实体和/或与nms 130不同的实体相关联时,可以被认为是“第三方”网络设备,因而nms 130不会接收、收集或以其他方式访问第三方网络设备的记录状态和其他数据。在某些示例中,边缘设备150可以提供一代理,第三方网络设备的记录状态和其他数据可以通过该代理被报告给nms 130。
32.在一些示例中,nms 130监测网络数据137(例如,分别从每个站点102a至102n的无线网络106a至106n接收的一个或多个服务水平期望(sle)度量),并管理网络资源(例如每个站点的ap 142),以向站点的终端用户、iot设备和客户端提供高质量的无线体验。例如,nms 130可以包括虚拟网络助理(vna)133,该vna 133实现了事件处理平台,用于为it运营提供实时洞察和简化故障排除,并自动采取纠正动作或提供建议,以主动解决无线网络问题。例如,vna 133可以包括事件处理平台,该平台被配置为处理来自与网络134内的节点和/或ap 142相关的传感器和/或代理的网络数据137的数百或数千个并发流。例如,基于本
公开描述的各种示例,nms 130的vna 133可以包括底层分析和网络错误识别引擎和警报系统。vna 133的底层分析引擎可以将历史数据和模型应用于入站事件流以计算断言,例如识别的异常或预测构成网络错误状况的事件的发生。此外,vna 133可以提供实时警报和报告,以经由管理设备111向站点或网络管理员通知任何预测事件、异常、趋势,并可以执行根本原因分析和自动或辅助错误补救。在一些示例中,nms 130的vna 133可以应用机器学习技术来识别从网络数据137的流中检测或预测的错误状况的根本原因。如果根本原因可以自动解决,vna 133可以调用一个或多个纠正动作来纠正错误状况的根本原因,从而自动改善底层sle度量,也自动改善用户体验。
33.由nms 130的vna 133实施的操作的进一步示例细节描述在:公开于2017年11月28日的美国专利第9,832,082号,标题为“monitoring wireless access point events”;公开于2021年9月30日的美国专利公开第us 2021/0306201号,标题为“network system fault resolution using amachine learning model”;公开于2021年4月20日的美国专利第10,985,969号,标题为“systems and methods for a virtual network assistant”;公开于2021年3月23日的美国专利第10,958,585号,标题为“methods and apparatus for facilitating fault detection and/or predictive fault detection”;公开于2021年3月23日的美国专利第10,958,537号,标题为“method for spatio-temporal modeling”;以及公开于2020年12月8日的美国专利第10,862,742号,标题为“method for conveying ap error codes over ble advertisements”,所有内容均通过引用完整纳入本文。
34.在操作中,nms 130观察、收集和/或接收网络数据137,这些数据可以采取例如从消息、计数器和统计中提取的数据形式。基于一个特定的实施例,计算设备是nms 130的一部分。基于其他实施例,nms 130可以包括一个或多个计算设备、专用服务器、虚拟机、容器、服务或用于执行本公开所述技术的其他形式的环境。类似地,实现vna 133的计算资源和组件可以是nms 130的一部分,可以在其他服务器或执行环境上执行,或可以分布到网络134内的节点(例如,路由器、交换机、控制器、网关等)。
35.基于本公开的一项或多项技术,nms 130被配置为使用从客户端设备(例如,ue 148之一)到基于云的应用程序服务器的应用程序会话专用拓扑,以应用程序会话级别提供粒度的故障排除工作流。在基于云的应用程序的应用程序会话(例如,voip或视频会议呼叫、流媒体视频观看会话或游戏会话)期间,运行该应用程序的客户端设备148通过一个或多个ap设备142、有线网络边缘处的一个或多个交换机146和网络134内的一个或多个节点(例如,路由器、交换机、控制器、网关等)交换数据,以到达基于云的应用程序服务器。
36.基于本公开的技术,对于特定的应用程序会话,vna 133的应用程序会话故障排除引擎135基于从在特定应用程序会话的持续期间内涉及特定的应用程序会话的网络设备子集(例如,客户端设备148,ap设备142,交换机146,和/或网络节点)接收到的网络数据137生成拓扑。例如,时态图数据库138被配置为存储以应用程序会话级别粒度在一段延长的时间段内(例如数周或数月)从客户端设备148、ap 142、交换机146和/或网络134内的其他网络节点收集的历史遥测数据中提取的网络系统100的连接和实体信息。
37.vna 133的应用程序会话故障排除引擎135可以基于从时态图数据库138中检索到的特定应用程序会话的实体和连接信息,为该特定应用程序会话构建应用程序会话专用拓扑。通过这种方式,本公开的技术可以实现特定应用程序会话的回溯查找故障排除,即使当
前网络拓扑在特定应用程序会话结束后发生了变化,或者当前应用程序会话没有经历与特定应用程序会话相同的问题。
38.所公开的技术通过识别在特定应用程序会话持续期间内涉及特定应用程序会话的网络设备子集中的一个或多个的连接问题,实现对特定应用程序会话的故障排除。例如,vna 133的应用程序会话故障排除引擎135可以生成代表用户界面的数据,以向用户(例如,使用管理设备111的网络管理员或站点)提供应用程序会话专用拓扑的可视化,包括颜色编码、图标或在特定应用程序会话持续期间内拓扑内的连接问题的其他标记。为响应用户输入选择表示被识别为在特定应用程序会话期间有连接问题的网络设备的图标,vna133的应用程序会话故障排除引擎135可以进一步生成针对该网络设备的故障排除用户界面,或可以将用户重定向到特定于该网络设备的客户洞察或推荐动作用户界面。
39.此外,本公开的技术使得能够识别涉及特定应用程序会话的第三方应用程序服务器、第三方服务提供商服务器和其他第三方网络设备,以提供从客户端设备到基于云的应用程序服务器的完整拓扑。例如,vna 133的应用程序会话故障排除引擎135可以基于在特定应用程序会话期间从交换机、路由器和/或网关接收到的网络数据137中包含的上行链路数据(例如lldp通告)来确定哪些交换机、路由器和/或网关连接到第三方应用程序服务器、第三方服务提供商服务器或其他第三方网络设备。然后,vna133的应用程序会话故障排除引擎135可以确定第三方网络设备的实体id数据(例如,ip地址或接口地址)。
40.在某些示例中,vna133的应用程序会话故障排除引擎135可以与第三方应用程序/服务性能监测(apm)供应商进行一些集成,以检索与第三方网络设备相关的洞察数据,以帮助确定影响用户的网络问题的根本原因。例如,当用户遇到在线应用程序或服务(如microsoft)的质量问题时,可以是服务本身(例如teams)或服务提供商(例如comcast)出现故障或遇到问题。如上所述,nms 130不接收、收集或以其他方式访问所记录的第三方网络设备的状态和其他数据。相反,nms 130可以利用来自第三方apm供应商的洞察数据来执行故障排除,并确定网络问题的根本原因。
41.nms 130可以以两种不同的方式处理第三方集成:按需或主动。对于按需的第三方集成,应用程序会话故障排除引擎135可以通过api查询第三方apm供应商的在线应用服务和/或服务提供商的洞察数据,以响应遇到问题的特定应用程序会话的故障排除请求。对于主动的第三方集成,应用程序会话故障排除引擎135可以主动向第三方apm供应商查询在线应用服务和/或服务提供商的洞察数据,以对在线应用服务和/或服务提供商进行监测和检测。
42.在一些示例中,站点或网络管理员,例如,使用管理设备111,可以通过vna133的会话助理引擎136发起特定应用程序会话的拓扑可视化和故障排除。会话助理引擎136可以被配置为处理用户输入(例如文本字符串),并生成响应。在某些示例中,会话助理引擎136可包括被配置为处理用户输入的一个或多个自然语言处理器。会话助理引擎136可被配置为模拟人类作为对话伙伴的行为方式进行聊天对话,这可以有助于简化和/或提高管理员监测和控制网络的满意度。
43.基于本公开的一种或多种技术,会话助理引擎136可生成被配置为接收用户输入的会话助理。在特定的用例中,管理员可经由管理设备111,将对特定网络设备和/或特定应用程序会话的查询输入到会话助理引擎136中。会话助理引擎136可以提供平台,在该平台
中,可以向管理员呈现应用程序会话专用拓扑,并且管理员可以利用其与应用程序会话专用拓扑进行交互。
44.例如,会话助理可以接收指示应用程序、持续期间和/或设备识别符的字符串(例如,“来自客户端设备a的故障排除teams call”,其中,“teams call”指示应用程序,“客户端设备a”包含客户端设备识别符;或“过去7天内dc84ap544如何”,其中,“dc84ap544”包含ap设备识别符,以及“7天”表示持续期间)。在某些情况下,会话助理可以收到指示应用程序、持续期间和/或用户识别符的字符串(例如,“故障排除用户b teams call”,其中,“用户b”是客户端设备的用户,“teams call”表示应用程序)。会话助理引擎136可以基于用户输入确定多个网络设备中的特定网络设备,并确定该特定网络设备所涉及的一个或多个应用程序会话。例如,如果在用户输入中向会话助理提供所指示的应用程序和/或所指示的持续期间,会话助理引擎136可以基于此自动过滤特定网络设备的应用程序会话。在用户输入中不包括附加会话识别信息的情况下,会话助理引擎136可识别在默认持续期间内(例如,今天或过去7天)特定网络设备的所有应用程序会话。在用户输入中不包含附加会话识别信息的另一情况下,会话助理引擎136可以过滤掉高质量的应用程序会话,以识别最近或在默认持续期间内经历连接问题的特定网络设备的一个或多个应用程序会话。
45.一旦识别特定的应用程序会话,应用程序会话故障排除引擎135基于从时态图数据库138中检索到的特定应用程序会话的数据,为特定的应用程序会话构建应用程序会话特定拓扑。应用程序会话故障排除引擎135生成代表应用程序会话专用拓扑的数据,以便在会话助理中向使用管理设备111的管理员呈现。可视化包括颜色编码、图标或在特定应用程序会话期间拓扑内的连接问题的其他标记,这是由应用程序会话故障排除引擎135基于存储为网络数据137和/或时态图数据库138的时态数据确定的。在此示例中,使用管理设备111的管理员可以与会话助理中呈现的应用程序会话专用拓扑进行交互,以选择指示拓扑中的被识别为在特定应用程序会话期间具有连接问题的网络设备的图标。响应于选择网络设备,应用程序会话故障排除引擎135可以进一步生成针对该网络设备的故障排除用户界面用于在会话助理内呈现。或者,应用程序会话故障排除引擎135可以将用户重定向到专用于该网络设备的客户洞察或推荐动作用户界面。关于会话助理的附加信息描述见于2022年1月13日提交的美国专利申请第17/647,954号,其标题为“conversational assistant for obtaining network information”(档案号为jnp3538-us/2014-515us01),其全部内容在此通过引用并入本文。
46.本公开的技术提供了一种或多种技术优势和实际应用。例如,该技术能够确定从客户端到云的应用程序会话专用拓扑,从而能够基于与在特定应用程序会话持续期间内特定应用程序会话相关的拓扑和连接问题对特定应用程序会话进行故障排除。这些技术允许回溯查找故障排除,以确定是什么导致了低质量的会话,即使当前的网络拓扑已经改变或问题已经解决。此外,这些技术还能够对特定应用程序会话持续期间内应用程序会话专用拓扑中的任何网络设备经历的影响用户的连接问题进行故障排除(包括根本原因分析)。这包括可以由与nms 130不同的实体所拥有和/或关联的第三方网络设备,因此nms 130不会接收、收集或以其他方式访问第三方网络设备的网络数据。
47.虽然本示例中描述了本公开的技术是由nms 130执行的,但本示例中描述的技术可以由任何其他计算设备、系统和/或服务器执行,并且本公开此方面不受限制。例如,被配
routing system and method”;2019年2月5日公告的美国专利第10,200,264号,题为“link status monitoring based on packet loss detection”;2019年4月30日公告的美国专利第10,277,506号,题为“stateful load balancing in a stateless network”;2019年10月1日公告的美国专利第10,432,522号,题为“network packet flow controller with extended session management”;以及2021年7月27日公告的美国专利第11,075,824号,标题为“in-line performance monitoring”,其中,每一项的全部内容均以引用方式完整并入本文。
53.在某些示例中,ai驱动的nms 130可以实现网络系统100的基于意图的配置和管理,包括构造、表示和执行意图驱动的工作流,以配置和管理与无线网络106、有线lan网络175和/或sd-wan 177相关联的设备。例如,声明性需求表达了网络组件的期望配置,而没有指定确切的本地设备配置和控制流。通过利用声明性需求,可以指定应该完成什么,而不是如何完成。声明性需求可以与命令式指令形成对比,命令式指令描述了实现配置的确切设备配置语法和控制流。通过利用声明性需求而不是命令式指令,用户和/或用户系统减轻了确定实现用户/系统预期结果所需的确切设备配置的负担。例如,当使用来自不同供应商的各种不同类型的设备时,指定和管理精确的命令式指令来配置网络的每个设备往往是困难和繁重的。随着新设备的添加和设备故障的发生,网络设备的类型和种类可以动态变化。管理来自不同供应商的具有不同的配置协议、语法和软件版本的各种不同类型的设备,以配置内聚的设备网络,通常是很难实现的。因此,通过只要求用户/系统指定声明性需求,以指定适用于各种不同类型设备的期望结果,网络设备的管理和配置将变得更加高效。基于意图的网络管理系统的进一步示例细节和技术描述见于题为“intent-based analytics”的美国专利10,756,983和题为“automatically generating an intent-based network model of an existing computer network”的美国专利10,992,543中,通过引用将每一者并入本文。
54.根据本公开中描述的技术,对于特定的应用程序会话,vna 133的应用程序会话故障排除引擎135基于从在特定应用程序会话期间涉及特定应用程序会话的网络设备子集(例如,客户端设备148、支持无线网络106的ap设备,支持有线lan 178的交换机146,以及支持sd-wan 177的路由器187a、187b)接收到的网络数据137生成拓扑。更具体地,应用程序会话故障排除引擎135可以基于从网络的时态图数据库138中检索到的特定应用程序会话的数据构建应用程序会话专用拓扑。时态图数据库138被配置为以应用程序会话级别的粒度存储在一段延长的时间段内(例如数周或数月)从网络设备收集的历史遥测数据中提取的实体和连接信息。本公开的技术可以实现特定应用程序会话的回溯查找故障排除,即使当前网络拓扑在特定应用程序会话之后发生了更改,或者当前应用程序会话没有经历与特定应用程序会话相同的问题。通过这种方式,vna 133为连接到无线网络106和有线lan 175的客户端设备148和可以由数据中心179内的计算资源托管的基于云的应用服务181之间的应用程序会话提供wan保证。
55.图2是基于本公开的一种或多种技术配置的示例接入点(ap)设备200的框图。图2所示的示例接入点200可用于实现本文中所示和描述的关于图1a的ap 142的任何一种。接入点200可以包括,例如,wi-fi,蓝牙和/或蓝牙低功耗(ble)基站或任何其他类型的无线接入点。
56.在图2的示例中,接入点200包括有线接口230,无线接口220a至220b、一个或多个处理器206,存储器212和输入/输出210,通过总线214耦接在一起,各种元件可以通过总线214交换数据和信息。有线接口230表示物理网络接口,包括用于发送和接收网络通信(例如数据包)的接收器232和发送器234。有线接口230通过线缆(例如以太网线缆)将接入点200直接或间接地连接到有线网络设备(诸如图1a中的交换机146中的一个)。
57.第一无线接口220a和第二无线接口220b代表无线网络接口,并且分别包括接收器222a和222b,每个都包括接收天线,接入点200可以通过该天线接收来自无线通信设备(如图1a的ue 148)的无线信号。第一无线接口220a和第二无线接口220b还分别包括发送器224a和224b,分别包括发送天线,接入点200可以通过该天线将无线信号传输到无线通信设备(诸如图1a的ue 148)。在一些示例中,第一无线接口220a可包括wi-fi 802.11接口(例如,2.4ghz和/或5ghz),并且第二无线接口220b可包括蓝牙接口和/或蓝牙低能耗(ble)接口。
58.处理器206是可编程的基于硬件的处理器,被配置为执行软件指令,例如用于定义软件或计算机程序的指令,该指令存储到计算机可读存储介质(例如存储器212)中,例如非瞬时计算机可读介质,包括存储设备(例如磁盘驱动器或光驱)或存储器(例如闪存或ram)或任何其他类型的易失性或非易失性存储器,存储指令以使一个或多个处理器206执行本文所述的技术。
59.存储器212包括一个或多个被配置来存储与接入点200操作相关的编程模块和/或数据的设备。例如,存储器212可包括计算机可读存储介质,例如包括存储设备(例如磁盘驱动器或光驱)或存储器(例如闪存或ram)或任何其他类型的易失性或非易失性存储器的非瞬时计算机可读存储介质,该存储设备存储指令以使一个或多个处理器206执行本文所述的技术。
60.在本示例中,存储器212存储可执行软件,包括应用程序编程接口(api)240、通信管理器242、配置/无线电设置250、设备状态日志252和数据254。设备状态日志252包含专用于接入点200的事件列表。这些事件可以包括正常事件和错误事件的日志,例如存储器状态、重启(reboot)或重新启动(restart)事件、崩溃事件、云断开与自恢复事件、低链路速度或链路速度振荡事件、以太网端口状态、以太网接口数据包错误、升级失败事件、固件升级事件、配置更改等,以及每个事件的时间和日期戳。日志控制器255基于来自nms 130的指令确定设备的日志级别。数据254可存储接入点200使用和/或产生的任何数据,包括从ue 148收集的数据,例如用于计算一个或多个sle度量的数据,该数据由接入点200传输,用于由nms 130对无线网络106a进行基于云的管理。
61.输入/输出(i/o)210表示能够与用户交互的物理硬件组件,例如按钮、显示器等。虽然没有显示,存储器212通常存储可执行软件,用于关于通过i/o 210接收的输入控制用户界面。通信管理器242包括程序代码,当由处理器206执行时,允许接入点200通过任何接口230和/或220a至220c与ue 148和/或网络134通信。配置设置250包括接入点200的任何设备设置,例如每个无线接口220a至220c的无线电设置。这些设置可以手动配置,也可以由nms 130远程监测和管理,以定期(例如,每小时或每天)优化无线网络性能。
62.如本文所述,ap设备200可以测量来自状态日志252的网络数据并报告至nms 130。网络数据可以包括事件数据、遥测数据和/或其他sle相关的数据。网络数据可包括指示无
线网络性能和/或状态的各种参数。这些参数可以由无线网络中的一个或多个ue设备和/或一个或多个ap测量和/或确定。nms 130可以基于从无线网络中的ap接收到的sle相关数据来确定一个或多个sle度量,并将sle度量存储为网络数据137(图1a)。nms 130可以进一步更新网络的时态图数据库138(图1a),以包括随着时间的推移从无线网络中的ap接收到的遥测数据,或至少从遥测数据中提取的实体和连接信息。
63.图3是基于本公开的一项或多项技术的示例网络管理系统(nms)300的框图,该nms 300被配置为使用从客户端设备到基于云的应用程序服务器的应用程序会话专用拓扑,以应用程序会话级别提供粒度的故障排除工作流。nms 300可用于实现例如图1a至图1b中的nms 130。在这样的示例中,nms 300分别负责监测和管理站点102a至102n的一个或多个无线网络106a至106n。
64.nms 300包括通信接口330、一个或多个处理器306、用户界面310、存储器312和数据库318。各种元件通过总线314耦接在一起,各种元件可以在总线上交换数据和信息。在一些示例中,nms 300接收来自客户端设备148,ap 142,交换机146和网络134内的其他网络节点(例如,图1b的路由器187)中的一者或多者的数据,该数据可用于计算一个或多个sle度量和/或更新时态图数据库317。nms 300分析这些数据,用于无线网络106a至106n的基于云的管理。接收到的数据作为网络数据316存储在数据库318中,接收到的数据中包含的遥测数据或至少从遥测数据中提取的实体和连接信息存储在数据库318中的时态图数据库317中。在一些示例中,nms 300可以是图1a所示的另一个服务器的一部分,或者是任何其他服务器的一部分。
65.处理器306执行软件指令(比如用于定义软件或计算机程序的软件指令),存储到计算机可读存储介质(例如存储器312),例如非计算机可读介质包括存储设备(例如磁盘驱动器,或光驱)或存储器(比如闪存或ram)或任何其他类型的易失性或非易失性存储器,存储指令导致一个或多个处理器306执行本文所述的技术。
66.通信接口330可包括例如以太网接口。通信接口330将nms 300耦接到网络和/或互联网(例如图1a所示的任何网络134和/或任何局域网)。通信接口330包括接收器332和发送器334,nms 300通过通信接口330接收来自任何客户端设备148,ap 142,交换机146,服务器110,116,122,128和/或任何其他网络节点、设备或组成诸如图1a所示的网络系统100的一部分的系统的数据和信息,和/或发送数据和信息到任何客户端设备148,ap 142,交换机146,服务器110,116,122,128和/或任何其他网络节点、设备或组成诸如图1a所示的网络系统100的一部分的系统。在本文描述的一些场景中,网络系统100包括由与nms 300不同的实体拥有和/或关联的“第三方”网络设备,nms 300不接收、收集或以其他方式访问来自第三方网络设备的网络数据。
67.nms 300接收到的数据和信息可以包括,例如,从客户端设备ap 148、ap 142、交换机146或其他网络节点(如图1b的路由器187)中的一个或多个接收到的遥测数据、sle相关数据或事件数据,由nms 300用于远程监测无线网络106a至106n的性能和从客户端设备到基于云的应用程序服务器的应用程序会话。nms 300可进一步通过通信接口330将数据传输到任何网络设备(例如客户端设备148、ap 142、交换机146、网络134内的其他网络节点、管理设备111),以远程管理无线网络106a至106n和部分有线网络。
68.存储器312包括一个或多个设备,被配置为存储编程模块和/或与nms 300操作相
关的数据。例如,存储器312可包括计算机可读存储介质,例如包括存储设备(例如磁盘驱动器或光盘驱动器)或存储器(例如闪存或ram)或任何其他类型的易失性或非易失性存储器的非瞬态计算机可读介质,该存储器存储指令,该指令使一个或多个处理器306执行本文所述的技术。
69.在本示例中,存储器312包括api 320、sle模块322、虚拟网络助理(vna)/ai引擎350和无线电资源管理器(rrm)360。基于所公开的技术,vna/ai引擎350包括应用程序会话故障排除引擎352,其基于从时态图数据库317检索的特定应用程序会话的数据,为特定应用程序会话构建应用程序会话专用拓扑。在一些示例中,应用程序会话故障排除引擎352将ml模型380应用于网络数据316和/或时态图数据库317,通过识别涉及特定应用程序会话的网络设备子集中的一个或多个的连接问题的根本原因,执行特定应用程序会话的故障排除。nms 300还可以包括任何其他编程模块、软件引擎和/或接口,被配置为远程监测和管理无线网络106a至106n和部分有线网络,包括远程监测和管理任何ap 142/200,交换机146,或其他网络设备(例如图1b的路由器187)。
70.sle模块322能够为每个网络106a至106n的sle度量设置和跟踪阈值。sle模块322进一步分析由ap(例如在每个无线网络106a至106n中来自ue的任何ap 142)收集的sle相关数据。例如,ap 142a-1到142a-n从当前连接到无线网络106a的ue 148a-1到148a-n收集sle相关数据。这些数据被传输到nms 300,由sle模块322执行,以确定当前连接到无线网络106a的每个ue 148a-1到148a-n的一个或多个sle度量。这些数据,以及无线网络106a中一个或多个ap 142a-1到142a-n收集的任何网络数据,被传输到nms 300并被存储为(例如)数据库318中的网络数据316。
71.rrm引擎360监测每个站点102a至102n的一个或多个度量,以便学习和优化每个站点的rf环境。例如,rrm引擎360可以监测在站点102无线网络106的覆盖和容量sle度量,以便识别有关无线网络106中的sle覆盖和/或容量的潜在问题,并对每个站点的接入点的无线电设置进行调整,以解决已识别的问题。例如,rrm引擎360可以确定每个网络106a至106n中所有ap 142的信道和发射功率分布。例如,rrm引擎360可以监测事件、功率、信道、带宽和连接到每个ap的客户端数量。rrm引擎360可以进一步自动更改或更新站点102处的一个或多个ap142的配置,目的是提高覆盖率和容量sle度量,从而为用户提供改进的无线体验。
72.vna/ai引擎350分析从网络设备接收到的数据以及其自身的数据,以识别何时在网络设备之一遇到不希望至异常的状态。例如,vna/ai引擎350可以识别任何不希望的或异常状态的根本原因,例如,指示一个或多个网络设备的连接问题的任何不良sle度量。此外,vna/ai引擎350可以自动调用一个或多个纠正动作,以解决一个或多个不良sle度量的识别根本原因。vna/ai引擎350可以自动调用的纠正动作的示例可以包括但不限于,调用rrm 360来重启一个或多个ap,调整/修改专门ap中特定无线电的发射功率,为专门ap添加ssid配置,改变ap或一组ap的信道等。纠正动作可以还包括重新启动交换机和/或路由器,调用下载新软件到ap、交换机或路由器等。这些纠正动作仅供举例之用,而本公开不限于此方面。如果没有自动纠正动作或不能充分解决根本原因,vna/ai引擎350可以主动提供通知,包括it人员(例如,使用管理设备111的站点或网络管理员)应采取的建议纠正动作以解决网络错误。
73.基于云的管理无线网络中的问题是如何在流会话级别对高用户敏感性的应用程
序(例如voip应用程序,流视频应用程序,游戏应用程序或视频会议应用程序)进行故障排除并改善用户体验。高用户敏感性应用程序的当前行业标准是提供语音或视频会话的质量的总体分数(即,具有1到5分范围的平均意见分数(mos))。会话的质量分数通常是单独呈现的,不需要附加的分析或排除故障来识别低质量分数的根本原因。
74.基于本公开的一种或多种技术,vna/ai引擎350被配置为使用从客户端到云的应用程序会话专用拓扑,以应用程序会话级别提供粒度的故障排除工作流。对于特定的应用程序会话,应用程序会话故障排除引擎352生成在特定应用程序会话的持续期间内涉及特定应用程序会话的网络设备和网络设备之间的连接的拓扑。应用程序会话专用拓扑是基于在特定应用程序会话持续期间内从网络设备(如客户端设备148、ap设备142、交换机146和图1b中的路由器187等其他网络节点)接收到的遥测数据构建的。应用程序会话故障排除引擎352实现了应用程序会话专用拓扑的可视化,包括颜色编码、图标或在特定应用程序会话持续期间内拓扑内的连接问题的其他标记。
75.时态图数据库317被配置为以应用程序会话级别的粒度存储在一段延长的时间段内(例如数周或数月)的来自网络内的连接和实体信息,这些连接和实体信息是从nms 300从客户端设备148、ap 142、交换机146和/或网络134内的其他网络节点收集的历史遥测数据中提取的。连接信息可以代表不同类型的连接,包括无线、有线和逻辑链路,如sd-wan设备的对等路径或ipsec隧道,例如图1b中的sd-wan 177的路由器187。实体信息可以代表不同类型的网络设备,包括客户端设备、ap设备、交换机、其他网络节点(如路由和网关)、第三方网络设备以及运行在网络设备上的应用程序。nms 300使用应用程序会话级别的连接和实体信息来更新时态图数据库317,其中,该图代表一段时间内应用程序会话级别的网络拓扑。
76.应用程序会话包括与该应用程序的用户会话,例如,voip或视频会议呼叫、流视频观看会话或游戏会话。应用程序会话可以包括多个应用程序流(例如,10s到100s的应用程序流),每个应用程序流包含应用程序会话期间网络设备之间的网络级别流(例如,由5元组定义)。例如,在一个小时长的voip通话中,运行应用程序的客户端设备可以连接到多个不同的ap设备(例如,如果客户端设备在会话期间移动),并生成应用程序会话的多个应用程序流。此外,每个ap设备可以连接到交换机、路由器和/或网关、直到基于云的应用程序服务器中的一个或多个,其中,每个新连接可以包含应用程序会话的另一个应用程序流。
77.应用程序会话故障排除引擎352将已识别的应用程序会话的多个应用程序流关联,并使用应用程序流数据来确定网络内的与在应用程序会话持续期间内的应用程序会话相关联的网络设备子集。然后,应用程序会话故障排除引擎352从时态图数据库317中检索运行应用程序的客户端设备在应用程序会话持续期间内连接到的所有ap设备、交换机、路由器和/或网关以及基于云的应用程序服务器的连接和实体信息。
78.应用程序会话故障排除引擎352可以基于从时态图数据库317检索到的应用程序会话的实体和连接信息,为应用程序会话构建应用程序会话专用拓扑。通过这种方式,本公开的技术可以实现应用程序会话的回溯查找故障排除,即使当前网络拓扑在特定应用程序会话结束后发生了变化,或者当前应用程序会话没有经历与特定应用程序会话相同的问题。
79.应用程序会话故障排除引擎352可以通过识别在特定应用程序会话持续期间内涉
及特定应用程序会话的网络设备子集的一个或多个的连接问题,进一步实现应用程序会话的故障排除。例如,应用程序会话故障排除引擎352分析涉及特定应用程序会话的网络设备子集的网络数据316,以识别涉及特定应用程序会话的网络设备子集中的一个或多个的连接问题的根本原因。更具体地,应用程序会话故障排除引擎352可以分析包含在或派生自网络数据316中的事件数据,以确定是否存在连接问题。在某些场景下,应用程序会话故障排除引擎352可以将至少一部分网络数据316应用到ml模型380,以确定连接问题的根本原因。
80.对于涉及特定应用程序会话的每个不同网络设备来说,用于识别连接问题和连接问题的根本原因的事件数据可以是不同的。例如,应用程序会话故障排除引擎352可以分析应用程序活动事件数据,以识别在基于云的应用程序服务器上运行的应用程序引起的连接问题。应用程序会话故障排除引擎352可以分析预连接问题(如dns、dhcp和地址解析协议(arp)问题),以识别客户端设备148/400引起的连接问题。应用程序会话故障排除引擎352可以分析ap健康状况、无线电健康状况、预连接问题、rf问题和/或配置问题,以识别由接入点142/200引起的连接问题。应用程序会话故障排除引擎352可以分析交换机健康状况、线缆问题、缺失虚拟局域网(vlan)、拥塞和/或配置问题,以识别交换机146引起的连接问题。应用程序会话故障排除引擎352可以分析网关健康状况、wan链路和/或配置问题,以识别由sd-wan 177的网关187a、187b或路由器引起的连接问题。
81.应用程序会话故障排除引擎352可以生成代表用户界面的数据,以提供给用户(例如,使用管理设备111的站点或网络管理员)应用程序会话专用拓扑的可视化,包括颜色编码,图标,或在特定应用程序会话期间的拓扑内的连接问题的其他标记。响应用户输入选择表示被识别为在特定应用程序会话期间有连接问题的网络设备的图标,应用程序会话故障排除引擎352可以进一步生成针对该网络设备的故障排除用户界面,或可以将用户重定向到特定于网络设备的客户洞察或推荐动作用户界面。应用程序会话故障排除引擎352可以利用api将来自时态图数据库317的适当数据暴露给用户界面,以构建并可视化针对特定应用程序会话的应用程序会话专用拓扑。
82.此外,应用程序会话故障排除引擎352可以实现识别涉及特定应用程序会话的第三方应用程序服务器、第三方服务提供商服务器和其他第三方网络设备,以提供从客户端设备到基于云的应用程序服务器的完整拓扑。例如,应用程序会话故障排除引擎352可以基于特定应用程序会话期间从交换机、路由器和/或网关接收到的网络数据316中包含的上行链路数据(例如lldp通告)来确定哪些交换机、路由器和/或网关连接到第三方应用程序服务器、第三方服务提供商服务器或其他第三方网络设备。应用程序会话故障排除引擎352随后可以确定第三方网络设备的实体id数据(例如,ip地址或接口地址)。在一些示例中,应用程序会话故障排除引擎352可以与apm供应商有一些集成,通过api检索在线应用服务和/或服务提供商的洞察数据,以确定应用服务和/或服务提供商是否故障或遇到问题。
83.在一些示例中,ml模型380可以包含监督ml模型,该监督ml模型使用从网络设备(例如,客户端设备,ap,交换机和/或其他网络节点)接收到的预收集的、标记的网络数据组成的训练数据进行训练,以识别涉及特定应用程序会话的网络设备子集的一个或多个网络设备的连接问题的根本原因。监督ml模型可以包括逻辑回归、朴素贝叶斯(bayesian)、支持向量机(svm)等中的一种。在其他示例中,ml模型380可以包含无监督ml模型。虽然没有在图3中显示,但在一些示例中,数据库318可以存储训练数据,并且vna/ai引
擎350或专用的训练模块可以被配置为基于训练数据训练ml模型380,以确定训练数据的一个或多个特征的适当权重。
84.在涉及应用程序会话的一个或多个网络设备中检测到连接问题的情况下,应用程序会话故障排除引擎352生成代表用户界面的数据以提供给用户(例如,站点或使用管理设备111的网络管理员)应用程序会话专用拓扑的可视化,包括颜色编码,图标,或在特定应用程序会话持续期间拓扑内的连接问题的其他标记。在一些示例中,vna/ai引擎350可以基于检测到的连接问题和/或为检测到的连接问题确定的根本原因来确定建议的行动。vna/ai引擎350可以经由用户界面310、api 320、网页钩子(webhook)或电子邮件中的一个或多个通过通信接口330输出连接问题和/或连接问题的根本原因的通知,以便在管理员的管理设备111上显示。
85.在某些示例中,站点或网络管理员(例如,使用管理设备111)可以通过会话助理引擎356启动特定应用程序会话的拓扑可视化和故障排除。会话助理引擎356可以被配置为处理用户输入(如文本字符串),并生成响应。在某些示例中,会话助理引擎356可包括被配置为处理用户输入的一个或多个自然语言处理器。会话助理引擎356可被配置为进行模拟人类作为对话伙伴的行为方式的聊天对话,这可以有助于简化和/或提高管理员监测和控制网络的满意度。
86.基于本公开的一种或多种技术,会话助理引擎356可生成被配置为接收用户输入的会话助理。在特定的用例中,管理员通过管理设备111,可以将对特定网络设备和/或特定应用程序会话的查询输入到会话助理引擎356中。会话助理引擎356可以提供平台,在这个平台中向管理员呈现应用程序会话专用拓扑,并且管理员可以利用该平台与应用程序会话专用拓扑进行交互。
87.例如,会话助理可以接收指示应用程序、持续期间和/或设备识别符的字符串(例如,“来自客户端设备a的故障排除teams call”,其中,“teams call”指示应用程序,“客户端设备a”包含客户端设备识别符;或“过去7天内dc84ap544如何”,其中,“dc84ap544”包含ap设备识别符,以及“7天”表示持续期间)。在某些情况下,会话助理可以收到指示应用程序、持续期间和/或用户识别符的字符串(例如,“故障排除用户b teams call”,其中,“用户b”是客户端设备的用户,“teams call”表示应用程序)。会话助理引擎356可以基于用户输入确定多个网络设备中的特定网络设备,并确定特定网络设备所涉及的一个或多个应用程序会话。例如,如果在向会话助理的用户输入中有所指示的应用程序和/或所指示的持续期间,会话助理引擎356可以基于所指示的应用程序和/或所指示的持续期间自动过滤特定网络设备的应用程序会话。在用户输入中不包括附加会话识别信息的情况下,会话助理引擎356可识别在默认持续期间内(例如,今天或过去7天)的特定网络设备的所有应用程序会话。在用户输入中不包含附加会话识别信息的另一情况下,会话助理引擎356可以过滤掉高质量的应用程序会话,以识别最近或在默认持续期间内经历连接问题的特定网络设备的一个或多个应用程序会话。
88.一旦识别特定的应用程序会话,应用程序会话故障排除引擎352基于从时态图数据库317中检索到的特定应用程序会话的数据,为特定的应用程序会话构建应用程序会话专用拓扑。应用程序会话故障排除引擎352生成代表应用程序会话专用拓扑的数据,以便在会话助理中向使用管理设备111的管理员呈现。可视化包括颜色编码、图标或在特定应用程
序会话期间拓扑内的连接问题的其他标记,这是由应用程序会话故障排除引擎352基于存储为网络数据316和/或时态图数据库317的时态数据确定的。在此示例中,使用管理设备111的管理员可以与会话助理中呈现的应用程序会话专用拓扑进行交互,以选择指示拓扑中的被识别为在特定应用程序会话期间具有连接问题的的网络设备的图标。响应于选择网络设备,应用程序会话故障排除引擎352可以进一步生成针对该网络设备的故障排除用户界面,用于在会话助理内呈现。或者,应用程序会话故障排除引擎352可以将用户重定向到专用于该网络设备的客户洞察或推荐动作用户界面。
89.本公开的技术提供了一种或多种技术优势和实际应用。例如,该技术能够确定从客户端到云的应用程序会话专用拓扑,从而能够基于在特定应用程序会话持续期间内与特定应用程序会话相关的拓扑和连接问题对特定应用程序会话进行故障排除。这些技术能够实现回溯查找故障排除,以确定是什么导致了低质量的会话,即使当前的网络拓扑已经改变或问题已经解决。此外,这些技术还能够对特定应用程序会话持续期间内应用程序会话专用拓扑中的任何网络设备经历的影响用户的连接问题进行故障排除(包括根本原因分析)。这包括可以由与nms 130不同的实体拥有和/或关联的第三方网络设备,因此nms 130不会接收、收集或以其他方式访问第三方网络设备的网络数据。
90.虽然本示例中描述了本公开的技术是由nms 130执行的,但本示例中描述的技术可以由任何其他计算设备、系统和/或服务器执行,并且本公开此方面不受限制。例如,被配置为执行本公开技术的功能的一个或多个计算设备可驻留在专用服务器中,或被包括加之nms 130的任何其他服务器中或除了nms 130以外的任何其他服务器中,或可分布在整个网络100中,并可以构成nms 130的一部分,或可以不构成nms 130的一部分。
91.图4显示了示例用户装置(ue)设备400。图4所示的示例ue设备400可用于实现本文中关于图1a所示和描述的任何ue 148。ue设备400可以包括任何类型的无线客户端设备,并且在这方面的本公开不受限制。例如,ue设备400可以包括移动设备,如智能手机、平板电脑或笔记本电脑、个人数字助理(pda)、无线终端、智能手表、智能环或任何其他类型的移动或可穿戴设备。基于本公开所述的技术,ue 400还可以包括有线客户端侧设备,例如,物联网设备,如打印机、安全传感器或设备、环境传感器或连接到有线网络并被配置为通过一个或多个无线网络通信的任何其他设备。
92.ue设备400包括有线接口430、无线接口420a至420c、一个或多个处理器406、存储器412和用户接口410。各种元件通过总线414耦接在一起,各种元件可以在总线414上交换数据和信息。有线接口430表示物理网络接口,并且包括接收器432和发送器434。如果需要,有线接口430可用于直接或间接地将ue 400通过线缆(诸如图1a的以太网线缆144中的一个)耦接到有线网络内的有线网络设备(诸如图1a的交换机146中的一个)。
93.第一无线接口420a、第二无线接口420b和第三无线接口420c分别包括接收器422a,422b和422c,各自包括接收天线,ue 400可以通过该天线接收来自无线通信设备(诸如图1a的ap 142,图2的ap 200,其他ue 148,或被配置用于无线通信的其他设备)的无线信号。第一无线接口420a、第二无线接口420b和第三无线接口420c还分别包括发送器424a、424b和424c,各自包括发送天线,ue 400可以通过该天线发送无线信号到无线通信设备(诸如图1a的ap 142,图2的ap 200,其他ue 148和/或被配置用于无线通信的其他设备)。在一些示例中,第一无线接口420a可包括wi-fi 802.11接口(例如,2.4ghz和/或5ghz),第二无
线接口420b可包括蓝牙接口和/或蓝牙低能耗接口。第三无线接口420c可以包括,例如蜂窝接口,ue设备400可以通过蜂窝接口连接到蜂窝网络。
94.处理器406执行软件指令,比如用于定义软件或计算机程序的软件指令,该软件指令存储到计算机可读存储介质(例如存储器412),例如包括存储设备(例如磁盘驱动器,或光驱)或存储器(例如闪存或ram)或任何其他类型的易失性或非易失性存储器的非临时性计算机可读介质,存储该指令使一个或多个处理器406执行本文所述的技术。
95.存储器412包括一个或多个设备被配置存储编程模块和/或与ue 400的操作相关的数据。例如,存储器412可包括计算机可读存储介质,如包括存储设备(例如磁盘驱动器或光驱)或存储器(例如闪存或ram)或任何其他类型的易失性或非易失性存储器的非瞬态计算机可读介质,该存储器存储指令以使一个或多个处理器406执行本文所述的技术。
96.在本示例中,存储器412包括操作系统440、应用程序442、通信模块444、配置设置450和数据454。通信模块444包括程序代码,当由处理器406执行时,该代码使得ue 400能够使用有线接口430,无线接口420a至420b和/或蜂窝接口450c中的任意一者进行通信。配置设置450包括用于ue 400设置的无线接口420a至420b和/或蜂窝接口420c的任何设备设置。
97.数据454可以包括,例如,状态/错误日志,包括专用于ue 400的事件列表。事件可以包括基于来自nms 130指令按照日志级别的正常事件和错误事件的日志。数据454可以包括ue 400使用和/或产生的任何数据,例如用于计算一个或多个sle度量或识别相关行为数据的数据,这些数据由ue 400收集,并直接传输到nms 130或传输到无线网络106中的任何ap 142以进一步传输到nms 130。
98.如本文所述,ue 400可以测量来自数据454的网络数据并报告至nms130。网络数据可以包括事件数据、遥测数据和/或其他sle相关数据。网络数据可包括指示无线网络的性能和/或状态的各种参数。nms 130可以确定一个或多个sle度量,并基于从无线网络中的ue或客户端设备接收到的sle相关数据,将sle度量存储为网络数据137(图1a)。nms 130可以进一步更新网络的时态图数据库138(图1a),以包括随着时间的推移从无线网络中的ue或客户端设备接收到的遥测数据,或至少从遥测数据中提取的实体和连接信息。
99.nms代理456是nms 130的安装在ue 400上的软件代理。在一些示例中,nms代理456可以作为运行在ue 400上的软件应用程序来实现。nms代理456从ue 400收集包括详细的客户端设备属性在内的信息,包括对ue 400漫游行为的洞察。这些信息提供了对客户端漫游算法的洞察,因为漫游是客户端设备决策。在一些示例中,nms代理456可以在ue 400上显示客户端设备属性。nms代理456通过ue 400连接到的ap设备将客户端设备属性发送给nms 130。nms代理456可以集成到自定义应用程序或作为位置应用程序的一部分。nms代理456可被配置为识别设备连接类型(例如,蜂窝或wi-fi),以及相应的信号强度。例如,nms代理456识别接入点连接及其相应的信号强度。nms代理456可以存储指定ue 400识别的ap的信息以及它们对应的信号强度。nms代理456或ue 400的其他元件也收集关于ue 400与其连接的ap的信息,这也表明ue 400没有与其连接的ap。ue 400的nms代理456通过其连接的ap将此信息发送给nms 130,通过这种方式,ue 400不仅发送ue 400与其连接的ap的信息,还发送ue 400识别并没有与其连接的其他ap的信息,以及它们的信号强度。ap进而将这些信息转发给nms,包括ue 400识别的除该ap自己以外的其他ap的信息。这种附加的粒度级别使nms130,以及最终的网络管理员,能够更好地直接从客户端设备的角度来确定wi-fi体验。
100.在某些示例中,nms代理456进一步丰富了服务级别中利用的客户端设备数据。例如,nms代理456可以超越基本的指纹识别,提供诸如设备类型、制造商和操作系统不同版本等属性的补充细节。在详细的客户端属性中,nms 130可以显示从nms客户端代理456接收到的ue 400的无线电硬件和固件信息。nms代理456能提取的细节越多,vna/ai引擎获得的高级设备分类就越好。nms 130的vna/ai引擎不断地学习,并在其区分设备专用的问题或广泛的设备问题的能力方面变得更加准确,例如明确地识别特定的操作系统版本正在影响某些客户端。
101.在一些示例中,在nms代理456能够将设备的位置,客户端信息和网络连接数据报告至nms之前,nms代理456可以使用户接口410显示提示,提示ue 400的终端用户启用位置许可。然后,nms代理456将开始向nms报告连接数据和位置数据。通过这种方式,客户端设备的最终用户可以控制是否使能nms代理456向nms报告客户端设备信息。
102.图5是示出基于本公开所述技术配置的示例网络节点500的框图。在一个或多个示例中,网络节点500实现了附接到图1a的网络134的设备或服务器(例如交换机146、aaa服务器110、dhcp服务器116、dns服务器122、web服务器128等),或支持图1b的无线网络106、有线lan175或sd-wan 177或数据中心179中的一个或多个的另一个网络设备(例如路由器187)。
103.在此示例中,网络节点500包括有线接口502,例如以太网接口,一个或多个处理器506,输入/输出508,例如显示器、按钮、键盘、小键盘、触摸屏、鼠标等,以及通过总线514耦接在一起的存储器512,各种元件可以在总线514上交换数据和信息。有线接口502将网络节点500耦接到网络上,例如企业网络。虽然通过示例只显示了一个接口,但网络节点可以(通常也确实如此)具有多个通信接口和/或多个通信接口端口。有线接口502包括接收器520和发送器522。
104.存储器512存储可执行软件应用程序532,操作系统540和数据530。数据530可以包括系统日志和/或错误日志,该日志存储了网络节点500的事件数据,包括行为数据。在网络节点500包含“第三方”网络设备的示例中,同一实体不拥有或不访问ap或有线客户端侧设备和网络节点500。因此,在网络节点500是第三方网络设备的示例中,nms 130不接收、收集或以其他方式访问来自网络节点500的网络数据。
105.在网络节点500包含服务器的示例中,网络节点500可以通过接收器520接收数据和信息,例如,包括操作相关信息,例如注册请求、aaa服务、dhcp请求、简单通知服务(sns)查询和网页请求,并通过发送器522发送数据和信息,例如,包括配置信息、认证信息、网页数据等。
106.在网络节点500包含有线网络设备的示例中,网络节点500可以通过有线接口502连接到有线网络边缘内的一个或多个ap或其他有线客户端侧设备(例如物联网设备)。例如,网络节点500可以包括多个有线接口502和/或有线接口502可以包括多个物理端口,以通过各自的以太网线缆连接到站点内的多个ap或其他有线客户端侧设备。在某些示例中,连接到网络节点500的每个ap或其他有线客户端侧设备可以通过网络节点500的有线接口502访问有线网络。在某些示例中,连接到网络节点500的一个或多个ap或其他有线客户端侧设备可以通过各自的以太网线缆和有线接口502的以太网供电(poe)端口从网络节点500汲取电力。
107.在网络节点500包含基于会话的路由器(其采用有状态的、基于会话的路由方案)
call”,其中,“teams call”指示应用程序,“客户端设备a”包含客户端设备识别符)。会话助理引擎136、356可以基于指示的应用程序(本示例中为microsoft)和默认持续期间(本示例中为最近7天)自动过滤特定网络设备的应用程序会话。会话助理用户界面600中的响应612包含声明“故障排除teams。以下是我在9月30日~10月7日之间发现的内容”的字符串。此外,会话助理用户界面600将输出614作为默认持续期间内特定网络设备的所有应用程序会话(在此示例中是teams calls)的列表。例如,应用程序会话620包括从10月7日下午12:01~下午1:03特定网络设备(在本示例中客户端设备a)的teams call。
113.图6b示出了会话助理用户界面600的进一步示例,包括基于选择图6a的输出614中包含的应用程序会话620的用户输入640(在此示例中为“故障排除应用程序teams”),以及应用程序会话620的网络健康输出642(在此示例中为“从10月7日下午12:01~1:03的客户端设备a的teams call”)。在图6b所示的示例中,作为网络健康输出642的一部分,会话助理用户界面600呈现了由会话助理引擎针对所选择的应用程序会话620生成的应用程序会话专用拓扑644。
114.应用程序会话专用拓扑644包括运行该应用程序的客户端设备(“客
115.户端设备a”)、ap设备(“地下室”)、第三方交换机(“未命名交换机”)、5辐路由器(“办公室”)、中心路由器(“首端”)和基于云的应用程序服务
116.器(“teams服务器”),并进一步提供应用程序会话专用拓扑中的每个网络设备的地址。此外,如图6b所示,应用程序会话专用拓扑644包括每个网络设备的性能或连接健康的标记。例如,在一个或多个网络设备(例
117.如,客户端设备(“客户端设备a”)、第三方交换机(“未命名交换机”)、0中心路由器(“头端”)和应用程序服务器(“teams服务器”)上包含对勾的绿色圆圈可以表明在应用程序会话期间这些网络设备没有已知的问题。在一个或多个网络设备(例如,ap设备(“地下室”)和辐路由器(“办公室”)646)上包含的带感叹号的橙色或红色三角形可以分别表明在应用程序会话期间这些应用程序设备存在中度或严重的连接问题。
118.5图6c示出了会话助理用户界面600的另一个示例,包括应用程序会
119.话620的网络健康输出642(在这个示例中为“从10月7日下午12:01~1:03的客户端设备a的teams call),包括基于选择图6b中的应用程序会话专用拓扑644中的辐路由器(“办公室”)646的故障排除用户界面648。
120.针对涉及应用程序会话620的辐路由器646的故障排除用户界面648包括:0由应用程序会话故障排除引擎135/352确定的辐路由器646的连接问题的
121.根本原因。在图6c所示的示例中,故障排除用户界面648指明:第一个根本原因是由于网关(辐路由器(“办公室”)646上的高控制平面cpu使用率而导致的“高cpu控制平面”,第二个根本原因是由于网关(辐路由
122.器(“办公室”)646)和云(应用程序服务器(“teams服务器”)之间的5高延迟而导致的“高网络延迟”。
123.图7a至图7b示出了nms 130/300的示例用户界面,用于可视化应用程序会话专用拓扑和应用程序会话中涉及的ap设备的相关故障排除工作流。
124.图7a示出了示例会话助理用户界面700,包括管理员通过管理设备111发起特定应用程序会话的拓扑可视化和故障排除的查询或用户输入710,以及会话助理引擎136,356产
生的响应或输出712,714。在图7a的示例中,对于会话助理用户界面700的用户输入710包括指明应用程序和用户识别符(即,“故障排除用户b teams call”,其中,“用户b”是客户端设备的用户,“teams call”指明应用程序)。会话助理引擎136,356可以基于指明的应用程序(本示例中为microsoft)自动过滤与用户关联的一个或多个网络设备的应用程序会话,以识别与最近经历连接问题的用户关联的网络设备的一个或多个应用程序会话。会话助理用户界面700内的响应712包含声明“用户b-iphone的ms-teams call体验不好,主要是由于网关辐路由器上异常高的延迟”的字符串。
125.此外,会话助理用户界面700呈现针对已识别的应用程序会话的输出714(在此示例中为“来自客户端用户b-iphone的ms-teams call”)。在图7a所示的示例中,作为输出714的一部分,会话助理用户界面700呈现会话助理引擎136,356针对已识别的应用程序会话所生成的应用程序会话专用拓扑716。应用程序会话专用拓扑716包括运行该应用程序的客户端设备(“iphone”)、两个ap设备(“无线”)718、交换机(“有线”)、网关(“wan”)和基于云的应用程序服务器(“teams”)。此外,如图7a所示,应用程序会话专用拓扑716包括每个网络设备的性能或连接健康的标记。例如,在一个或多个网络设备(例如,客户端设备(“iphone”)、交换机(“有线”)、网关(“wan”)和应用程序服务器(“teams”))上包含的带有对勾的绿色圆圈可以表明:在应用程序会话期间,这些网络设备没有已知的问题。一个或多个网络设备(例如,ap设备(“无线”)718)上包含的带感叹号的橙色三角形可以分别表示在应用程序会话期间这些应用程序设备存在中度连接问题。
126.图7b示出了会话助理用户界面700的进一步示例,包括针对所识别的应用程序会话的输出714(在此示例中为“来自客户端用户b-iphone的ms-teams call”),包括基于选择图7a中的应用程序会话专用拓扑716中的ap设备(“无线”)718的故障排除用户界面720。针对涉及所识别的应用程序会话的第一ap设备(“办公室-美国”)718a的故障排除用户界面720包括:由应用程序会话故障排除引擎135/352确定的第一ap设备718a处的连接问题的根本原因。在图7b所示的示例中,对第一ap路由器718a的故障排除用户界面720指明:第一个根本原因是由于客户端(第一ap路由器718a)离线时fte无效而导致的“联合缓慢”,第二个根本原因是由于上行链路覆盖不对称而导致的“覆盖差”。针对涉及已识别的应用程序会话的第二ap设备(“ap-45厨房”)718b的故障排除用户界面720还将包括由应用程序会话故障排除引擎135/352(如果扩展)确定的第二ap设备718b的连接问题的根本原因。
127.图8示出了nms 300的示例用户界面,用于可视化包括服务提供商服务器的应用程序会话专用拓扑。
128.图8示出了示例会话助理用户界面750,包括来自管理员通过管理设备111发起特定应用程序会话的拓扑可视化和故障排除的查询或用户输入760,以及会话助理引擎产生的输出762。在图8的示例中,对会话助理用户界面750的用户输入760包括指明应用程序、用户识别符和日期的字符串(即,“故障排除4月14日客户端设备c的应用程序ms-teams”,其中,“ms-teams”指明应用程序,“客户端设备c”指明客户端设备识别符,“4月14日”指明日期)。会话助理引擎136,356可以基于指明的应用程序(本示例中为microsoft)自动过滤与用户关联的一个或多个网络设备的应用程序会话,以识别与用户在指定日期所经历的连接问题关联的网络设备的一个或多个应用程序会话。
129.会话助理用户界面750呈现针对所识别的应用程序会话的输出762。在图8所示的
示例中,作为输出762的一部分,会话助理用户界面750呈现了由会话助理引擎136、356为所识别的应用程序会话生成的应用程序会话专用拓扑764。应用程序会话专用拓扑764包括运行该应用程序的客户端设备(“客户端设备c”)、无线ap设备(“无线”)、有线交换机(“有线”)、两个网关设备(“wan”)、服务提供商服务器(“comcast cable”)766和基于云的应用程序服务器(“ms-teams”)。此外,如图8所示,应用程序会话专用拓扑764包括每个网络设备的性能或连接健康的标记。例如,在一个或多个网络设备(例如,客户端设备(“客户端设备c”)、服务提供商服务器(“comcast cable”)766和应用程序服务器(“ms-teams”))上带对勾的绿色圆圈可以表明在应用程序会话期间这些网络设备没有已知的问题。一个或多个网络设备(例如有线交换机(“有线”)、ap设备(“无线”)和网关设备(“wan”))上包含的带感叹号的灰色或红色三角形可以分别表明在应用程序会话期间这些应用程序设备处的中度或严重的连接问题。
130.为了确定并图形化表示第三方网络设备(例如服务提供商服务器766)的连接问题,应用程序会话故障排除引擎136/352可以向第三方apm供应商查询服务提供商服务器766的洞察数据。在一些示例中,应用程序会话故障排除引擎136/352可以在响应请求对已识别的应用程序会话进行故障排除的用户输入760,对第三方apm供应商执行针对服务提供商服务器766的洞察数据的按需查询。在其他示例中,应用程序会话故障排除引擎136/352可以针对服务提供商服务器766的洞察数据主动执行对于第三方apm供应商的查询,以对服务提供商服务器766进行监测。基于检索到的洞察数据,会话助理引擎136,356可以针对涉及所识别的应用程序会话的网络设备(包括诸如服务提供商服务器766的第三方网络设备)生成性能或连接健康的标记。
131.图9示出了网络管理系统(nms)130/300的示例用户界面,用于可视化特定ap设备的一组应用程序会话的故障排除工作流。
132.图9示出了示例会话助理用户界面800,包括来自管理员通过管理设备111发起与特定网络设备相关联的应用程序会话的故障排除的查询或用户输入810,以及会话助理引擎136,356产生的响应或输出812,814。在图9的示例中,对会话助理用户界面800的用户输入810包括指明设备识别符和持续期间的字符串(即,“最近7天内dc84ap544如何”,其中,“dc84ap544”包括ap设备识别符,“7天”指明持续期间)。会话助理引擎136、356可以基于所指明的持续期间(在本示例中为最近7天)自动过滤特定网络设备的应用程序会话,以识别最近7天内经历连接问题的网络设备的一个或多个应用程序会话。
133.会话助理用户界面800中的响应812包含声明“检查dc84ap544。以下是我发现的在11月10日~11月17日之间的内容”的字符串。会话助理用户界面800还包括针对ap设备(“dc84ap544”)的故障排除用户界面814,作为由应用程序会话故障排除引擎135/352确定的ap设备(“dc84ap544”)连接问题的根本原因列表。在图9所示的示例中,故障排除用户界面814指明:第一个根本原因是“联合缓慢”,因为ap的客户端由于传输失败而联合缓慢,第二个根本原因是“ap断开”,因为ap由于没有以太网链路而与云断开(取配置失败),但ap目前处于在线状态,第三个根本原因是由于信号强度弱而“覆盖差”。
134.图10是示出了基于本公开的一种或多种技术的示例操作的流程图,该操作使用从客户端设备到基于云的应用程序服务器的应用程序会话专用拓扑,以应用程序会话级别提供粒度的故障排除工作流。图10的示例操作在此针对图3的nms 300进行描述。在其他示例
中,图10的操作可由其他计算设备(例如图1a至图1b的nms 130)执行。
135.nms 300接收标识在客户端设备上运行的应用程序的应用程序会话的查询,其中,客户端设备包括被配置为在网络中提供客户端到云连接的多个网络设备中的一个(902)。nms 300可将来自所识别的应用程序会话的多个应用程序流的应用程序流数据关联,并基于应用程序会话的应用程序流数据,从应用程序会话持续期间内涉及应用程序会话的多个网络设备中确定网络设备子集。然后,nms 300基于确定的网络设备子集从时态图数据库317中检索针对应用程序会话的实体信息和连接信息(907)。实体信息表示在应用程序会话持续期间内涉及应用程序会话的网络设备子集,并被存储为时态图数据库317的节点。连接信息表示在应用程序会话持续期间内网络设备子集之间的连接,并被存储为时态图数据库317的边。
136.时态图数据库317代表了一段时间内网络的至少一部分在应用程序会话级别粒度上的历史。在某些示例中,nms 300可以从应用程序会话持续期间内从网络设备子集接收到的网络数据316内的遥测数据中提取实体信息和连接信息,并利用针对该应用程序会话的实体信息和连接信息更新时态图数据库317。
137.nms 300基于针对应用程序会话的实体信息和连接信息生成针对该应用程序会话的应用程序会话专用拓扑(912)。应用程序会话专用拓扑可以包括网络设备子集的历史视图和在应用程序会话持续期间网络设备子集之间的连接。nms 300至少基于在应用程序会话期间从网络设备子集接收到的网络数据,识别在应用程序会话期间网络设备子集内的至少一个连接问题(917)。nms 300可执行根本原因分析,以确定应用程序会话期间网络设备子集内至少一个连接问题的根本原因。nms 300可以分析在应用程序会话期间从网络设备子集收到的网络数据316,以识别在应用程序会话的持续期间涉及应用程序会话的一个或多个第三方应用程序服务器,第三方服务提供商服务器,或第三方网络设备。然后,nms 300可以从一个或多个第三方应用程序服务器、第三方服务提供商服务器或第三方网络设备中检索网络数据。
138.nms 300生成代表用户界面310的数据,用于在管理员设备上呈现,用户界面310包括应用程序会话持续期间内应用程序会话专用拓扑的可视化,可视化包括至少一个连接问题的标记(922)。在某些示例中,为生成用户界面310,nms 300生成代表应用程序会话专用拓扑中至少一个网络设备的图标,具有在应用程序会话的持续期间内至少一个连接问题的指示,其中,至少一个连接问题的指示包含颜色、形状或符号中的至少一种。响应于接收到选择代表具有至少一个连接问题的指示的网络设备的图标的用户输入,nms 300可进一步生成代表故障排除用户界面的数据,用于在管理员设备上呈现,故障排除用户界面包括该网络设备的至少一个连接问题的根本原因的至少一个指示。在一些进一步的示例中,nms 300可生成代表会话助理用户界面的数据,包含被配置为接收标识应用程序会话的查询、呈现应用程序会话专用拓扑并接收与应用程序会话专用拓扑交互的用户输入的平台。
139.此处描述的技术可以在硬件、软件、固件或它们的任何组合中实现。被描述为模块、单元或组件的各种特性可以在集成逻辑器件中一起实现,也可以单独实现为分立但可互操作的逻辑器件或其他硬件器件。在某些情况下,电子电路的各种特性可以实现为一个或多个集成电路器件,如集成电路芯片或芯片组。
140.如果以硬件实现,则此公开可涉及诸如处理器或集成电路器件之类的装置,如集
成电路芯片或芯片组。替代地或附加地,如果以软件或固件实现,则该技术可以至少部分地由包含指令的计算机可读数据存储介质实现,这些指令在执行时,可使处理器执行上述的一种或多种方法。例如,计算机可读数据存储介质可存储此类指令以供处理器执行。
141.计算机可读介质可构成计算机程序产品的一部分,该产品可包括包装材料。计算机可读介质可以包括计算机数据存储介质,如随机存取存储器(ram)、只读存储器(rom)、非易失性随机存取存储器(nvram)、电可擦除可编程只读存储器(eeprom)、快闪存储器、磁或光数据存储介质等。在某些示例中,产品可以包含一个或多个计算机可读的存储介质。
142.在某些示例中,计算机可读存储介质可包括非瞬态介质。术语“非瞬态”可表示该存储介质没有体现为载波或传播信号。在某些示例中,非瞬态存储介质可以存储随时间变化的数据(例如,在ram或缓存中)。
143.代码或指令可以是通过包含一个或多个处理器的处理电路(诸如一个或多个数字信号处理器(dsp)、通用微处理器、专用集成电路(asic)、现场可编程门阵列(fpga)或其他等效的集成或分立逻辑电路)执行的软件和/或固件。因此,术语“处理器”,在这里使用可以指任何前述结构或任何其他适合于实现本文所述技术的结构。此外,在某些方面,本公开中所述的功能可在软件模块或硬件模块中提供。

技术特征:
1.一种网络管理系统,包括:存储器,存储从多个网络设备接收的网络数据,其中,所述网络设备被配置为在网络中提供客户端到云的连接;以及一个或多个处理器,与所述存储器耦接,并且所述处理器被配置为:接收标识在客户端设备上运行的应用程序的应用程序会话的查询,其中,所述客户端设备包括所述多个网络设备中的一者;从时态图数据库中检索针对所述应用程序会话的实体信息和连接信息,其中,所述实体信息代表所述多个网络设备中的在所述应用程序会话的持续期间涉及所述应用程序会话的网络设备子集,并且所述实体信息被存储为所述时态图数据库的节点,其中,所述连接信息代表在所述应用程序会话的持续期间所述网络设备子集之间的连接,并且所述连接信息被存储作为所述时态图数据库的边,并且其中,所述时态图数据库代表一段时间内以应用程序会话级别粒度的至少一部分所述网络的历史;基于针对所述应用程序会话的所述实体信息和所述连接信息,生成针对所述应用程序会话的应用程序会话专用拓扑;至少基于在所述应用程序会话期间从所述网络设备子集接收到的网络数据,识别所述应用程序会话期间所述网络设备子集内的至少一个连接问题;以及生成代表用于在管理员设备上呈现的用户界面的数据,所述用户界面包括在所述应用程序会话的持续期间所述应用程序会话专用拓扑的可视化,所述可视化包括所述至少一个连接问题的指示。2.根据权利要求1所述的网络管理系统,其中,所述一个或多个处理器被配置为执行根本原因分析,以确定所述应用程序会话期间所述网络设备子集内的所述至少一个连接问题的根本原因。3.根据权利要求1所述的网络管理系统,其中,所述一个或多个处理器被配置为分析在所述应用程序会话期间从所述网络设备子集接收的所述网络数据,以识别在所述应用程序会话的持续期间涉及所述应用程序会话的一个或多个第三方应用程序服务器、第三方服务提供商服务器或第三方网络设备。4.根据权利要求3所述的网络管理系统,其中,所述一个或多个处理器被配置为从第三方监测供应商检索针对所述一个或多个第三方应用程序服务器、第三方服务提供商服务器或第三方网络设备的洞察数据。5.根据权利要求1所述的网络管理系统,其中,所述应用程序会话专用拓扑包括所述应用程序会话的持续期间所述网络设备子集之间的连接和所述网络设备子集的历史视图。6.根据权利要求1所述的网络管理系统,其中,为了生成代表所述用户界面的数据,所述一个或多个处理器被配置为:生成代表在所述应用程序会话专用拓扑中的具有在所述应用程序会话的持续期间所述至少一个连接问题的指示的至少一个网络设备的图标,其中,所述至少一个连接问题的指示包括颜色、形状或符号中的至少一者。7.根据权利要求6所述的网络管理系统,其中,所述一个或多个处理器被配置为:响应于收到选择代表具有所述至少一个连接问题的指示的网络设备的图标的用户输入,生成代表用于呈现在管理员设备上的故障排除用户界面的数据,所述故障排除用户界面包括所述网络设备处的所述至少一个连接问题的根本原因的至少一个指示。
8.根据权利要求1所述的网络管理系统,其中,所述一个或多个处理器被配置为生成代表会话助理用户界面的数据,所述会话助理用户界面包括被配置为接收标识所述应用程序会话的所述查询、呈现所述应用程序会话专用拓扑并接收与所述应用程序会话专用拓扑交互的用户输入的平台。9.根据权利要求1至8中任一项所述的网络管理系统,其中,所述一个或多个处理器被配置为:关联来自所述应用程序会话的多个应用程序流的应用程序流数据;以及基于所述应用程序会话的所述应用程序流数据,确定所述多个网络设备中的在所述应用程序会话持续期间涉及所述应用程序会话的所述网络设备子集,其中,所述一个或多个处理器被配置为基于所确定的网络设备子集从所述时态图数据库中检索针对所述应用程序会话的所述实体信息和连接信息。10.根据权利要求1至8中任一项所述的网络管理系统,其中,所述一个或多个处理器被配置为:从所述应用程序会话持续期间接收自所述网络设备子集的网络数据内的遥测数据中提取所述实体信息和所述连接信息;以及用针对所述应用程序会话的所述连接信息和实体信息更新所述时态图数据库。11.一种网络管理方法,包括:由网络管理系统接收标识在客户端设备上运行的应用程序的应用程序会话的查询,其中,所述客户端设备包括被配置为在网络中提供客户端到云的连接的多个网络设备中的一者;由所述网络管理设备从时态图数据库中检索针对所述应用程序会话的实体信息和连接信息,其中,所述实体信息代表所述多个网络设备中的在所述应用程序会话的持续期间涉及所述应用程序会话的网络设备子集,并且所述实体信息被存储为所述时态图数据库的节点,其中,所述连接信息代表在所述应用程序会话的持续期间所述网络设备子集之间的连接,并且所述连接信息被存储作为所述时态图数据库的边,并且其中,所述时态图数据库代表一段时间内以应用程序会话级别粒度的至少一部分所述网络的历史;由所述网络管理设备基于针对所述应用程序会话的所述实体信息和所述连接信息,生成针对所述应用程序会话的应用程序会话专用拓扑;由所述网络管理设备至少基于在所述应用程序会话期间从所述网络设备子集接收到的网络数据,识别所述应用程序会话期间所述网络设备子集内的至少一个连接问题;以及由所述网络管理设备生成代表用于在管理员设备上呈现的用户界面的数据,所述用户界面包括在所述应用程序会话的持续期间所述应用程序会话专用拓扑的可视化,所述可视化包括所述至少一个连接问题的指示。12.根据权利要求11所述的网络管理方法,还包括:执行根本原因分析,以确定所述应用程序会话期间所述网络设备子集内的所述至少一个连接问题的根本原因。13.根据权利要求11所述的网络管理方法,还包括:分析在所述应用程序会话期间从所述网络设备子集接收的所述网络数据,以识别在所述应用程序会话的持续期间涉及所述应用程序会话的一个或多个第三方应用程序服务器、第三方服务提供商服务器或第三方网络设备。
14.根据权利要求13所述的网络管理方法,还包括:从第三方监测供应商检索针对所述一个或多个第三方应用程序服务器、第三方服务提供商服务器或第三方网络设备的洞察数据。15.根据权利要求11所述的网络管理方法,其中,所述应用程序会话专用拓扑包括所述应用程序会话的持续期间所述网络设备子集之间的连接和所述网络设备子集的历史视图。16.根据权利要求11所述的网络管理方法,其中,生成代表所述用户界面的数据包括:生成代表在所述应用程序会话专用拓扑中的具有在所述应用程序会话的持续期间所述至少一个连接问题的指示的至少一个网络设备的图标,其中,所述至少一个连接问题的指示包括颜色、形状或符号中的至少一者。17.根据权利要求16所述的网络管理方法,还包括:响应于收到选择代表具有所述至少一个连接问题的指示的网络设备的图标的用户输入,生成代表用于呈现在管理员设备上的故障排除用户界面的数据,所述故障排除用户界面包括所述网络设备处的所述至少一个连接问题的根本原因的至少一个指示。18.根据权利要求11至17中任一项所述的网络管理方法,还包括:关联来自所述应用程序会话的多个应用程序流的应用程序流数据;以及基于所述应用程序会话的所述应用程序流数据,确定所述多个网络设备中的在所述应用程序会话持续期间涉及所述应用程序会话的所述网络设备子集,其中,检索针对所述应用程序会话的所述实体信息和连接信息包括:基于所确定的网络设备子集从所述时态图数据库中检索针对所述应用程序会话的所述实体信息和连接信息。19.根据权利要求11至17中任一项所述的网络管理方法,还包括:从所述应用程序会话持续期间接收自所述网络设备子集的网络数据内的遥测数据中提取所述实体信息和所述连接信息;以及用针对所述应用程序会话的所述连接信息和实体信息更新所述时态图数据库。20.一种指令编码的计算机可读存储介质,用于使网络管理系统的一个或多个处理器执行根据权利要求11至19中任一项所述的网络管理方法。

技术总结
本发明公开了用于应用会话故障排除的应用会话特定的网络拓扑生成。一种网络管理系统,使用从客户端设备到基于云的应用程序服务器的应用程序会话专用拓扑,提供了应用程序会话级别的粒度的故障排除工作流。在基于云的应用程序的应用程序会话期间,运行应用程序的客户端设备通过接入点设备、在有线网络边缘的交换机和网络节点交换数据,以到达基于云的应用程序服务器。对于特定的应用程序会话,NMS基于从特定应用程序会话的持续期间涉及特定的应用程序会话的例如客户端设备,AP设备,交换机,路由器和/或网关的网络设备子集接收到的网络数据生成拓扑。通过这种方式,NMS实现特定应用程序会话的回溯查找故障排除。程序会话的回溯查找故障排除。程序会话的回溯查找故障排除。


技术研发人员:王继生 吴小英 夜杜南段
受保护的技术使用者:瞻博网络公司
技术研发日:2022.12.01
技术公布日:2023/7/22
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐