当前位置:网站首页>NETRCA: AN EFFECTIVE NETWORK FAULT CAUSE LOCALIZATION之论文阅读
NETRCA: AN EFFECTIVE NETWORK FAULT CAUSE LOCALIZATION之论文阅读
2022-06-24 07:54:00 【理心炼丹】
原始题目:NETRCA: AN EFFECTIVE NETWORK FAULT CAUSE LOCALIZATION ALGORITHM
中文翻译:Netrca:一种有效的网络故障原因定位算法
发表时间:2022年2月23日
平台: ICASSP 2022
来源:DAMO Academy, Alibaba Group, Hangzhou, China
文章链接:https://arxiv.org/abs/2202.11269
开源代码:
摘要
定位网络故障的根本原因对网络的运行和维护至关重要。然而,由于复杂的网络架构和无线环境,以及有限的标注数据,准确定位真正的根源是具有挑战性的。在本文中,我们提出了一种新的算法NetRCA来处理这个问题。首先,我们从原始数据中提取有效的衍生特征,考虑时间、方向、属性和交互特征。其次,我们采用多元时间序列相似度和标签传播的方法,从有标签和无标签的数据中生成新的训练数据,以克服有标签样本的不足。再次,我们设计了一个结合XGBoost、规则集学习、属性模型和图算法的集成模型,以充分利用所有数据信息,提高性能。最后,对ICASSP 2022 AIOps 挑战赛的真实数据集进行了实验和分析,以证明我们的方法的优越性和有效性。
Keywords—根因分析,数据增强,时间序列,集成模型,无线网络
4. 结论
本文提出了一种新的算法 NetRCA 来定位网络故障的根本原因。除了经过精心设计的特征工程,我们的算法还采用数据增强来生成新的训练数据,以克服标注样本不足的问题。此外,我们设计了一种集成方法,有效地将不同的模型组合起来,对网络故障进行准确可靠的因果推理。
2. 提出的网络 RCA 框架
2.1. 框架概述
提出的NetRCA算法主要包括三个步骤:1)特征工程,2)数据增强,3)模型集成。NetRCA的框架如图1所示,将在下面的部分中详细阐述。
图1:提出的NetRCA算法框架。
2.2. 特征工程
由于每个样本中的时间戳数量不同,直接使用所有的时间戳训练模型可能会产生偏差,即模型很可能倾向于将重点放在时间戳索引较多的样本上。因此,我们基于从每个样本中提取的特征来训练我们的模型。生成的特征可以大致分为四类:时间特征、方向相关特征、属性特征和交互特征。
我们的模型中使用的一些时间特征是基于数据统计的,其中每个时间戳中的数据都被假定为独立的,包括平均值、最小值、最大值、中位数、十分位数和偏度( skewness)。我们还包含了一些表示时间序列形状的特性,包括使用公共 tsfresh 包生成的峰值数量和变化平均值。
5G网络中采用多天线和多波束成型( beamforming)来增强性能[14,15]。如[16,17]所述,波束成型方向和每个节点之间的距离对网络性能起着至关重要的作用,这对根定位也很重要,特别是在 AIOps Challenge 提供的因果图中,根原因2和根原因3之间。我们认为特征 20 在检测根本原因2和3模型中是一个重要的特征。由于特征 20 给出了每个节点从 0 到 31 的索引,映射为一个 4x8 的位置矩阵,我们首先将每个节点的索引转换为二维坐标,然后通过欧氏距离测量每对节点之间的距离。之后,我们推导出特征 X 和 Y 之间相互关系的特征,分别是特征 61/69/77/85 和特征 28/36/44/52,以便进一步改进。最后,从每个时间切片样本的距离分布中总结出统计特征(如均值、方差、分位数等)用于模型训练。
根据因果图,除特征 0 外,所有节点均导出属性特征。如问题描述所述,这些根本原因最终导致特征 0 的值较低。那么,真正的根本原因及其后代因素对特征 0 当前值的影响将比其他因素更大。因此,我们生成一个新的特征,作为每个特征在预测特征 0 上的重要性分数的估计,详细的推导在2.4节中给出。
生成了 X 和 Y 的二阶相互作用特征。由于特征 X 等于特征 Y 与某些未知因素的比值,我们生成特征 X / Y 来衡量这些未知因素的影响。特别地,我们首先根据问题描述对 X 和 Y中的特征进行分组。对于每一对,我们计算X / Y的比值。最后,我们计算这些比率的统计数据,就像我们计算时间特征一样。
待续
边栏推荐
- [noi Simulation Competition] geiguo and time chicken (structure)
- 【LeetCode】415. String addition
- Lu Qi: I am most optimistic about these four major technology trends
- Numpy numpy中的np.c_和np.r_详解
- 1704. judge whether the two halves of a string are similar
- What is graph neural network? Figure what is the use of neural networks?
- 金仓KFS replicator安装(Oracle-KES)
- 随笔-反思
- Alibaba Senior Software Testing Engineer recommends testers to learn -- Introduction to security testing
- 浮点数表示法(总结自CS61C和CMU CSAPP)
猜你喜欢
华为路由器:ipsec技术
The native applet uses canvas to make posters, which are scaled to the same scale. It is similar to the uniapp, but the writing method is a little different
【牛客】HJ1 字符串最后一个单词的长度
EasyExcel单sheet页与多sheet页写出
华为路由器:GRE技术
嵌入式 | 硬件转软件的几条建议
Target detection series fast r-cnn
深入了解 border
十二、所有功能实现效果演示
【牛客】把字符串转换成整数
随机推荐
金仓KFS replicator安装(Oracle-KES)
从华为WeAutomate数字机器人论坛,看政企领域的“政务新智理”
随笔-反思
Epidemic situation, unemployment, 2022, we shouted to lie down!
KaFormer个人笔记整理
Applet wx show
【LeetCode】387. First unique character in string
Depens:*** but it is not going to be installed
RISC-V架构下 FPU Context 的动态保存和恢复
【牛客】把字符串转换成整数
[e325: attention] VIM editing error
Leetcode -- wrong set
玄铁E906移植----番外0:玄铁C906仿真环境搭建
Redis implements a globally unique ID
A tip to read on Medium for free
Linux MySQL installation
The printed object is [object object]. Solution
1528. rearrange strings
十二、所有功能实现效果演示
I heard that you are still spending money to buy ppt templates from the Internet?