当前位置:网站首页>Time Series Data Augmentation for Deep Learning: A Survey 之论文阅读
Time Series Data Augmentation for Deep Learning: A Survey 之论文阅读
2022-06-24 07:54:00 【理心炼丹】
原始题目:Time Series Data Augmentation for Deep Learning: A Survey
中文翻译:深度学习的时间序列数据增强:综述
发表时间:2022年3月31日
平台:IJCAI 2022-02
来源:DAMO Academy, Alibaba Group, Bellevue, WA, USA
文章链接:https://arxiv.org/pdf/2002.12478.pdf
开源代码:
摘要
深度学习最近在许多时间序列分析任务中表现得非常好。深度神经网络的优越性能很大程度上依赖于大量的训练数据来避免过拟合。然而,许多现实世界的时间序列应用的标记数据可能是有限的,如医学时间序列的分类和 AIOps 的异常检测。作为提高训练数据规模和质量的有效方法,数据增强是深度学习模型成功应用于时间序列数据的关键。本文系统地回顾了不同的时间序列数据增强方法。我们建议对这些方法进行分类,然后通过强调它们的优点和局限性,对这些方法进行结构化审查。我们还实证比较了不同的数据增强方法的不同任务,包括时间序列分类,异常检测和预测。最后,我们讨论并强调了未来的五个方向,以提供有用的研究指导。
6 结论
随着深度学习模型在时间序列数据上的普及,有限的标签数据需要有效的数据增强方法。本文对时间序列数据增强方法在不同任务中的应用进行了综述。我们将回顾的方法分为基本方法和先进方法,总结每个类别的代表性方法,并在典型任务中进行实证比较,并指出未来的研究方向。
1. 引言

图1:时间序列数据增强技术的分类(taxonomy)
本文旨在填补上述空白,总结现有的时间序列数据增强方法在常见任务中的应用,包括时间序列预测、异常检测、分类等,并提供有远见的未来发展方向。为此,我们提出了一种时间序列数据增强方法的分类,如图1所示。在分类法的基础上,对这些数据增强方法进行了系统的评述。我们首先从时域的简单变换开始讨论。然后在变换后的频率域和时频域讨论更多的时间序列变换。
除了时间序列在不同域的转换,我们还总结了更高级的方法,包括基于分解的方法、基于模型的方法和基于学习的方法。对于基于学习的方法,我们进一步将其分为嵌入空间、深度生成模型(DGMs)和自动化数据增强方法。为了证明数据增强的有效性,我们在三个典型的时间序列任务中对增强方法进行了初步评估,包括时间序列分类、异常检测和预测。最后,我们讨论并强调了五个未来的方向: 增强(时频域、非平衡类、选择与组合、高斯过程和深度生成模型)。
4.2时间序列异常检测
考虑到时间序列异常检测存在数据稀缺和数据不平衡的问题,采用数据增强的方法产生更多的标注数据是有益的。我们在[Gao等人,2020]中简要总结了结果,其中基于 U-Net 的网络被设计并在公开的 Yahoo! 数据集[Laptev等人,2015]用于时间序列异常检测。不同设置下的性能比较如表2所示,分别是对原始数据(U-Net-Raw)、分解残差(U-Net-DeW)和数据增强残差(U-Net-DeWA)应用该模型(U-Net)进行的性能比较。应用的数据增强方法包括翻转、裁剪、标签扩张(expansion)和基于APP的频域增强。可以看出,分解有助于F1分数的提高,数据扩充进一步提高了性能。

表2:基于数据增强的时间序列异常检测的 precision, recall, and F1 score的提升。
边栏推荐
- Threejs glow channel 01 (unrealbroompass & layers)
- MBA-day25 最值问题-应用题
- Microblog writing - flow chart - sequence chart - Gantt chart - Mermaid flow chart - good results
- 1528. rearrange strings
- "Unusual proxy initial value setting is not supported", causes and Solutions
- 【gdb调试工具】| 如何在多线程、多进程以及正在运行的程序下调试
- 荐书丨《好奇心的秘密》:一个针尖上可以站多少跳舞的小天使?
- MySQL data (Linux Environment) scheduled backup
- When to use RDD and dataframe/dataset
- Every (), map (), forearch () methods. There are objects in the array
猜你喜欢

【牛客】把字符串转换成整数

华为路由器:GRE技术

4274. 后缀表达式

Numpy numpy中的np.c_和np.r_详解

Alibaba Senior Software Testing Engineer recommends testers to learn -- Introduction to security testing

Spark - LeftOuterJoin 结果条数与左表条数不一致

深入解析 Apache BookKeeper 系列:第三篇——读取原理

普通人没有学历,自学编程可以月入过万吗?

4274. suffix expression

【LeetCode】541. 反转字符串 II
随机推荐
华为路由器:GRE技术
4275. Dijkstra序列
Pytorch读入据集(典型数据集及自定义数据集两种模式)
Huawei Router: IPSec Technology
阿里资深软件测试工程师推荐测试人员必学——安全测试入门介绍
Solution: Nan occurs in loss during model training
The native applet uses canvas to make posters, which are scaled to the same scale. It is similar to the uniapp, but the writing method is a little different
Array opposite pointer series
MySQL - SQL statement
Opencv maximum filtering (not limited to images)
Data middle office: detailed explanation of technical architecture of data middle office
Target detection series fast r-cnn
Redis implements a globally unique ID
Threejs glow channel 01 (unrealbroompass & layers)
tcpdump抓包实现过程
Webrtc series - network transmission 5: select the optimal connection switching
I heard that you are still spending money to buy ppt templates from the Internet?
On the routing tree of gin
嵌入式 | 硬件转软件的几条建议
Depens:*** but it is not going to be installed