内容提要: |
多元时间序列相似性度量方法主要有欧氏距离(ED)、奇异值分解(SVD)、基于点分布特征方法(PD)、动态时间弯曲(DTW)距离和趋势距离(TD)等。ED方法简单直观,但要求两条序列的长度必须相同,且无法处理序列在时间轴上的伸缩和弯曲;SVD方法把时间序列中的变量理解为随机变量,以相关系数矩阵作为特征提取的基础,利用线性坐标变换建立相似性度量模型,能够有效体现变量间的相互关系,但它是一种基于统计的度量方法,不能描述观察值的时序关系,存在一定的误判风险;PD方法抽取多元时间序列在三维空间上的局部重要点作为特征,依据重要点的分布特征进行相似性度量,对小规模的多元时间序列具有较好的匹配效果,但它也是一种基于统计的度量方法;DTW距离支持不同长度时间序列的相似性度量,支持序列在时间轴上的伸缩和弯曲,具有较好的度量精度和鲁棒性,因此被广泛采用,但由于计算复杂度高,限制了其在海量时间序列中的应用;TD方法以多元时间序列的倾斜角和时间跨度作为特征,利用DTW算法实现特征序列的对齐匹配,与DTW方法相比,有效降低了计算复杂度;但模型参数较多、参数优化配置环节较为复杂。 |