Caractérisation des séries temporelles pour la recherche et la classification
Loading...
Date
2021-02-14
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Université 20 Août 1955-Skikda
Abstract
L’objet de cette thèse concerne principalement : (a) La problématique de caractérisation
des séries temporelles (ST) et (b) L’investigation du domaine obligatoirement lié à cette
problématique : Les mesures de distances et les mesures de similarité entre ST, ainsi que les
techniques d’appariement (ou alignement) des ST. Ces dernières techniques sont beaucoup
plus robustes que les mesures de distance/similarité, mais, elles sont peu nombreuses et
difficiles à inventer. La caractérisation des ST a pour but de décrire de façon compacte, mais
pertinentes ce type de données (les ST). Compacte au sens de la réduction autant que possible
de la redondance des données dans les ST, en n’extrayant que les caractéristiques
effectivement discriminantes. Cela nécessite le plus souvent de faire muter les ST du domaine
temporel à un domaine beaucoup plus expressif en termes de pouvoir de discrimination. Dans
ce contexte, nous allons établir un état de l’art et une catégorisation des techniques de
caractérisation des ST. Grossièrement parlant, nous pouvons déjà avancer que ces techniques
peuvent être classées en quatre domaines: (1) Le domaine temporel tels que les histogrammes,
les motifs et l’approche PLA (Piecewise Linear Approximation), (2) Le domaine fréquentiel,
tel que la Transformée de Fourier Discrète (DFT), (3) Le domaine temps-fréquences, tel que
la Transformée des Ondelettes Discrètes (DWT : Discrete Wavelet Transform) et (4) La
transformée par décomposition en valeurs singulières (SVD : Singular Value Decomposition),
qui relève du domaine de l’algèbre linéaire.
Pour le point d’intérêt (b), notre étude montre l’existence de quatre familles de techniques
de comparaison des ST. Il y a d’abord (1) Les techniques de comparaison utilisant les données
directes des ST combinées à des mesures de distance/similarité, telle que la distance
Euclidienne, (2) Les techniques de comparaison basées caractéristiques combinées aussi à une
mesure de distance / similarité, telle que la DFT et (3) Les technique d’alignement, telle que
la célèbre et très pertinente méthode : DTW (Dynamic Time Warping). Enfin, (4) une autre
classe de techniques d’alignement des ST basées signatures (caractéristiques globales) a été
récemment proposée par Boucheham: la méthode SEA (Shape Exchange Algorithm). Son
auteur la présente comme la rivale de la DTW ; mais, plus précise et plus pertinente.
Comme contributions personnelles dans le cadre de cette thèse, nous avons proposé quatre
travaux dont deux ont été publiés au niveau international : (1) L’élaboration d’une technique
d’alignement pour l’alignement des ST quasi-périodiques (STQP), telles que les tracés ECG
(Electrocardiogramme) et les ST du Capnogram (Qualité de la respiration). Notre méthode,
intitulée QPDTW (Quasi-Periodic Dynamic Time Warping), est une fusion entre la méthode
DTW et la méthode SEA. L’intérêt de ce travail est que, selon les travaux de Boucheham,
l’alignement des STQP serait le cas le plus complexe à résoudre. Brièvement, notre méthode
QPDTW permet d’aligner de manière effective les STQP même lorsqu'elles sont déphasées et
bruitées de manières significatives. (2) Développement d'un classifieur binaire basé QPDTW
pour la détection d'anomalies dans les tracés ECG. Ce travail en particulier a eu un écho
remarquable sur Researchgate. (3) Développement d’une méthode accélérée à base de la
transformation en ondelettes de Haar et de la méthode QP-DTW pour la recherche de
similarité dans l’ECG. (4) Développement d’un classifieur de type KNN basé QPDTW pour
la classification des ST générales. La base utilisée dans ce cas étant l'UCR (University of
California at Riverside) utilisée mondialement comme benchmark pour évaluation des
techniques de classification et de clustering des TS. Les résultats sont prometteurs, que se soit
pour la détection d'anomalies, la recherche ou pour la classification des séries temporelles.