Guide d’introduction aux données de séries chronologiques

Le « temps » est une variable cruciale lorsqu’il s’agit d’accumuler des données. Dans l’analyse des séries chronologiques, le temps est un élément important des données.

Qu’est-ce que les données de séries chronologiques ?

Les données de séries chronologiques font référence à une série de points de données classés dans le temps. Il introduit une dépendance d’ordre entre un ensemble d’observations. Les séries chronologiques sont omniprésentes dans le monde actuel axé sur les données. Comme chaque événement suit la flèche du temps, nous sommes en interaction constante avec une variété de données de séries chronologiques.

Les séries chronologiques sont généralement supposées être générées à intervalles réguliers et sont appelées séries chronologiques régulières. Cependant, les données de cette série chronologique n’ont pas besoin d’être générées à intervalles réguliers. De tels cas englobent des séries chronologiques irrégulières où les données suivent une séquence temporellement échelonnée. Cela implique que les mesures peuvent ne pas avoir lieu à intervalles réguliers. Cependant, les données peuvent être générées à des intervalles de temps discrets ou en rafale. Les retraits aux guichets automatiques ou les dépôts sur les comptes sont des exemples de séries chronologiques irrégulières.

Techniquement, dans une série chronologique, une ou plusieurs variables changent sur une période donnée. Si une seule variable varie dans le temps, elle est appelée série chronologique univariée. Prenons l’exemple d’un capteur mesurant la température d’une pièce toutes les secondes. Ici, seule une valeur de température unidimensionnelle est générée à chaque instant (c’est-à-dire à la seconde). Au contraire, lorsque plus d’une variable change dans le temps, on parle de série chronologique multivariée. Par exemple, considérons l’économie bancaire. Dans de tels cas, des séries chronologiques multivariées sont utilisées pour comprendre comment les changements de politique d’une variable, comme le taux de prise en pension, peuvent affecter d’autres variables (c’est-à-dire le décaissement des prêts pour les banques commerciales).

Les données de séries chronologiques trouvent leur application dans toutes les disciplines, de la finance, la géologie, la météorologie, la fabrication à l’informatique, l’IoT, les sciences physiques et sociales. Il est utilisé pour suivre les changements météorologiques, le taux de natalité, le taux de mortalité, les fluctuations du marché, les performances du réseau et de nombreuses autres applications. Certains de ses principaux cas d’utilisation incluent la surveillance, la prévision et la détection d’anomalies. Par exemple, la prévision de séries chronologiques joue un rôle essentiel dans la détermination de la popularité des systèmes de gestion de bases de données. La figure ci-dessous montre la popularité croissante du SGBD au fil des ans (2019-2021) dans un tracé de série chronologique.

https://www.influxdata.com/time-series-database/

Composants clés des séries chronologiques

Les facteurs qui influencent les valeurs d’une observation dans une série chronologique sont traités comme leurs composantes clés. Les trois catégories de composants comprennent :

  • Tendance ou mouvements à long terme
  • Mouvements à court terme
  • Variations saisonnières
  • Variations cycliques
  • Mouvements aléatoires ou irréguliers
  • S’orienter

    La tendance des données à augmenter ou à diminuer sur une longue période est appelée tendance ou composante à long terme. Cependant, il est important de noter que le mouvement vers le haut ou vers le bas ne doit pas nécessairement être dans la même direction sur une période donnée.

    Les tendances peuvent soit monter, descendre ou rester stables sur différentes périodes de temps. La tendance générale, cependant, doit toujours correspondre à une tendance à la hausse, à la baisse ou stable. De telles tendances de mouvement sont évidentes dans les exemples tels que la productivité agricole, le taux de mortalité, les appareils fabriqués, le nombre d’usines, etc.

    Tendance linéaire et non linéaire

    Le traçage des valeurs de séries chronologiques en fonction du temps sur un graphique révèle le type de tendance en fonction du modèle de regroupement des données. Si le groupe de données est plus ou moins autour d’une ligne droite, la tendance est qualifiée de tendance linéaire. Sinon, le modèle de grappe de données montre une tendance non linéaire car le rapport de changement entre deux variables n’est pas stable ou constant. Par conséquent, ces tendances sont également appelées corrélations curvilignes.

    Mouvements à court terme

    Dans une série chronologique, ces composants ont tendance à se répéter sur une période de temps. Ils ont de courtes rafales irrégulières et affectent les variables étudiées. Les deux types de catégories sous mouvement à court terme comprennent :

    Variations saisonnières

    Ces versions fonctionnent régulièrement et périodiquement sur une période inférieure à un an. Ils ont tendance à avoir un schéma similaire ou presque identique au cours d’une période de 12 mois. Ces variations font partie d’une série chronologique si les données sont enregistrées régulièrement, c’est-à-dire toutes les heures, tous les jours, toutes les semaines, tous les mois ou tous les trimestres.

    Les variations saisonnières sont soit d’origine humaine, soit d’origine naturelle. Différentes saisons ou conditions climatiques jouent un rôle essentiel dans ces variations. Par exemple, la production agricole dépend entièrement des saisons. De même, le marché du parapluie ou de l’imperméable dépend de la saison des pluies, tandis que la vente de glacières et de climatiseurs culmine pendant la saison estivale.

    Les conventions créées par l’homme comprennent les festivals, les fêtes et les occasions comme les mariages. Ces événements à court terme se reproduisent année après année.

    Variations cycliques

    Les variations de séries chronologiques qui ont tendance à s’étendre sur une période de plus d’un an sont appelées variations cycliques. Pour une entreprise, une période complète est considérée comme le « cycle économique ». Le pic ou la baisse des performances des entreprises dépend de divers facteurs tels que la structure économique, la gestion des entreprises et d’autres forces en interaction. Ces variations cycliques d’activité peuvent être régulières mais non périodiques. Généralement, les entreprises subissent un processus cyclique en quatre phases comprenant la prospérité, la récession, la dépression et la reprise.

    De telles variations cycliques font partie intégrante d’un modèle de série chronologique, car le développement des affaires repose fortement sur les « points de données séquentiels » générés.

    Mouvements aléatoires ou irréguliers

    Les composantes aléatoires entraînent une variation significative de la variable observée. Il s’agit de fluctuations purement irrégulières sans aucun schéma défini. Les forces sont imprévues, imprévisibles et erratiques par nature, par exemple, les tremblements de terre, les inondations, les famines et autres catastrophes.

    Les événements aléatoires décrits ci-dessus sont analysés à l’aide des données de la série chronologique source pour mieux aborder ces scénarios réels qui pourraient se produire à l’avenir.

    Types de séries chronologiques

    Les données de séries chronologiques peuvent être divisées en quatre types, déterministes, non déterministes, stationnaires et non stationnaires. Examinons chaque type en détail.

    #1. Série chronologique déterministe

    Une série temporelle déterministe peut être décrite avec une expression analytique. Il n’implique pas d’aspects aléatoires ou probabilistes. Mathématiquement, il peut être exprimé exactement pour tous les intervalles de temps en termes de développement en série de Taylor. Cela est possible si toutes ses dérivées sont connues à un moment arbitraire. Ces dérivés spécifient explicitement le passé et le futur à ce moment-là. Si toutes les conditions sont remplies, il est possible de prédire avec précision son comportement futur et d’analyser comment il s’est comporté dans le passé.

    #2. Séries chronologiques non déterministes

    Une série temporelle non déterministe a un aspect aléatoire qui lui est associé qui empêche sa description explicite. Par conséquent, les expressions analytiques ne sont pas des solutions suffisamment réalisables pour exprimer une telle série chronologique. Une série chronologique peut être non déterministe pour les raisons suivantes :

  • Les informations nécessaires à sa description ne sont pas disponibles dans leur intégralité. Bien que des données puissent être présentes en principe, elles ne peuvent pas être traitées explicitement comme quantifiables.
  • Le processus de génération de données est de nature aléatoire.
  • En raison du facteur aléatoire, la série temporelle non déterministe obéit à des lois probabilistes. Par conséquent, les données sont traitées en termes statistiques – ce qui implique que les données sont définies par des distributions de probabilité et des moyennes de diverses formes. Cela inclut les moyennes et les mesures de dispersion, c’est-à-dire les variances.

    #3. Série chronologique stationnaire

    Dans une série chronologique stationnaire, les propriétés statistiques telles que la moyenne, la variance et autres ne reposent pas sur l’aspect temporel. Une série chronologique stationnaire est plus facile à prédire car on peut affirmer avec certitude que ses propriétés statistiques resteront les mêmes que celles observées dans le passé. Par conséquent, diverses méthodes de prévision statistique reposent sur l’argument selon lequel la série chronologique est à peu près stationnaire. Cela implique que la série temporelle peut être considérée comme stationnaire par approximation en appliquant de simples transformations mathématiques.

    #4. Séries chronologiques non stationnaires

    Dans une série non stationnaire, les propriétés statistiques varient avec le temps. Par conséquent, les séries chronologiques avec tendances, ou saisonnalité, relèvent de la catégorie non stationnaire, car la tendance et la saisonnalité peuvent affecter la valeur de la série chronologique à différents intervalles de temps. Les séries chronologiques non stationnaires décrivent des données imprévisibles, les empêchant d’être modélisées ou prévues.

    https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

    Analyse et prévision des séries chronologiques

    L’analyse et la prévision des séries chronologiques sont des outils pratiques pour observer, analyser et étudier l’évolution et la dynamique des processus vitaux et des objets de différents types. Examinons chacun plus en profondeur.

    Analyse des séries chronologiques

    L’analyse de séries chronologiques est définie comme un processus d’analyse des données collectées sur une période de temps. Ici, les analystes de données enregistrent les données à intervalles constants sur une période de temps fixe. Le taux d’observation des données, c’est-à-dire l’intervalle de temps, peut varier de quelques secondes à plusieurs années.

    Les données de séries chronologiques décrivent les variables sous inspection car elles fournissent une analyse détaillée du modèle fluctuant sur une période de temps spécifique. Les paramètres nécessaires à l’analyse peuvent varier selon les domaines et les disciplines. Certains des exemples peuvent inclure :

    • Instruments scientifiques – Données enregistrées par jour
    • Site marchand – Visites clients par jour
    • Bourse – Valeurs des actions par semaine
    • Saison – Jours de pluie par an

    Pour assurer la cohérence et la fiabilité, l’analyse des séries chronologiques opère sur de grandes quantités de points de données. Une bonne taille d’échantillon est une représentation subtile de l’authenticité d’une tendance ou d’un modèle découvert.

    De plus, l’analyse des séries chronologiques est également adaptée pour prédire les événements futurs sur la base des données enregistrées dans le passé.

    Prévision de séries chronologiques

    L’analyse des séries chronologiques permet aux organisations d’identifier la cause profonde des fluctuations des tendances au fil du temps. Avec les données en main, les entreprises peuvent ensuite étudier et rechercher plus avant pour mieux comprendre comment aborder les tendances inconnues et prévoir les événements à venir. Les entreprises utilisent généralement des techniques de visualisation de données pour déterminer ces anomalies dans les données.

    La prévision des séries chronologiques s’articule autour de deux facteurs essentiels :

  • Anticipez les événements futurs en fonction du comportement passé des données.
  • Supposons que les tendances à venir présenteront des similitudes avec le modèle de données passé.
  • Dans la prévision, l’objectif principal est essentiellement de prédire comment les points de données continueront de rester les mêmes ou de varier à l’avenir. Voici quelques exemples de différents secteurs industriels pour mieux comprendre les nuances de l’analyse et de la prévision des séries chronologiques.

    • Marché boursier – Prévoir le cours de clôture de l’action chaque jour.
    • Ventes – Prédire les ventes de produits pour un magasin chaque jour.
    • Tarification – Prévoir le prix moyen du carburant chaque jour.

    Certaines des techniques statistiques courantes utilisées pour la prévision des séries chronologiques comprennent la moyenne mobile simple (SMA), le lissage exponentiel (SES), la moyenne mobile intégrée autorégressive (ARIMA) et le réseau de neurones (NN).

    Données de séries chronologiques dans le cloud

    Pour dévoiler la valeur des données de séries chronologiques, les entreprises doivent être en mesure de stocker et d’interroger rapidement les données. Les sociétés du marché des capitaux s’appuient sur de grands volumes de données historiques et en continu pour utiliser l’analyse de données en temps réel et prendre des décisions commerciales percutantes. Cela peut impliquer de prévoir la vulnérabilité des cours boursiers, de déterminer les besoins nets en capital ou de prévoir les taux de change. Pour offrir de la flexibilité et traiter les données de manière transparente, de nombreuses entreprises optent pour la migration de leurs bases de données de séries chronologiques vers le cloud.

    Avec la migration des bases de données de séries chronologiques vers les nuages, les organisations peuvent accéder à des ressources illimitées à la demande. Il permet aux entreprises d’utiliser des centaines de cœurs pour accomplir leur tâche qui maximise le débit du réseau sans problèmes de latence.

    Les bases de données de séries chronologiques dans l’infrastructure cloud conviennent aux charges de travail intensives en calcul. Cela comprend la réalisation de calculs de risque en réponse aux tendances du marché en temps réel. Les sociétés financières peuvent supprimer les frais généraux du centre de données et se concentrer sur l’utilisation des ressources pour améliorer la productivité de leurs charges de travail.

    Les fournisseurs de cloud tels qu’AWS fournissent Flux temporel d’Amazon, un service de base de données de séries chronologiques qui facilite le chargement, le stockage et l’analyse d’ensembles de données de séries chronologiques. Ils offrent un stockage pour gérer les charges de travail intensives en transactions, des outils d’analyse en temps réel et une fonctionnalité de diffusion de données pour présenter les événements au fur et à mesure qu’ils se produisent.

    Par conséquent, l’infrastructure cloud amplifie et met à l’échelle les avantages des données de séries chronologiques.

    Applications des séries chronologiques

    Les modèles de séries chronologiques ont deux objectifs,

  • Comprendre les facteurs sous-jacents qui ont produit un certain modèle de données.
  • Sur la base de l’analyse, ajustez un modèle pour prévoir et surveiller.
  • Examinons quelques-uns des cas d’utilisation d’applications de données de séries chronologiques.

    #1. Séries chronologiques dans le domaine financier et commercial

    Toutes les décisions financières, commerciales et d’investissement sont prises en fonction des tendances actuelles du marché et des prévisions de la demande. Les données de séries chronologiques sont utilisées pour expliquer, corréler et prévoir le marché financier dynamique. Les experts financiers peuvent examiner les données financières pour donner des prévisions pour les applications qui aident à atténuer les risques, à stabiliser les prix et les échanges.

    L’analyse des séries chronologiques joue un rôle clé dans l’analyse financière. Il est utilisé dans la prévision des taux d’intérêt, la prévision de la volatilité des marchés boursiers, et bien d’autres. Les parties prenantes de l’entreprise et les décideurs peuvent prendre des décisions éclairées concernant la fabrication, les achats, l’allocation des ressources et optimiser leurs opérations commerciales.

    Cette analyse est effectivement utilisée dans le secteur de l’investissement pour surveiller les taux de sécurité et leurs fluctuations dans le temps. Le prix du titre peut également être observé à court terme (c’est-à-dire, enregistrer des données par heure ou par jour) ou à long terme (c’est-à-dire, observation étalée sur des mois ou des années). L’analyse de séries chronologiques est un outil utile pour suivre les performances d’un titre, d’un actif ou d’une variable économique sur une longue période.

    #2. Séries chronologiques dans le domaine médical

    La santé émerge rapidement comme un domaine axé sur les données. En plus de l’analyse financière et commerciale, le domaine médical tire grandement parti de l’analyse des séries chronologiques.

    Considérez un scénario qui nécessite une synergie de données de séries chronologiques, de procédures médicalement alignées et de techniques d’exploration de données lors du traitement de patients atteints de cancer. Un tel cadre hybride peut être utilisé pour exploiter les fonctionnalités d’extraction de caractéristiques à partir des données de séries chronologiques collectées (c’est-à-dire les images radiographiques du patient) pour suivre les progrès du patient et sa réponse aux traitements fournis par la fraternité médicale.

    Dans le secteur de la santé, tirer des conclusions à partir des données de séries chronologiques en constante évolution est d’une valeur critique. De plus, les pratiques médicales avancées exigent que les dossiers des patients soient connectés au fil du temps pour une meilleure visibilité de la santé du patient. De plus, les paramètres de santé du patient doivent être enregistrés avec précision à intervalles réguliers pour avoir une image plus claire de l’état de santé du patient.

    Avec l’émergence d’instruments médicaux avancés, l’analyse de séries chronologiques s’est imposée dans le domaine de la santé. Considérez ci-dessous des exemples,

    • Appareils ECG : Appareils inventés pour surveiller les conditions cardiaques en enregistrant les impulsions électriques du cœur.
    • Appareils EEG : Appareils utilisés pour quantifier l’activité électrique dans le cerveau.

    De tels dispositifs ont permis aux praticiens médicaux d’exercer une analyse de séries chronologiques pour un diagnostic médical plus rapide, efficace et précis.

    De plus, avec l’avènement des appareils IoT tels que les capteurs portables et les appareils de santé portables, les gens peuvent désormais prendre des mesures régulières de leurs variables de santé au fil du temps avec un minimum d’entrées. Cela conduit à une collecte de données cohérente de données médicales dépendant du temps pour les personnes malades et en bonne santé.

    #3. Séries chronologiques en astronomie

    L’astronomie et l’astrophysique sont les deux disciplines modernes où les données de séries chronologiques sont exploitées de manière significative.

    Fondamentalement, l’astronomie consiste à tracer les trajectoires des objets cosmiques et des corps célestes et à effectuer des mesures précises pour mieux comprendre l’univers au-delà de l’atmosphère terrestre. En raison de cette exigence, les experts en astronomie sont compétents dans le traitement des données de séries chronologiques tout en étalonnant et en configurant des instruments complexes et en étudiant des objets d’intérêt astronomiques.

    Les données de séries chronologiques sont depuis longtemps associées au domaine de l’astronomie. En 800 avant JC, des données de séries chronologiques de taches solaires ont été collectées à intervalles réguliers. Depuis lors, l’analyse des séries chronologiques a été utilisée pour

    • Découvrez des étoiles lointaines en fonction des distances stellaires,
    • Observez les événements cosmiques tels que les supernovae pour mieux comprendre l’origine de notre univers.

    Les données de séries chronologiques, dans ce cas, concernent les longueurs d’onde et les intensités de la lumière émise par les étoiles, les corps célestes ou les objets. Les astronomes surveillent en permanence ces données de diffusion en direct pour détecter les événements cosmiques en temps réel au fur et à mesure qu’ils se produisent.

    Ces derniers temps, des domaines de recherche tels que l’astroinformatique et l’astrostatistique ont émergé, qui mélangent diverses disciplines telles que l’exploration de données, l’apprentissage automatique, l’intelligence informatique et les statistiques. Dans ces nouveaux domaines de recherche, le rôle des données de séries chronologiques est de détecter et de classer rapidement et efficacement les objets astronomiques.

    #4. Séries chronologiques dans les prévisions météorologiques

    Aristote a étudié de manière approfondie les modèles météorologiques pour mieux comprendre les causes et les effets observés dans les changements météorologiques dans les temps anciens. Au fil des jours, les scientifiques ont commencé à enregistrer des données météorologiques sur des instruments tels que le « baromètre » pour calculer les variables atmosphériques. Les données ont été recueillies à intervalles réguliers et conservées à différents endroits.

    Avec le temps, les prévisions météorologiques ont commencé à figurer dans les journaux. Avance rapide jusqu’à aujourd’hui, des stations de prévision météorologique omniprésentes sont installées dans différentes zones géographiques à travers le monde pour collecter des variables météorologiques précises.

    Ces stations ont des dispositifs fonctionnels avancés qui sont interconnectés pour recueillir et corréler les données météorologiques de divers endroits. Les données corrélées sont utilisées pour prévoir les conditions météorologiques à chaque instant en fonction des besoins.

    #5. Séries chronologiques en développement des affaires

    Les données de séries chronologiques permettent aux entreprises de prendre des décisions commerciales. Ceci est réalisé lorsque le processus analyse les données passées pour déduire les événements futurs et éclairer les possibilités probables. Le modèle de données passées est utilisé pour dériver les paramètres suivants :

    • Croissance de l’entreprise : pour évaluer la performance financière et commerciale globale et mesurer la croissance, les données de séries chronologiques sont l’actif le plus approprié et le plus fiable.
    • Estimer la tendance : Diverses méthodes de séries chronologiques peuvent être utilisées pour estimer les tendances émergentes. Considérons, par exemple, que ces méthodes analysent des observations de données sur une période de temps pour refléter une augmentation ou une diminution des ventes d’un appareil électronique particulier.
    • Dévoiler les modèles saisonniers : les points de données enregistrés pourraient révéler des fluctuations et des modèles saisonniers qui pourraient aider à la prévision des données. Les informations obtenues sur les données jouent un rôle clé pour les marchés où les prix des produits fluctuent de façon saisonnière. Ces données peuvent aider les entreprises à mieux planifier et développer leurs produits.

    Conclusion 👨‍🏫

    En résumé, les données de séries chronologiques peuvent être considérées comme les caractéristiques de points de données complexes collectés sur une période de temps constante. L’analyse, la modélisation et la prévision de séries chronologiques font désormais partie intégrante de notre vie quotidienne avec l’émergence des gadgets IoT, des appareils électroménagers intelligents et des appareils portables. En outre, les données de séries chronologiques trouvent leur application dans divers domaines, notamment la santé, l’astrophysique, l’économie, l’ingénierie, les affaires et bien d’autres.