Aujourd’hui, la majeure partie des Big Data sont des données de séries chronologiques. Que vous analysiez des données IoT, des données issues de services financiers ou des données provenant de votre infrastructure informatique, elles sont généralement enregistrées comme des séries dans le temps. Vertica offre un ensemble complet de fonctions d’analyse intégrées, notamment pour les séries chronologiques, les données géospatiales, le pattern matching et bien plus encore. Ces fonctions peuvent vous aider à effectuer de nombreuses tâches d’analyse sur ces données.
Séries chronologiques
Les analyses de séries chronologiques évaluent les valeurs d’un ensemble donné de variables en fonction de la dimensions temps et regroupent ces valeurs dans une fenêtre logique à des fins d’analyse et d’agrégation. La plate-forme analytique Vertica est une solution rapide et évolutive permettant l’analyse de séries chronologiques. La structure optimisée et les capacités d’analyse de la plate-forme, ainsi que l’organisation en colonnes de Vertica, permettent de trier, de compresser et de partitionner les données des séries chronologiques pour des performances optimales.
De plus, Vertica offre des fonctionnalités essentielles qui facilitent la gestion et l’analyse des séries chronologiques. Par exemple, Vertica fournit une fonctionnalité de gestion de valeurs manquantes, qui ajoute les points de données manquants, sous forme de schéma d’interpolation. Il s’agit d’une méthode de construction de nouveaux points de données dans la plage d’un ensemble discret de points de données connus. La plate-forme intercale les valeurs des colonnes dans les données (sous la forme de résultats de fonction calculés sur des intervalles de temps) et ajoute les points de données manquants dans les résultats.
Fenêtres basées sur les séries d’événements
Les fonctions de gestion de séries d’événements font partie des fonctions standards de Vertica. Ces fonctions simplifient la détection des événements dans les données de séries chronologiques. Les fenêtres basées sur les événements vous permettent de diviser les données de séries chronologiques en fenêtres qui identifient les événements significatifs au sein des données. C’est particulièrement pertinent pour les données financières, où l’analyse se concentre souvent sur des événements précis qui jouent le rôle de déclencheurs d’autres activités. Par exemple, compte tenu d’un flux de cotations boursières, l’analyste peut souhaiter placer les actions dans un nouveau groupe lorsque l’écart (la différence entre le cours vendeur et le cours acheteur) dépasse 0,05 $. Si nous considérons chaque groupe comme une fenêtre d’événements, les extrémités de la fenêtre sont définies par l’occurrence de certains types d’événements.
Analyse | Pris en charge par Vertica | ||
---|---|---|---|
Données géospatiales | ✔ | ||
Séries chronologiques | ✔ | ||
Fenêtres basées sur les séries d’événements
|
✔ | ||
Jointure sur des séries d’évènements | ✔ | ||
Détection de modèles dans une série | ✔ | ||
Apprentissage machine (prédiction)
|
✔ | ||
Apprentissage machine (catégorisation)
|
✔ |
Jointures sur des séries d’événements
Vertica prend en charge les jointures de requêtes classiques des entrepôts de données. La plate-forme inclut également le prédicat INTERPOLATE, qui permet un type de jointure spécial. La jonction de séries d’événements est une extension SQL Vertica qui vous permet d’analyser deux séries d’événements lorsque leurs intervalles de mesure ne s’alignent pas précisément, par exemple lorsque les horodatages ne correspondent pas. Ces jointures constituent un moyen naturel et efficace d’interroger directement les données d’événements mal alignées, plutôt que d’avoir à normaliser la série sur le même intervalle de mesure.
Détection de modèle dans une série
Vertica prend en charge nativement l’analyse des chemins et des modèles via une extension de détection de modèles dans une série d’événements. L’extension SQL MATCH vous permet de filtrer de grandes quantités de données historiques pour la détection de modèles d’événements. Vous spécifiez un modèle en tant qu’expression et pouvez ensuite rechercher le modèle dans une séquence d’événements d’entrée. MATCH fournit des sous-clauses pour le partitionnement et l’organisation des données analytiques, et ladétection des modèles s’effectue sur un ensemble contigu de lignes.
Apprentissage machine
En plus de l’analyse des séries chronologiques, les entreprises appliquent des analyses prédictives à tout, de l’amélioration de la disponibilité des machines à la réduction du taux d’attrition des clients. Avec Vertica, les analystes peuvent désormais créer et déployer en natif des modèles d’apprentissage machine basés sur des ensembles de données plus volumineux sans sous-échantillonnage, ce qui accélère le processus de prise de décision.