Ein Großteil der heutigen Big Data sind Zeitreihendaten. Egal, ob Sie IoT-Daten, Finanzdienstdaten oder Daten aus Ihrer IT-Infrastruktur betrachten, Daten werden manchmal in regelmäßigen Abständen erstellt. Vertica bietet eine umfassende Reihe integrierter Analysefunktionen, einschließlich Zeitreihen, Geodaten, Musterabgleich und mehr. Diese Funktionen helfen Ihnen dabei, viele der Aufgaben zur Durchführung von Analysen für diesen speziellen Datentyp zu erledigen.

Zeitreihen

Zeitreihenanalysen bewerten die Werte eines bestimmten Satzes von Variablen im Zeitverlauf und gruppieren diese Werte in einem Fenster für Analyse und Aggregation. Die Vertica Analytics Platform ist eine skalierbare, schnelle Lösung für Zeitreihenanalysen. Dank der optimierten Struktur und der analytischen Funktionen der Plattform sowie der spaltenförmigen Natur von Vertica können Zeitreihendaten sortiert, komprimiert und partitioniert werden, um eine optimale Leistung zu erzielen.

Darüber hinaus bietet Vertica einige wichtige Funktionen, die die Verwaltung und Analyse von Zeitreihen erleichtern. Vertica bietet beispielsweise eine Funktion zum Füllen von Lücken, die fehlende Datenpunkte als Interpolationsschema ausfüllt. Dies ist eine Methode zur Erstellung neuer Datenpunkte innerhalb eines diskreten Satzes bekannter Datenpunkte. Die Plattform interpoliert die Nicht-Zeitreihen-Spalten in den Daten (z. B. die Ergebnisse der analytischen Funktionen, die über Zeitscheiben berechnet werden) und fügt die fehlenden Datenpunkte zur Ausgabe hinzu.

Ereignisbasierte Fenster

Ereignisbasierte Fensterfunktionen sind Teil der SQL-Standardanalysen von Vertica. Diese Funktionen vereinfachen die Erkennung von Ereignissen in Zeitreihendaten. Ereignisbasierte Fenster ermöglichen es Ihnen, Zeitreihendaten in Fenster aufzuteilen, die signifikante Ereignisse innerhalb der Daten markieren. Dies ist besonders bei Finanzdaten relevant, bei denen die Analyse häufig auf bestimmte Ereignisse als Auslöser für andere Aktivitäten konzentriert. Beispielsweise kann der Aktienanalyst angesichts eines Eingangsstroms von Aktiennotierungen die Eingabequotierungen in eine neue Gruppe einfügen, wenn die Spanne (die Differenz zwischen dem Briefkurs und dem Geldkurs) 0,05 $ übersteigt. Wenn wir jede dieser Gruppen als Ereignisfenster betrachten, werden die Fensterendpunkte durch das Auftreten bestimmter Ereignistypen definiert.

Analyse In Vertica unterstützt
Geodaten
Zeitreihen

Ereignisbasierte Fenster

  • Bedingte Änderung
  • Bedingt wahr
Ereignisreihen-Joins
Musterabgleich

Maschinelles Lernen (Vorhersage)

  • Logistikregression
  • Lineare Regression
  • SVM

Maschinelles Lernen (Kategorisierung)

  • Naive Bayes
  • K-means Clustering
  • Random Forest
  • SVM

Ereignisreihen-Joins

Vertica unterstützt typische Data Warehousing-Abfrage-Joins. Die Plattform bietet auch das INTERPOLATE-Prädikat, das einen speziellen Join-Typ ermöglicht. Der Ereignisreihen-Join ist eine Vertica SQL-Erweiterung, mit der Sie zwei Ereignisreihen analysieren können, wenn ihre Messintervalle nicht genau übereinstimmen, z. B. wenn die Zeitstempel nicht übereinstimmen. Diese Joins bieten eine natürliche und effiziente Möglichkeit, falsch ausgerichtete Ereignisdaten direkt abzufragen, anstatt die Serie auf dasselbe Messintervall normalisieren zu müssen.

Musterabgleich

Vertikal unterstützt die Pfad- und Musteranalyse durch eine Musterabgleichserweiterung für Ereignisreihen nativ. Mit der SQL MATCH-Erweiterung können Sie große Mengen historischer Daten bei der Suche nach Ereignismustern anzeigen. Sie geben ein Muster als regulären Ausdruck an und können dann innerhalb einer Folge von Eingabeereignissen nach dem Muster suchen. MATCH stellt Unterklauseln für die Partitionierung und Reihenfolge analytischer Daten bereit, und der Musterabgleich erfolgt in einem zusammenhängenden Satz von Zeilen.

Maschinelles Lernen

Neben der Zeitreihenanalyse wenden Unternehmen vorausschauende Analysen auf alles an, von der Verbesserung der Maschinenverfügbarkeit bis zur Reduzierung der Kundenabwanderung. Mit Vertica können Analysten nun SQL nutzen, um basierend auf größeren Datensätzen nativ Modelle für maschinelles Lernen zu erstellen und bereitzustellen, ohne Sampling durchführen zu müssen, um den Entscheidungsprozess zu beschleunigen.

IoT-Herausforderungen erfordern einen neuen Ansatz für die Datenverwaltung und -analyse

Lesen Sie den Harbor Research-Bericht

Zeitreihenanalyse zu Big Data: Wie Vertica Ihnen hilft, Einblicke aus umfangreichen Zeitserien-Datensätzen zu erhalten

Bericht lesen

Wie Vertica hilft, Finanzdienstleistern erfolgreich bei der Einführung von Big Data zu sein – und zu gewinnen.

Lesen Sie das Frost & Sullivan-Paper.

Ressourcen im Blickpunkt

Alle Ressourcen anzeigen