現今有許多巨量資料屬於時間序列資料。無論您審視的是物聯網資料、金融服務資料還是 IT 基礎架構的資料,有時均會定期產生資料。Vertica 具備全方位的內建分析功能,包括時間序列、地理空間、模式比對等。這些功能可以協助您完成許多工作,以便針對這種特定類型的資料執行分析。

時間序列

隨著時間推移,時間序列分析會評估一組特定變數值,並將這些值分組至視窗中以進行分析和聚總。Vertica 統一分析平台是可擴充且快速的時間序列分析解決方案。平台的最佳化結構與分析功能,加上 Vertica 的直欄式特性,讓您可將時間序列資料排序、壓縮與分割,以提供最佳效能。

此外,Vertica 還提供多項可讓管理與分析時間序列變得更加輕鬆的重要功能。  例如,Vertica 提供的填補缺口功能,可作為插補方案來填補遺失的資料點。此方法可用於在一組已知資料點的範圍內建構新的資料點。平台會插補資料中的非時間序列欄 (例如,隨著時間片段運算的分析函式結果),並將遺失的資料點新增至輸出。

以事件為基礎的視窗

以事件為基礎的視窗功能是 Vertica 標準 SQL 分析的一部分。這些功能可簡化時間序列資料中的事件偵測程序。以事件為基礎的視窗可讓您將時間序列資料分為多個視窗,以標記資料中的重要事件。這與金融資料尤其相關,因為其分析通常著重於觸發其他活動的特定事件。舉例來說,假設股票報價有特定輸入資料流,股票分析師可能會想在價差 (賣出價與買進價之間的差異) 超過 $0.05 時,將輸入報價放入新的群組中。如果將各個此類群組視為事件視窗,則視窗端點會以特定事件類型的發生作為定義依據。

分析類型 Vertica 支援的項目
地理空間
時間序列

以事件為基礎的視窗

  • 條件式變更
  • 條件式真
事件序列合併
模式比對

機器學習 (預測)

  • 邏輯式迴歸
  • 線性迴歸
  • SVM

機器學習 (分類)

  • 單純貝式
  • K 平均數叢集
  • 隨機森林
  • SVM

事件序列合併

Vertica 支援一般的資料倉儲查詢合併。平台也提供插補述詞,允許特定類型的合併功能。事件序列合併是 Vertica SQL 的延伸功能,可讓您在兩個事件序列的測量間隔不完全一致時加以分析,例如時間戳記不相符時。這些合併功能可讓您以自然且有效率的方式,直接查詢不一致的事件資料,而不需要將序列標準化至相同的測量間隔。

模式比對

Vertica 透過事件系列模式比對延伸功能,原生支援路徑與模式分析。SQL MATCH 延伸功能可讓您在搜尋事件模式時,篩選大量的歷史資料。您可以將模式指定為規則運算式,然後在一系列輸入事件中搜尋該模式。MATCH 提供分析資料分割與排序的子條款,而且模式比對會發生在一組連續的資料列上。

機器學習

除了時間序列分析之外,企業也開始將預測性分析套用至各種用途,包含改善機器運作時間到降低客戶流失率。有了 Vertica,分析師現在可利用 SQL,以較大型的資料集為基礎,原生建立及部署機器學習模型,而無須降低取樣,藉此加速決策過程。

物聯網挑戰需要全新的資料管理與分析方法

閱讀 Harbor 研究報告

巨量資料的時間序列分析:Vertica 如何協助您大規模從大型時間序列資料集取得洞見

閱讀報告

Vertica 如何幫助金融服務機構獲取巨量資料,並贏得勝利。

閱讀 Frost & Sullivan 報告