現今有許多巨量資料屬於時間序列資料。無論您審視的是物聯網資料、金融服務資料還是 IT 基礎架構的資料,有時均會定期產生資料。Vertica 具備全方位的內建分析功能,包括時間序列、地理空間、模式比對等。這些功能可以協助您完成許多工作,以便針對這種特定類型的資料執行分析。
時間序列
隨著時間推移,時間序列分析會評估一組特定變數值,並將這些值分組至視窗中以進行分析和聚總。Vertica 統一分析平台是可擴充且快速的時間序列分析解決方案。平台的最佳化結構與分析功能,加上 Vertica 的直欄式特性,讓您可將時間序列資料排序、壓縮與分割,以提供最佳效能。
此外,Vertica 還提供多項可讓管理與分析時間序列變得更加輕鬆的重要功能。 例如,Vertica 提供的填補缺口功能,可作為插補方案來填補遺失的資料點。此方法可用於在一組已知資料點的範圍內建構新的資料點。平台會插補資料中的非時間序列欄 (例如,隨著時間片段運算的分析函式結果),並將遺失的資料點新增至輸出。
以事件為基礎的視窗
以事件為基礎的視窗功能是 Vertica 標準 SQL 分析的一部分。這些功能可簡化時間序列資料中的事件偵測程序。以事件為基礎的視窗可讓您將時間序列資料分為多個視窗,以標記資料中的重要事件。這與金融資料尤其相關,因為其分析通常著重於觸發其他活動的特定事件。舉例來說,假設股票報價有特定輸入資料流,股票分析師可能會想在價差 (賣出價與買進價之間的差異) 超過 $0.05 時,將輸入報價放入新的群組中。如果將各個此類群組視為事件視窗,則視窗端點會以特定事件類型的發生作為定義依據。
分析類型 | Vertica 支援的項目 | ||
---|---|---|---|
地理空間 | ✔ | ||
時間序列 | ✔ | ||
以事件為基礎的視窗
|
✔ | ||
事件序列合併 | ✔ | ||
模式比對 | ✔ | ||
機器學習 (預測)
|
✔ | ||
機器學習 (分類)
|
✔ |
事件序列合併
Vertica 支援一般的資料倉儲查詢合併。平台也提供插補述詞,允許特定類型的合併功能。事件序列合併是 Vertica SQL 的延伸功能,可讓您在兩個事件序列的測量間隔不完全一致時加以分析,例如時間戳記不相符時。這些合併功能可讓您以自然且有效率的方式,直接查詢不一致的事件資料,而不需要將序列標準化至相同的測量間隔。
模式比對
Vertica 透過事件系列模式比對延伸功能,原生支援路徑與模式分析。SQL MATCH 延伸功能可讓您在搜尋事件模式時,篩選大量的歷史資料。您可以將模式指定為規則運算式,然後在一系列輸入事件中搜尋該模式。MATCH 提供分析資料分割與排序的子條款,而且模式比對會發生在一組連續的資料列上。
機器學習
除了時間序列分析之外,企業也開始將預測性分析套用至各種用途,包含改善機器運作時間到降低客戶流失率。有了 Vertica,分析師現在可利用 SQL,以較大型的資料集為基礎,原生建立及部署機器學習模型,而無須降低取樣,藉此加速決策過程。