当今的大部分数据都是时间序列数据。 无论您是在查看物联网数据、金融服务数据,还是来自 IT 基础架构的数据,有时都会定期创建数据。 Vertica 具有一套全面的内置分析功能,包括时间序列、地理空间、模式匹配等。 这些功能可以帮助您完成许多任务,以便执行不同类型的数据分析。

时间序列

时间序列分析评估一组给定变量的值随时间的变化,并将这些值分组到一个窗口中进行分析和聚合。 Vertica Analytics Platform 是一款快速可扩展的时间序列分析解决方案。 Vertica 列式特性及平台结构和分析能力的优化,使得时间序列数据可以通过排序、压缩和分区达到最佳性能。

更重要的是,Vertica 提供了一些关键功能,使时间序列更易于管理和分析。 例如,Vertica 提供间隙填充功能,可作为插值方案填充缺失数据点。 这是一种在已知数据点的离散集范围内构造新数据点的方法。 平台在数据中插入非时间序列列(如通过时间片计算的分析函数结果),并将缺失的数据点添加到输出。

基于事件的窗口

基于事件的窗口功能是 Vertica 标准 SQL 分析的一部分。 这些功能简化了时间序列数据中事件的检测。 基于事件的窗口允许您将时间序列数据分解为标记重要事件的窗口。 这在财务数据中尤为重要,因为分析通常将特定事件作为其他活动的触发因素。 例如,给定股票报价的输入,只要差价(卖出价和买入价之间的差额)超过 0.05 美元,股票分析师就可能将输入报价放入新的组中。 如果我们将每个这样的组视为事件窗口,则窗口端点就可以由某些事件类型的出现来定义。

分析 Vertica 是否支持
地理空间
时间序列

基于事件的窗口

  • 条件更改
  • 条件真实
时间序列连接
模式匹配

机器学习(预测)

  • 逻辑回归
  • 线性回归
  • SVM

机器学习(分类)

  • 朴素贝叶斯算法
  • k-均值算法
  • 随机森林
  • SVM

时间序列连接

Vertica 支持典型的数据仓库查询连接。 平台还提供 INTERPOLATE 谓词,允许特殊类型的连接。 事件序列连接是一个 Vertica SQL 扩展,它允许您在测量间隔未精确对齐(如时间戳不匹配)时分析两个事件序列。 这些连接提供了一种自然而有效的方法来对非对齐数据进行直接查询,而不必将它们标准化为统一的测量间隔。

模式匹配

Vertica 通过事件序列模式匹配扩展,原生支持路径和模式分析。 SQL MATCH 扩展允许您在搜索事件模式时筛选大量历史数据。 您可以将模式指定为正则表达式,然后在输入事件序列中进行搜索。 MATCH 提供了分析数据分区和排序的子句,可以在一组连续的记录上进行模式匹配。

机器学习

除时间序列分析外,组织还将预测分析应用在提高机器正常运行时间、减少客户流失等各个方面。 借助 Vertica,分析工程师现在可以利用 SQL 在本地创建和部署基于更大数据集的机器学习模型,而无需进行下采样以加速决策进程。

物联网挑战需要一种新的数据管理和分析方法

阅读 Harbor Research 的报告

大数据的时间序列分析:Vertica 如何帮助您从大规模的大型时间序列数据集中获得洞察力

阅读报告

Vertica 如何帮助金融服务机构利用大数据并赢得成功。

阅读 Frost & Sullivan 文章