图六:一个简单的例子,通过更新插入新的改变到表1(table_1),并通过增量消费建立一个简单的投影表(projected_table)。由Vinoth Chandar提供
借用Spark流式处理的说法(如,流-数据集连接,流-流连接),我们可以更高效地以较低的延迟来操作简单的投影和流-数据集连接。甚至是流-流连接也可以增量计算,只不过需要增加一些额外的逻辑来做窗口对齐。
图七:一个更为复杂的例子,将一个事实表连接到多个维度表,从而建立一个连接过的表。由Vinoth Chandar提供
这个案例是我们可以节省硬件花费的同时显著地降低延迟的不多见的场景之一。