prince的文章

21、Flink深入:Flink之Window 案例

1. 为什么需要Window 在流处理应用中,数据是连续不断的,有时我们需要做一些聚合类的处理,例如:在过去的1分钟内有多少用户点击了我们的网页。 在这种情况下,我们必须定义一个窗口(window),用来收集最近1分钟内的数据,并对这个窗口...

赞(0)princeprinceFlink 深入 阅读(178)

20、Flink深入:Flink之分布式缓存

1. Flink中分布式缓存概述 Flink提供了一个类似于Hadoop的分布式缓存,让并行运行实例的函数可以在本地访问。 这个功能可以被使用来分享外部静态的数据,例如:机器学习的逻辑回归模型等。 广播变量是将变量分发到各个TaskMana...

赞(0)princeprinceFlink 深入 阅读(214)

19、Flink深入:Flink之广播变量

1. Flink中广播变量概述 Flink支持广播。可以将数据广播到TaskManager上就可以供TaskManager中的SubTask/task去使用,数据存储到内存中。这样可以减少大量的shuffle操作,而不需要多次传递给集群节点...

赞(0)princeprinceFlink 深入 阅读(175)

18、Flink深入:Flink之累加器

1. Flink中的累加器概述 Flink中的累加器,与Mapreduce counter的应用场景类似,可以很好地观察task在运行期间的数据变化,如在Flink job任务中的算子函数中操作累加器,在任务执行结束之后才能获得累加器的最终...

赞(0)princeprinceFlink 深入 阅读(239)