开发者社区> 问答> 正文

无限允许Apache Flink Windows延迟

"
假定流中的事件(包含感兴趣的值)基于事件时间被分配给窗口。在我的情况下,事件不仅无序到达而且迟到,而且事件也是版本化的。我的意思是,对于给定的事件时间,两个事件可能会到达。在这种情况下,窗口应该再次点火。这些事件到来之间的时间可能是几天(甚至几周)。我已经找到了Windows允许的Lateness选项。这是一个可能的解决方案,还是这个数量在许多不能丢弃的窗口中,因为另一个事件可能仍然到达(这基本上归结为问题,如果窗口被持久化或保存在内存中)。"

展开
收起
flink小助手 2018-11-28 16:01:06 1958 0
1 条回答
写回答
取消 提交回答
  • flink小助手会定期更新直播回顾等资料和文章干货,还整合了大家在钉群提出的有关flink的问题及回答。

    "一般来说,允许的迟到需要是有限的,以避免保持无限量的状态。但是您可以将Flink配置为使用RocksDBStateBackend,它将状态溢出到磁盘,从而允许与本地磁盘一样多的状态。

    如果非常晚期的事件是罕见的,你可能最好以某种特殊的方式来容纳它们,而不是通过所有状态的开销来增加通用管道的负担。"

    2019-07-17 23:16:48
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Apache Flink技术进阶 立即下载
Apache Spark: Cloud and On-Prem 立即下载
Hybrid Cloud and Apache Spark 立即下载

相关镜像