暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

四种延迟消息实现方案的原理

Java艺术 2021-09-06
5700
由于Kafka不支持延迟消息,而目前公司技术栈中消息中间件使用的是Kafka,业务方希望使用RocketMQ满足延迟消息场景,但如果仅仅只是需要延迟消息功能而引入多一套消息中间件,这会增加运维与维护成本。在此背景下,我们希望通过扩展Kafka客户端提供延迟消息的支持。
本篇将介绍四种延迟消息实现方案的原理,以及分析其优缺点。

方案一:时间轮算法

每个生产者持有一个时间轮延迟消息队列,消息保存在内存中。
  • slot = (当前时间戳 - 时间轮启动时间) % slot总数;

  • round = (当前时间戳 - 时间轮启动时间) / slot总数;

  • 延时消息链表:按round排序。

缺点分析:
  • 消耗内存资源严重,只适用于延迟时间短(如一分钟内)的场景;

  • 容易丢失消息。

方案二:单轮时间轮算法+文件存储(方案一的改进版)

使用单轮的时间轮算法,单轮的slot数量满足max delay = slot count,并让每个slot指向一个文件。
缺点分析:
  • 如果服务容器化部署,重新构建后也会导致时间轮文件丢失,无法保证消息一致性。

方案三:多级分区+自动降级

按等级划分多个分区,根据剩余延时(期望发送时间-当前时间)将消息降级到指定分区,直到降级到真实topic。
缺点分析:
  • 需要经过多次发送-订阅,如果按照图中的等级划分,那么一个延迟2小时的消息至少要经过8次订阅、9次发送才最终发送到目标topic;

  • 由于同一个等级中每个消息的延时不同,如果要确保消息延迟准确,就可能导致一条消息不止需要经过8次订阅、9次发送才最终发送到目标topic,这次数可能会翻好几倍。

比如都是30~60分钟的等级,如果目前队列中的几条消息按顺序延迟值分别为:50、40、36、56
,为了不影响后面的延时消息,前面每个消息都必须要消费,然后重新写回同等级分区。因此,最坏的情况下,延时高的消息可能需要经过上百次发送-订阅才能完成。

方案四:多级延迟,不支持任意时间精度的延迟消息(方案三的改进版)

参考RocketMQ支持延迟消息设计,不支持任意时间精度的延迟消息,只支持特定级别的延迟消息,将消息延迟等级分为1s、5s、10s 、30s、1m、2m、3m、4m、5m、6m、7m、8m、9m、10m、20m、30m、1h、2h,共18个级别,只创建一个有18个分区的延时topic,每个分区对应不同延时等级。
举例:
  • 当发送延迟5秒消息时,将消息发送到order-topic.delay的第二个分区;

  • 当发送延迟1分钟消息时,将消息发送到order-topic.delay的第五个分区;

  • 当发送延迟1小时消息时,将消息发送到order-topic.delay的第17个分区;

优点:
  • 保证了每个分区中的消息都是时间顺序的,只需要顺序消费每个分区,将已经达到发送时间的消息转发到真实topic即可;

  • 如果消息未到达发送时间,则不需要提交offset,因为相同分区上的offset之后的消息也必定是未到发送时间的。

我们最终采用的是方案四,在实现上,我们为每个进程启动一个KafkaConsumer,使用正则表达式订阅以'.delay'结尾的topic,以此减少线程资源的消耗。在将消息发送到延迟topic时,将延迟等级作为消息key,而将原消息key存储在消息头,等发送到实际topic时再从延迟消息的消息头获取real key以及real topic。

最后修改时间:2021-09-06 19:02:35
文章转载自Java艺术,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论