RabbitMQ持久化和预取值

# 80.RabbitMQ 持久化和预取值

刚刚我们已经看到了如何处理任务不丢失的情况，但是如何保障当 RabbitMQ 服务停掉以后消息生产者发送过来的消息不丢失？　　默认情况下 RabbitMQ 退出或由于某种原因崩溃时，它会丢弃队列和消息，除非告知它不要这样做。确保消息不会丢失需要做两件事：将队列和消息都标记为持久化。

‍

# 队列持久化

要队列实现持久化，需要在声明队列的时候把 durable 参数设置为持久化：

‍

channel.queueDeclare(QUEUE_NAME, true, false, false, null);

这里复习下参数说明：

第一个参数：队列名
第二个参数：是否持久化，默认false，表示保存在内存中（不持久化）
第三个参数：是否独占队列，默认false，表示不独占队列（消息共享），true则表示只供一个消费者消费
第四个参数：最后一个消费者断开连接后，是否自动删除队列，默认false，表示不自动删除
第五个参数：队列的其他参数，如：存活时间

‍

但是需要注意的是，如果一个现有的队列，在声明的时候不是持久化的，想要修改为持久化：需要把原先队列先删除，然后重新创建一个持久化的队列。

不能直接声明（queueDeclare），会出现错误：

inequivalent arg 'durable' for queue 'hello' in vhost '/': received 'true' but current is 'false', class-id=50, method-id=10)

‍

我们可以先试着删除队列后新建，我们点进某个队列：

‍

然后点击删除：

‍

然后再新建：

package com.peterjxl.rabbitmq.demo4;

import com.peterjxl.rabbitmq.util.RabbitMQUtils;
import com.rabbitmq.client.Channel;

public class Producer {
  
    public static void main(String[] args) throws Exception {
        Channel channel = RabbitMQUtils.getChannel();
        channel.queueDeclare("hello", true, false, false, null);
    }
}

1
2
3
4
5
6
7
8
9
10
11
12

‍

此时能在可视化插件中看到hello队列被重新创建了，并且有个关键字D，这是持久化Durable的首字母。这个时候即使重启 RabbitMQ 队列也依然存在

‍

# 消息持久化

要想让消息实现持久化，需要发送消息的时候添加属性MessageProperties.PERSISTENT_TEXT_PLAIN：

channel.basicPublish("", "hello", MessageProperties.PERSISTENT_TEXT_PLAIN, "Hello".getBytes());

将消息标记为持久化并不能完全保证不会丢失消息。尽管它告诉 RabbitMQ 将消息保存到磁盘，但是这里依然存在这样的情况：当消息存储到硬盘的过程中宕机了，那么就不能真正持久化。但对于我们的简单任务队列而言，这已经绰绰有余了。

如果需要更强有力的持久化策略，在讲发布确认时会讲解。

‍

# 不公平分发

在最开始的时候我们学习到 RabbitMQ 分发消息采用的轮训分发，但是在某种场景下这种策略并不是很好，比方说有两个消费者在处理任务，其中有个消费者 1 处理任务的速度非常快，而另外一个消费者2处理速度却很慢。

这个时候我们还是采用轮训分发的话，就会到这处理速度快的这个消费者很大一部分时间处于空闲状态，而处理慢的那个消费者一直在干活，这种分配方式在这种情况下其实就不太好，但是RabbitMQ 并不知道这种情况它依然很公平的进行分发。

为了避免这种情况，我们可以在消费者代码中设置参数 channel.basicQos(1);

int prefetchCount = 1;
channel.basicQos(prefetchCount);

1
2

‍

同时，我们可以看到控制台中会列出该消费者的Prefetch Count（预取值）

‍

意思就是如果这个任务我还没有处理完或者我还没有应答你，你先别分配给我，我目前只能处理一个任务，然后 RabbitMQ 就会把该任务分配给没有那么忙的那个空闲消费者，当然如果所有的消费者都没有完成手上任务，队列还在不停的添加新任务，队列有可能就会遇到队列被撑满的情况，这个时候就只能添加新的 worker 或者改变其他存储任务的策略。

‍

测试：我们可以在上一节的案例程序中，给Worker03和Worker04都设置上这个值，然后发送多个消息：可以看到Worker04只处理了一个，而Worker03处理了多个。

‍

# 预取值

本身消息的发送就是异步发送的，所以在任何时候，channel 上肯定不止只有一个消息；另外来自消费者的手动确认本质上也是异步的。因此这里就存在一个未确认的消息缓冲区，因此有时候我们希望能限制此缓冲区的大小，以避免缓冲区里面无限制的未确认消息问题。

这个时候就可以通过使用 basic.qos 方法设置“预取计数”值来完成。该值定义通道上允许的未确认消息的最大数量。一旦数量达到配置的数量，RabbitMQ 将停止在通道上传递更多消息，除非至少有一个未处理的消息被确认

例如，假设在通道上有未确认的消息 5、6、7，8，并且通道的预取计数设置为 4，此时RabbitMQ 将不会在该通道上再传递任何消息，除非至少有一个未应答的消息被 ack。比方说 tag=6 这个消息刚刚被确认 ACK，RabbitMQ 将会感知这个情况到并再发送一条消息。

消息应答和 QoS 预取值对用户吞吐量有重大影响。通常，增加预取值将提高向消费者传递消息的速度。虽然自动应答传输消息速率是最佳的，但是，在这种情况下已传递但尚未处理的消息的数量也会增加，从而增加了消费者的 RAM 消耗（随机存取存储器），应该小心使用具有无限预处理的自动确认模式或手动确认模式，消费者消费了大量的消息如果没有确认的话，会导致消费者连接节点的内存消耗变大，所以找到合适的预取值是一个反复试验的过程，不同的负载该值取值也不同， 100 到 300 范围内的值通常可提供最佳的吞吐量，并且不会给消费者带来太大的风险。

预取值为 1 是最保守的。当然这将使吞吐量变得很低，特别是消费者连接延迟很严重的情况下。对于大多数应用来说，稍微高一点的值将是最佳的。