RabbitMQ学习笔记
一.消息队列MQ
1. 什么是MQ
MQ(Message Queue) : 翻译为消息队列,通过典型的生产者
和消费者
模型,生产者不断向消息队列中生产消息,消费者不断的从队列中获取消息。因为消息的生产和消费都是异步
的,而且只关心消息的发送和接收,没有业务逻辑的侵入
,轻松的实现系统间解耦。别名为 消息中间件通过利用高效可靠的消息传递机制进行平台无关的数据交流,并基于数据通信来进行分布式系统的集成。
2. MQ有哪些
ActiveMQ、RabbitMQ,Kafka,RocketMQ等。
3. 不同MQ的特点
- ActiveMQ
单机吞吐量:万级
topic数量都吞吐量的影响:
时效性:ms级
可用性:高,基于主从架构实现高可用性
消息可靠性:有较低的概率丢失数据
功能支持:MQ领域的功能极其完备
总结:
非常成熟,功能强大,在早些年业内大量的公司以及项目中都有应用
偶尔会有较低概率丢失消息
现在社区以及国内应用都越来越少,官方社区现在对ActiveMQ 5.x维护越来越少,几个月才发布一个版本
主要是基于解耦和异步来用的,较少在大规模吞吐的场景中使用
- RabbitMQ
单机吞吐量:万级
topic数量都吞吐量的影响:
时效性:微秒级,延时低是一大特点。
可用性:高,基于主从架构实现高可用性
消息可靠性:
功能支持:基于erlang开发,所以并发能力很强,性能极其好,延时很低
总结:
erlang语言开发,性能极其好,延时很低;
吞吐量到万级,MQ功能比较完备
开源提供的管理界面非常棒,用起来很好用
社区相对比较活跃,几乎每个月都发布几个版本分
在国内一些互联网公司近几年用rabbitmq也比较多一些 但是问题也是显而易见的,RabbitMQ确实吞吐量会低一些,这是因为他做的实现机制比较重。
erlang开发,很难去看懂源码,基本职能依赖于开源社区的快速维护和修复bug。- RocketMQ
单机吞吐量:十万级
topic数量都吞吐量的影响:topic可以达到几百,几千个的级别,吞吐量会有较小幅度的下降。可支持大量topic是一大优势。
时效性:ms级
可用性:非常高,分布式架构
消息可靠性:经过参数优化配置,消息可以做到0丢失
功能支持:MQ功能较为完善,还是分布式的,扩展性好
总结:
接口简单易用,可以做到大规模吞吐,性能也非常好,分布式扩展也很方便,社区维护还可以,可靠性和可用性都是ok的,还可以支撑大规模的topic数量,支持复杂MQ业务场景
而且一个很大的优势在于,源码是java,我们可以自己阅读源码,定制自己公司的MQ,可以掌控
社区活跃度相对较为一般,不过也还可以,文档相对来说简单一些,然后接口这块不是按照标准JMS规范走的有些系统要迁移需要修改大量代码- Kafka
单机吞吐量:十万级,最大的优点,就是吞吐量高。
topic数量都吞吐量的影响:topic从几十个到几百个的时候,吞吐量会大幅度下降。所以在同等机器下,kafka尽量保证topic数量不要过多。如果要支撑大规模topic,需要增加更多的机器资源
时效性:ms级
可用性:非常高,kafka是分布式的,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用
消息可靠性:经过参数优化配置,消息可以做到0丢失
功能支持:功能较为简单,主要支持简单的MQ功能,在大数据领域的实时计算以及日志采集被大规模使用
总结:
kafka的特点其实很明显,就是仅仅提供较少的核心功能,但是提供超高的吞吐量,ms级的延迟,极高的可用性以及可靠性,而且分布式可以任意扩展
同时kafka最好是支撑较少的topic数量即可,保证其超高吞吐量
kafka唯一的一点劣势是有可能消息重复消费,那么对数据准确性会造成极其轻微的影响,在大数据领域中以及日志采集中,这点轻微影响可以忽略二. 初识RabbitMQ
基于AMQP协议,erlang语言开发,是部署最广泛的开源消息中间件,是最受欢迎的开源消息中间件之一
1. AMQP协议
AMQP是一种协议,更准确的说是一种binary wire-level protocol(链接协议)。这是其和JMS的本质差别,AMQP不从API层进行限定,而是直接定义网络交换的数据格式。这使得实现了AMQP的provider天然性就是跨平台的。以下是AMQP协议模型:
如图所示,生产者(Publisher)将消息发送给虚拟主机(Virtual host)中的交换机(Exchange),交换机和消息队列(Message Queue)之间有绑定关系,消费者(Consumer)通过消息队列来消费消息。三. RabbitMQ配置
1. RabbitMQ管理命令行
①. 服务启动相关
systemctl start rabbitmq-server
:启动RabbitMQsystemctl restart rabbitmq-server
:重启RabbitMQsystemctl stop rabbitmq-server
:停止RabbitMQsystemctl status rabbitmq-server
:查看RabbitMQ的状态②. 管理命令行
rabbitmqctl help
:查看更多命令,用来在不使用web管理界面情况下命令操作RabbitMQ③. 插件管理命令行
rabbitmq-plugins list
:列出所有插件rabbitmq-plugins enable
:启动插件rabbitmq-plugins disable
:关闭插件2.Web管理界面
(1)Overview概览
connections
:无论生产者还是消费者,都需要与RabbitMQ建立连接后才可以完成消息的生产和消费,在这里可以查看连接情况channels
:通道,建立连接后,会形成通道,消息的投递获取依赖通道Exchanges
:交换机,用来实现消息的路由Queues
:队列,即消息队列,消息存放在队列中,等待消费,消费后被移除队列(2) Admin用户和虚拟主机管理
Ⅰ添加用户
上面的Tags选项,其实是指定用户的角色,可选的有以下几个:
超级管理员(administrator):可登陆管理控制台,可查看所有的信息,并且可以对用户,策略(policy)进行操作
监控者(monitoring):可登陆管理控制台,同时可以查看
rabbitmq节点的相关信息(进程数,内存使用情况,磁盘使用情况等)
策略制定者(policymaker):可登陆管理控制台, 同时可以对policy进行管理。但无法查看节点的相关信息
(上图红框标识的部分)
普通管理者(management):仅可登陆管理控制台
,无法看到节点信息,也无法对策略进行管理
其他:无法登陆管理控制台
,通常就是普通的生产者和消费者Ⅱ 创建虚拟主机
Ⅲ 绑定虚拟主机和用户
创建好虚拟主机,我们还要给用户添加访问权限:
点击添加好的虚拟主机:
进入虚拟机设置界面
RabbitMQ的第一个程序
1. AMQP协议回顾
产者通过通道发送消息,每个生产者对应一个虚拟主机,需要将虚拟主机和用户绑定之后才有访问权限。消息要不要放到交换机中取决于所使用的消息模型,消息不放到交换机时会直接放到消息队列中。消费者和生产者是解耦的,它只关心消息队列中有没有相应的消息,消费者消费消息时也需要连接虚拟主机。2. AMQP支持的消息模型
3. 使用rabbitmq需要引入的依赖
1
2
3
4
5
<dependency>
<groupId>com.rabbitmq</groupId>
<artifactId>amqp-client</artifactId>
<version>5.7.2</version>
</dependency>
1 |
|
6. 第三种模型(fanout)
fanout:扇出,也称为广播
在广播模式下,消息发送流程是这样的:
- 可以有多个消费者
- 每个消费者有自己的queue(队列)
- 每个队列都要绑定到Exchange(交换机)
- 生产者发送的消息,只能发送到交换机,交换机来决定要发给哪个队列,生产者无法决定
- 交换机把消息发送给绑定过的所有队列
- 队列的消费者都能拿到消息。实现一条消息被多个消费者消费
7. 第四种模型(Routing之订阅模型-Direct)
在Fanout模式中,一条消息,会被所有订阅的队列都消费。但是,在某些场景下,我们希望不同的消息被不同的队列消费。这时就要用到Direct类型的Exchange。
在Direct模型下:
- 队列与交换机的绑定,不能是任意绑定了,而是要指定一个RoutingKey(路由key)
- 消息的发送方在 向 Exchange发送消息时,也必须指定消息的 RoutingKey。
- Exchange不再把消息交给每一个绑定的队列,而是根据消息的Routing Key进行判断,只有队列的Routingkey与消息的 Routing key完全一致,才会接收到消息
- P:生产者,向Exchange发送消息,发送消息时,会指定一个routing key。
- X:Exchange(交换机),接收生产者的消息,然后把消息递交给 与routing key完全匹配的队列
- C1:消费者,其所在队列指定了需要routing key 为 error 的消息
- C2:消费者,其所在队列指定了需要routing key 为 info、error、warning 的消息
8. 第五种模型(Routing之订阅模型-Topic)
Topic类型的Exchange与Direct相比,都是可以根据RoutingKey把消息路由到不同的队列。只不过Topic类型Exchange可以让队列在绑定Routing key的时候使用通配符!这种模型Routingkey 一般都是由一个或多个单词组成,多个单词之间以”.”分割,例如: item.insert
统配符:
- *:匹配恰好1个单词
- #:匹配一个或多个单词
如: - audit.#:匹配audit.irs.corporate或者audit.irs等
- audit.*:只能匹配audit.irs
- *.audit.#:中间必须是audit,audit前有一个或多个单词,后有一个单词
四、MQ的应用场景
1. 异步处理
(1) 场景说明
用户注册后,需要发注册邮件和注册短信,传统的做法有两种 1.串行的方式 2.并行的方式
(2) 串行方式
将注册信息写入数据库后,发送注册邮件,再发送注册短信,以上三个任务全部完成后才返回给客户端。 这有一个问题是,邮件,短信并不是必须的,它只是一个通知,而这种做法让客户端等待没有必要等待的东西
(3) 并行方式
将注册信息写入数据库后,发送邮件的同时,发送短信,以上三个任务完成后,返回给客户端,并行的方式能提高处理的时间。
(4) 消息队列
假设三个业务节点分别使用50ms,串行方式使用时间150ms,并行使用时间100ms。虽然并行已经提高的处理时间,但是,前面说过,邮件和短信对我正常的使用网站没有任何影响,客户端没有必要等着其发送完成才显示注册成功,应该是写入数据库后就返回. 消息队列: 引入消息队列后,把发送邮件,短信不是必须的业务逻辑异步处理
由此可以看出,引入消息队列后,用户的响应时间就等于写入数据库的时间+写入消息队列的时间(可以忽略不计),引入消息队列后处理后,响应时间是串行的3倍,是并行的2倍
2. 应用解耦
(1) 场景
双11是购物狂节,用户下单后,订单系统需要通知库存系统,传统的做法就是订单系统调用库存系统的接口.
(2) 缺点
当库存系统出现故障时,订单就会失败。 订单系统和库存系统高耦合. 引入消息队列
(3) 订单系统
用户下单后,订单系统完成持久化处理,将消息写入消息队列,返回用户订单下单成功。
(4) 库存系统
订阅下单的消息,获取下单消息,进行库操作。 就算库存系统出现故障,消息队列也能保证消息的可靠投递,不会导致消息丢失
3. 流量削峰
(1) 场景
秒杀活动,一般会因为流量过大,导致应用挂掉,为了解决这个问题,一般在应用前端加入消息队列。
(2) 作用
- 可以控制活动人数,超过此一定阀值的订单直接丢弃
- 可以缓解短时间的高流量压垮应用(应用程序按自己的最大处理能力获取订单)
(3) 注意
- 用户的请求,服务器收到之后,首先写入消息队列,加入消息队列长度超过最大值,则直接抛弃用户请求或跳转到错误页面.
- 秒杀业务根据消息队列中的请求信息,再做后续处理