Python RabbitMQ原理和使用场景以及模式
RabbitMQ 是实现了高级消息队列协议(AMQP)的开源消息代理软件。
一、RabbitMQ 原理简介
1. RabbitMQ 角色
- 生产者:消息的创建者,负责创建和推送数据到消息服务器;
- 消费者:消息的接收方,用于处理数据和确认消息;
- 代理:就是RabbitMQ本身,负责消息的传递。
2. 连接 RabbitMQ 方式
客户端通过 TCP 连接到 RabbitMQ Server。
连接成功后 RabbitMQ 会创建一个 AMQP 信道。
信道是创建在 TCP 上的虚拟连接,AMQP 命令都是通过信道发送出去的,每个信道都会有一个唯一的 ID,不论是发布消息,订阅队列或者介绍消息都是通过信道完成的。
3. RabbitMQ 中的关键词
- Producer (生产者):消息生产者
- Consumer(消费者):消息的消费者
- Connection(连接):就是一个TCP的连接,Producer 和 Consumer 都是通过 TCP 连接到 RabbitMQ Server 的。
- Channel(信道):他是虚拟连接,他建立在 Connection 的 TCP 连接中。也就是说他是消息推送使用的通道;
- Exchange(交换器):是生产者发布消息的通道,接收生产者消息并将消息路由到消息队列;
- Queue(队列):是消费者接受消息的通道,用于存储生产者的消息;
- RoutingKey(路由键):用于把生成者的数据分配到交换器上;
- BindingKey(绑定键):用于把交换器的消息绑定到队列上;
4. RabbitMQ 消息持久化
RabbitMQ 会将持久化的消息写入磁盘上的持久化日志文件,等消息被消费之后,RabbitMQ 会把这条消息标识为等待垃圾回收。
RabbitMQ 默认情况下是关闭消息持久化的。需要在创建队列的时候设置。
设置如下:
- 队列持久化
durable=True消息的生产者和接收者都需要设置队列持久化
# durable=True 队列持久化 channel.queue_declare(queue='test', durable=True)只做队列持久化是不行的还需要在加上消息持久化
- 消息持久化
delivery_mode=2
channel.basic_publish( exchange="", routing_key="test", body="hello world", properties=pika.BasicProperties(delivery_mode=2,))- 消息持久化的缺点
因为要写入硬盘要比写入内存性能较低很多,从而降低了服务器的吞吐量。
4. RabbitMQ 虚拟主机
- 虚拟主机概念
虚拟主机是 RabbitMQ 创建的虚拟消息服务器。为了在一个 RabbitMQ 上实现多用户隔离。为此提供了一个虚拟主机(virtual hosts - vhosts)的概念。
二、RabbitMQ 模式
前三个说的是 RabbitMQ 的 Exchange 的类型。RPC 是消费者和生产者互通的一种方式。
1. Direct 直连交换机
当一个绑定了routing_key = 1的消息被发送给直连交换机时,交换机会把消息发送给绑定了routing_key = 1的队列。
直连交换机经常用来循环分发任务给多个消费者。然后消息的负载均衡是发生在消费者之间的,而不是队列之间。
如下例:
消息生产者
import pika config = pika.ConnectionParameters( host='127.0.0.1', credentials=pika.PlainCredentials('test','test'),)# 创建 MQ 连接 conn = pika.BlockingConnection(config) channel = conn.channel()# 在频道中创建一个队列 channel.exchange_declare(exchange='ceshi',type='direct')# 发送消息到指定队列# exchange 指定交换器# routing_key 设置路由键# body 发送的内容 channel.basic_publish( exchange='ceshi', routing_key='1', body='Hello World!') conn.close()消息消费者
import pika config = pika.ConnectionParameters( host='127.0.0.1', port=5672, credentials=pika.PlainCredentials('test','test'),)# 创建 MQ 连接 conn = pika.BlockingConnection(config) channel = conn.channel()# 如果使用exchange, 这里检测 exchange 是否存在,如不存在创建。存在检测是否正确且是否符合 exchange_type 类型 channel.exchange_declare(exchange='ceshi', exchange_type='direct')# 在频道中创建一个队列 channel.queue_declare(queue='hello')# 将队列绑定到指定的 exchange# routing_key 类似密钥,只接收 routing_key 正确的信息 channel.queue_bind(exchange='ceshi', queue='hello', routing_key='1')# 回调函数四个必须的参数 body 是传入的内容# channel: BlockingChannel# method: spec.Basic.Deliver# properties: spec.BasicProperties# body: str or unicodedefcallback(channel, method, properties, body):print channel print method print properties print body # 指定队列调用的函数# no_ack 参数 True 时处理完成后没有返回信息。False 时在处理完后应答 channel.basic_consume( callback, queue='hello', no_ack=False)print'waiting ...' channel.start_consuming()注意\color{red}{注意}注意:在修改消费者的routing_key后,需要重新创建队列。
2. Fanout 扇型交换机(订阅者模式)
他回将消息发送给绑定到它身上的所有队列,而不理会绑定的路由键。
如果 N 个队列绑定到某个扇型交换机上,当有消息发送给此扇型交换机时,交换机会将消息的拷贝分别发送给这所有的N个队列。
扇型交换机实现消息的广播。
以下几个应用场景体育比赛用它来给手机客户端发送比分数据广播各种状态和产品的更新在群聊时分发消息给群聊中的用户
消息生产者
#!coding=utf-8import pika config = pika.ConnectionParameters( host='127.0.0.1', credentials=pika.PlainCredentials('test','test'),) conn = pika.BlockingConnection(config) channel = conn.channel()# 修改 type 为 fanout channel.exchange_declare(exchange='ceshi2',type='fanout') channel.basic_publish( exchange='ceshi2', routing_key='', body='Hello World!') conn.close()在生产者中只需要修改 exchange_declare 他的 type 为 fanout 即可
消息消费者
#! coding=utf-8import pika config = pika.ConnectionParameters( host='127.0.0.1', port=5672, credentials=pika.PlainCredentials('test','test'),) conn = pika.BlockingConnection(config) channel = conn.channel() channel.exchange_declare(exchange='ceshi2', exchange_type='fanout')# 订阅者模式# 生成随机 queue_name# 订阅者之间的 queue name 不能重复 result = channel.queue_declare(exclusive=True) queue_name = result.method.queue channel.queue_bind(exchange='ceshi2', queue=queue_name, routing_key='')defcallback(channel, method, properties, body):print channel print method print properties print body channel.basic_consume( callback, queue=queue_name, no_ack=False)print'waiting ...' channel.start_consuming()3. Topic 主题交换机(模糊匹配)
通过发送者和接收者之间的routing_key相互匹配,将消息路由给一个或多个队列。
主题交换机通常用来实现消息的多路由广播
以下应用场景发布不同分类或者不同标签的新闻(例如,发送游戏类新闻和体育类新闻)系统中不同种类服务的调用(例如:发布系统和付费系统的调用)
例如:
接收者(消费者) routing_key='a.*'
发送者(生产者) routing_key = 'a.b.c.d'
结果:匹配失败
因为:* 表示匹配一个单词# 表示匹配0个或多个单词
消息生产者
#!coding=utf-8import pika config = pika.ConnectionParameters( host='127.0.0.1', credentials=pika.PlainCredentials('test','test'),) conn = pika.BlockingConnection(config) channel = conn.channel()# 修改 type 为 topic channel.exchange_declare(exchange='ceshi3',type='topic') channel.basic_publish( exchange='ceshi3', routing_key='a.b.c.d', body='Hello World!') conn.close()消息消费者
#! coding=utf-8import pika config = pika.ConnectionParameters( host='127.0.0.1', port=5672, credentials=pika.PlainCredentials('test','test'),) conn = pika.BlockingConnection(config) channel = conn.channel() channel.exchange_declare(exchange='ceshi3', exchange_type='topic') channel.queue_declare(queue='hello')# routing_key='a.*' 此时是无法接受到信息的,因为生产者发送的是 a.* a. 后面一个单词。修改 routing_key='a.#' 即可接受成功 channel.queue_bind(exchange='ceshi3', queue='hello', routing_key='a.*')defcallback(channel, method, properties, body):print channel print method print properties print body channel.basic_consume( callback, queue='hello', no_ack=False)print'waiting ...' channel.start_consuming()4. RPC
生产者发送消息给消费者,并接收消费者处理完的结果
原理:生产者会创建一个新的队列,用来接收消费者返回的信息。生产者在发送消息的同时,还会发送 1步骤中创建的队列名和一个correlation_id用来验证当消费者处理完数据后,会把结果和correlation_id发送到 1步骤创建的队列中去生产者会使用一个循环while来监测返回结果self.response生产者获取到数据后比对correlation_id是否一致,然后结束此次发送流程
消息生产者
#! coding=utf-8import pika import uuid classRpcClient(object):def__init__(self): config = pika.ConnectionParameters( host='127.0.0.1', credentials=pika.PlainCredentials('test','test'),) self.conn = pika.BlockingConnection(config) self.channel = self.conn.channel()# 在频道中创建一个队列 result = self.channel.queue_declare(exclusive=True)# 生成队列名 self.queue_name = result.method.queue # 指定队列要调用的函数 self.channel.basic_consume( self.on_request, no_ack=True, queue=self.queue_name )defon_request(self, channel, method, props, body):if self.corr_id == props.correlation_id: self.response = body defcall(self, message): self.response =None self.corr_id =str(uuid.uuid4)# 发送消息到指定队列 self.channel.basic_publish( exchange='', routing_key='rpc',# 消费者返回处理结果需要的队列信息(reply_to)和相关 id(correlation_id).# 以便消费者知道返回给那个生产者 properties=pika.BasicProperties( reply_to=self.queue_name, correlation_id=self.corr_id ), body=message )while self.response isNone:# 是一个等待消息的阻塞过程,连接的任何消息都可以使它脱离阻塞状态 self.conn.process_data_events()return self.response fibonacci_rpc = RpcClient()print"等待处理结果" response = fibonacci_rpc.call('Hello World!')print"处理完返回信息: %s"% response 消息消费者
#! coding=utf-8import pika import time config = pika.ConnectionParameters( host='127.0.0.1', credentials=pika.PlainCredentials('test','test'),) conn = pika.BlockingConnection(config) channel = conn.channel() channel.exchange_declare(exchange='rpc') channel.queue_declare(queue='rpc')defon_request(channel, method, props, body):print'处理中, 收到内容:%s'% body # 发送消息到指定队列# exchange 指定 exchange# routing_key 设置为队列的名称# body 发送的内容 channel.basic_publish( exchange='',# props.reply_to 是生产者发送过来 接收处理结果的 指定队列 routing_key=props.reply_to, properties=pika.BasicProperties(correlation_id=props.correlation_id), body='处理完成')# 告知 rabbit 消息已经处理完 channel.basic_ack(delivery_tag=method.delivery_tag)# 使用basic_qos设置prefetch_count=1,使得rabbitmq不会在同一时间给工作者分配多个任务,只有工作者完成任务之后,才会再次接收到任务 channel.basic_qos(prefetch_count=1)# 接收的结果调用 on_request 函数处理 channel.basic_consume(on_request, queue='rpc')print("waiting....")# 开始接收信息,并进入阻塞状态,队列里有信息才会调用callback进行处理 channel.start_consuming() conn.close()三、RabbitMQ 使用场景
1. 任务相互依赖
例:
三个任务,任务1、任务2、任务3。他们之间有相互的制约。执行任务1的前提是要有任务2的结果。执行任务2需要任务3的结果。
一般会使用crontab来做计划任务。预估一下每个任务的完成时间。然后制定任务。当数量变大处理时间变成,就需要经常修改crontab任务。
使用 RabbitMQ 后每个任务结束时只需要发送一个结束信息即可
如:任务2订阅任务3的信息。当任务3完成后发送一个完成消息。任务2接收到完成消息后开始执行,在执行结束后发送任务2完成消息。任务1订阅任务2的消息,然后执行。
优点:
- 任务执行时间发生变化,不需要修改
crontab任务 - 每个任务之间的预留时间没有了
2. 下发任务后不关心结果
例:
有三个用户A、B、C 他们分别发送文章,但后台会根据用户的级别做不同的操作。
A 是普通用户,系统发布。
B 是 VIP 用户,系统发布和推荐给关注这部分内容的客户。
C 是黑卡客户,系统发布、推荐给关注这部分内容的客户、在这个分类中置顶这篇文章。
文章发布服务只关心是否成功,剩下的操作都不关心。可以使用 RabbitMQ 服务将其他操作分离。
优点:
- 减少发布时间,只操作发布,其他操作由别的系统执行。
- 解耦,系统之间不在直接关联。
- 新增发布以后的其他操作不需要在修改发布系统代码。
3. 任务执行时间很长还需要等待结果
例:
有一个操作 A。用户执行这个任务后,又非常需要结果。
解决方法:
- 用户调用操作 A。
- 操作 A 直接返回调用成功。此时只是调用成功。
- 操作 A 告诉后台应该执行什么程序。
- 后台执行完成后,将完成消息发送给 RabbitMQ。
- 用户订阅 RabbitMQ 中的操作 A 的消息。
为什么不是后台直接将结果发送给用户呢。因为一旦增加了订阅用户,就需要修改后台程序,这样很恶心。
四、开启 WEB 服务
RabbitMQ 自带管理后台,安装后需要配置开启
进入 RabbitMQ 安装目录中的 sbin 目录执行
rabbitmq-plugins enable rabbitmq_management http://localhost:15672/
用户名密码均为guest