云消息队列 Kafka 版可以作为Output接入Logstash。本文说明如何在公网环境下通过Logstash向云消息队列 Kafka 版发送消息。
前提条件
在开始本教程前,请确保您已完成以下操作:- 购买并部署云消息队列 Kafka 版实例。具体操作,请参见公网和VPC接入。
- 下载并安装Logstash。具体操作,请参见Download Logstash。
- 下载并安装JDK 8。具体操作,请参见Download JDK 8。
步骤一:获取接入点
Logstash通过云消息队列 Kafka 版的接入点与云消息队列 Kafka 版建立连接。
在概览页面的资源分布区域,选择地域。
- 在实例列表页面,单击作为Output接入Logstash的实例的名称。
在实例详情页面的接入点信息区域,获取实例的接入点。在配置信息区域,获取用户名与密码。
说明不同接入点的差异,请参见接入点对比。
步骤二:创建Topic
创建用于存储消息的Topic。
在概览页面的资源分布区域,选择地域。
重要Topic需要在应用程序所在的地域(即所部署的ECS的所在地域)进行创建。Topic不能跨地域使用。例如Topic创建在华北2(北京)这个地域,那么消息生产端和消费端也必须运行在华北2(北京)的ECS。
在实例列表页面,单击目标实例名称。
在左侧导航栏,单击Topic 管理。
在Topic 管理页面,单击创建 Topic。
在创建 Topic面板,设置Topic属性,然后单击确定。
参数
说明
示例
名称
Topic名称。
demo
描述
Topic的简单描述。
demo test
分区数
Topic的分区数量。
12
存储引擎
说明当前仅专业版实例支持选择存储引擎类型,标准版暂不支持,默认选择为云存储类型。
Topic消息的存储引擎。
云消息队列 Kafka 版支持以下两种存储引擎。
云存储:底层接入阿里云云盘,具有低时延、高性能、持久性、高可靠等特点,采用分布式3副本机制。实例的规格类型为标准版(高写版)时,存储引擎只能为云存储。
Local 存储:使用原生Kafka的ISR复制算法,采用分布式3副本机制。
云存储
消息类型
Topic消息的类型。
普通消息:默认情况下,保证相同Key的消息分布在同一个分区中,且分区内消息按照发送顺序存储。集群中出现机器宕机时,可能会造成消息乱序。当存储引擎选择云存储时,默认选择普通消息。
分区顺序消息:默认情况下,保证相同Key的消息分布在同一个分区中,且分区内消息按照发送顺序存储。集群中出现机器宕机时,仍然保证分区内按照发送顺序存储。但是会出现部分分区发送消息失败,等到分区恢复后即可恢复正常。当存储引擎选择Local 存储时,默认选择分区顺序消息。
普通消息
日志清理策略
Topic日志的清理策略。
当存储引擎选择Local 存储(当前仅专业版实例支持选择存储引擎类型为Local存储,标准版暂不支持)时,需要配置日志清理策略。
云消息队列 Kafka 版支持以下两种日志清理策略。
Delete:默认的消息清理策略。在磁盘容量充足的情况下,保留在最长保留时间范围内的消息;在磁盘容量不足时(一般磁盘使用率超过85%视为不足),将提前删除旧消息,以保证服务可用性。
Compact:使用Kafka Log Compaction日志清理策略。Log Compaction清理策略保证相同Key的消息,最新的value值一定会被保留。主要适用于系统宕机后恢复状态,系统重启后重新加载缓存等场景。例如,在使用Kafka Connect或Confluent Schema Registry时,需要使用Kafka Compact Topic存储系统状态信息或配置信息。
重要Compact Topic一般只用在某些生态组件中,例如Kafka Connect或Confluent Schema Registry,其他情况的消息收发请勿为Topic设置该属性。具体信息,请参见云消息队列 Kafka 版Demo库。
Compact
标签
Topic的标签。
demo
创建完成后,在Topic 管理页面的列表中显示已创建的Topic。
步骤三:Logstash发送消息
在安装了Logstash的机器上启动Logstash,向创建的Topic发送消息。
- 执行cd命令切换到logstash的bin目录。
- 执行以下命令下载kafka.client.truststore.jks证书文件。
wget -O kafka.client.truststore.jks https://github.com/AliwareMQ/aliware-kafka-demos/blob/master/kafka-log-stash-demo/vpc-ssl/mix.4096.client.truststore.jks
- 创建jaas.conf配置文件。
- 执行命令
vim jaas.conf
创建空的配置文件。 按i键进入插入模式。
- 输入以下内容。
KafkaClient { org.apache.kafka.common.security.plain.PlainLoginModule required username="XXX" password="XXX"; };
参数 描述 示例值 username 公网/VPC实例的用户名。 alikafka_pre-cn-v0h1*** password 公网/VPC实例的密码。 GQiSmqbQVe3b9hdKLDcIlkrBK6*** 按Esc键回到命令行模式。
按:键进入底行模式,输入wq,然后按回车键保存文件并退出。
- 执行命令
- 创建output.conf配置文件。
- 执行命令
vim output.conf
创建空的配置文件。 按i键进入插入模式。
- 输入以下内容。
input { stdin{} } output { kafka { bootstrap_servers => "alikafka-pre-cn-zv**********-1.alikafka.aliyuncs.com:9093,alikafka-pre-cn-zv**********-2.alikafka.aliyuncs.com:9093,alikafka-pre-cn-zv**********-3.alikafka.aliyuncs.com:9093" topic_id => "logstash_test" security_protocol => "SASL_SSL" sasl_mechanism => "PLAIN" jaas_path => "/home/logstash-7.6.2/bin/jaas.conf" ssl_truststore_password => "KafkaOnsClient" ssl_truststore_location => "/home/logstash-7.6.2/bin/kafka.client.truststore.jks" ssl_endpoint_identification_algorithm => "" } }
参数 描述 示例值 bootstrap_servers 云消息队列 Kafka 版提供的公网接入点为SSL接入点。 alikafka-pre-cn-zv**********-1.alikafka.aliyuncs.com:9093,alikafka-pre-cn-zv**********-2.alikafka.aliyuncs.com:9093,alikafka-pre-cn-zv**********-3.alikafka.aliyuncs.com:9093 topic_id Topic的名称。 logstash_test security_protocol 安全协议。默认为SASL_SSL,无需修改。 SASL_SSL sasl_mechanism 安全认证机制。默认为PLAIN,无需修改。 PLAIN jaas_path jaas.conf配置文件位置。 /home/logstash-7.6.2/bin/jaas.conf ssl_truststore_password kafka.client.truststore.jks证书密码。默认值为KafkaOnsClient,无需修改。 KafkaOnsClient ssl_truststore_location kafka.client.truststore.jks证书位置。 /home/logstash-7.6.2/bin/kafka.client.truststore.jks ssl_endpoint_identification_algorithm SSL接入点辨识算法。6.x及以上版本Logstash需要加上该参数。 空值 按Esc键回到命令行模式。
按:键进入底行模式,输入wq,然后按回车键保存文件并退出。
- 执行命令
- 向创建的Topic发送消息。
- 执行
./logstash -f output.conf
。 - 输入test,然后按回车键。
- 执行
步骤四:查看Topic分区
查看消息发送到Topic的情况。
在概览页面的资源分布区域,选择地域。
在实例列表页面,单击目标实例名称。
在左侧导航栏,单击Topic 管理。
在Topic 管理页面,找到目标Topic,在其操作列中,选择 。
表 1. 分区状态信息 参数
说明
分区ID
该Topic分区的ID号。
最小位点
该Topic在当前分区下的最小消费位点。
最大位点
该Topic在当前分区下的最大消费位点。
分区消息量
该Topic在当前分区下的消息总量。
最近更新时间
本分区中最近一条消息的存储时间。
步骤五:按位点查询消息
您可以根据发送的消息的分区ID和位点信息查询该消息。
在概览页面的资源分布区域,选择地域。
在实例列表页面,单击目标实例名称。
在左侧导航栏,单击消息查询。
在消息查询页面的查询方式列表中,选择按位点查询。
在Topic列表中,选择消息所属Topic名称;在分区列表中,选择消息所属的分区;在起始位点文本框,输入消息所在分区的位点,然后单击查询。
展示该查询位点及以后连续的消息。例如,指定的分区和位点都为“5”,那么返回的结果从位点“5”开始。
表 2. 查询结果参数解释 参数
描述
分区
消息的Topic分区。
位点
消息的所在的位点。
Key
消息的键(已强制转化为String类型)。
Value
消息的值(已强制转化为String类型),即消息的具体内容。
消息创建时间
发送消息时,客户端自带的或是您指定的
ProducerRecord
中的消息创建时间。说明如果配置了该字段,则按配置值显示。
如果未配置该字段,则默认取消息发送时的系统时间。
如果显示值为1970/x/x x:x:x,则说明发送时间配置为0或其他有误的值。
0.9及以前版本的云消息队列 Kafka 版客户端不支持配置该时间。
操作
单击下载 Key:下载消息的键值。
单击下载 Value:下载消息的具体内容。
重要查询到的每条消息在控制台上最多显示1 KB的内容,超过1 KB的部分将自动截断。如需查看完整的消息内容,请下载相应的消息。
下载的消息最大为10 MB。如果消息超过10 MB,则只下载10 MB的内容。
更多信息
更多参数设置,请参见Kafka output plugin。