AHBench是由阿里云数据库HBase团队研发的benchmark测试套件。
该测试套件集成了YCSB(Yahoo! Cloud Serving Benchmark)工具,YCSB提供了测试集合、测试流程控制、结果汇聚等功能。借助该测试套件,您可以通过简单配置,一键执行性能测试。
下载工具
下载AHBench,上传到压测客户端并解压。
注意事项
- 该测试套件使用”ahbenchtest-read”与”ahbenchtest-write” 两个表作为测试用表。测试过程中可能会删除再创建这两张表。请确保这两张表可以安全地被删除。
- 测试压力可能将被测系统压垮,请勿在生产环境中运行该测试工具。
- 确保测试集群有足够的存储空间。
- ECS为虚拟运行环境,同一机型下的性能测试结果可能存在5%~10%的波动,处于预期范围之内。
运行环境
请确保压测客户端运行环境满足:
- Linux系统
- JDK 1.8 +
- python 2.7
- 建议客户端CPU配置为独享16Core以上
配置HBase集群地址
- 在AHBench/conf/hbase-site.xml路径下配置需要测试的HBase集群地址。
- 云数据库HBase标准版配置zk地址请参见使用HBase Shell访问。
- 云数据库HBase增强版地址配置请参见使用HBaseue Shell访问增强版集群。
配置运行时环境变量
在AHBench/conf/ahbench-env.properties路径下配置工具运行的环境变量。
vi AHBench/conf/ahbench-env.properties
# 配置JDK的安装地址。如果java已经在系统PATH中,可以跳过该配置。
# JAVA_HOME=/usr/java/jdk1.8.0/
# 配置被测HBase集群的版本,如果为1.x版本则填1,如果为2.x版本则填2。
HBASE_VERSION=2
配置测试相关参数(可选)
在AHBench/conf/ahbench-settings.properties路径下配置测试相关的参数,如压缩、编码、线程数、数据量、字段大小等,默认不需要修改,如有需求可根据场景进行定制修改。
说明 部分参数仅在特定HBase版本支持,如ZSTD压缩、INDEX编码仅在云数据库HBase增强版支持,您可以通过配置ZSTD+INDEX获得更好性能。
# 配置被测表的压缩算法,可选项有:
# NONE LZO ZSTD SNAPPY GZ LZ4 ZSTD 等
# 注意部分被测系统可能不支持指定的压缩算法
# 云数据库HBase性能增强版推荐使用ZSTD
ahbench.table.compression=SNAPPY
# 配置被测表的编码算法,可选项有:
# NONE DIFF INDEX
# 注意部分被测系统可能不支持指定的编码算法
# 云数据库HBase性能增强版推荐使用INDEX
ahbench.table.encoding=DIFF
启动测试
- 快速测试集
测试数据量1000万,整体运行时间大约40分钟(视被测HBase系统可能有变化),至少需要总存储空间20 GB。
cd AHBench ./fast_test
- 完整测试集
测试数据量20亿,整体运行时间大约25小时(视被测HBase系统可能有变化),至少需要总存储空间2 TB。
cd AHBench ./full_test
若要重复进行该测试,可以通过跳过数据导入阶段(上一次测试已成功运行),减少运行时间。跳过导入阶段,整体测试运行时间大约3.5小时(视被测HBase系统可能有变化)。
cd AHBench ./full_test --skipload
测试结果分析
测试完成后,会在当前目录生成CSV文件。CSV(Comma-Separated Values)文件全称为逗号分隔值文件。可以将测试结果复制到Excel、Numbers等数据分析软件中做进一步对比分析。
CSV文件结果如图所示:
常见问题
如果测试中遇到错误退出,请检查如下事项:
- JAVA_HOME是否正确设置,是否安装了Python运行环境。
- 被测集群地址是否填写正确。
- 被测集群HBase版本是否填写正确。
- 被测集群是否支持测试所指定的压缩算法。
- 被测集群状态是否正常服务。