在阿里云公共云AnalyticDB for MySQL环境运行和测试TPC-H(Transaction ProcessingPerformance Council)标准benchmark测试集之前,您需要完成以下准备工作。

  • 通过以下步骤在对象存储 OSS(Object Storage Service)中创建存储TPC-H标准benchmark测试集数据的目录。
    1. 开通OSS服务

      OSS与AnalyticDB for MySQL所属Region相同。

    2. 创建存储空间
    3. 新建目录
      本示例中将使用以下OSS存储路径:
      • "endpoint":"oss-cn-beijing.aliyuncs.com"
      • "accessid":"MyAccessID"
      • "accesskey":"MyAccessKey"
      • "URL":"oss://tpchtest100g/table_name/"
  • 根据AnalyticDB for MySQL快速入门,完成创建实例、设置白名单、创建账号和数据库等准备工作。
  • 下载TPC-H标准benchmark测试集。
  • 生成TPC-H标准测试集数据。

    下载TPC-H测试集后,使用测试集自带的dbgen工具生成CSV格式的测试数据集,并根据需要生成的数据集大小指定scale factor参数值。例如,若要生成100G的TPC-H测试数据,则需要指定scale factor值为100:dbgen -s100。如果需要生成更大的数据集,可以通过dbgen工具的并发选项来加快数据生成速度。

    一般一张TPC-H表可以只生成一个数据文件,但当scale factor值较大(例如10000)且使用dbgen工具的并发选项生成数据时,一张表会产生多个数据文件。

  • 将测试集数据上传至阿里云OSS。

    生成TPC-H测试数据集后,将测试数据集上传到OSS的该路径下oss://tpchtest100g/table_name/

    如果一张表对应一个文件,可以直接将所有文件上传至一个OSS目录中。如果是并发生成的表,会对应生成多个数据文件,建议将一张表的多个数据文件上传至独立的子目录中,后续导入外表时只需指定相应子目录即可。

  • 在AnalyticDB for MySQL中创建TPC-H表和OSS外表,通过OSS外表导入数据。
  • 执行和测试TPC-H查询。