您可以在阿里云的云监控服务中配置监控报警,以监测MaxCompute预付费资源组的使用情况。

您可以登录云监控服务,添加监控指标,以便实时观察监控图表,了解Quota组的资源利用率。您还可以自定义报警规则、添加报警联系人。当您的Quota组资源达到或超过您设置的阈值,云监控服务会自动为您设置的联系人发送报警通知,报警通知方式支持电话、短信、邮件、钉钉机器人。

监控指标说明

  • 预付费配额组CPU使用量:Quota组维度的指标,是指每分钟Quota组CPU的使用量快照。

    例如,您购买150CU,用满1核为100%,最大使用量是15000%。您可以设置监控阈值为大于12000%则报警,如果您收到报警,表示资源组即将满负荷,继续提交作业有可能出现排队的情况。您可以根据您的业务规划,及时升配资源组或者合理规划作业。

  • 预付费配额组作业等待数:Quota组维度的指标,是指每分钟Quota中在排队中的作业总数。

    例如,您根据您的业务特性,设置了大于等于5个作业排队则报警。如果您多次收到报警信息,建议您升配资源组或另外规划作业。

  • 预付费配额组内存使用量:Quota组维度的指标,是指每分钟Quota组内存的使用量快照。

    例如,您购买了150CU,内存最大为150*4=600GB,图表显示实际占用内存量,设置的报警阈值为大于等于550GB。如果您多次收到报警信息,建议您升配资源组。

  • 预付费配额组整体CPU使用率:用户在单个Region整体资源组维度的指标,是指每分钟Quota组CPU的使用占比。

    例如,您购买了150CU,目前使用量为5000%,CPU使用占比为5000/15000=33.33%。此时,您可以将报警阈值设置为大于等于90% ,以便提前感知CPU的使用情况。

  • 预付费配额组整体内存使用率:用户在单个Region整体资源组维度的指标,是指每分钟Quota组内存的使用占比。

    例如,您购买了150CU,内存最大为150*4=600GB,目前内存使用了150GB,内存使用占比为150/600=25%。此时,您可以将报警阈值设置为大于等于90%,以便提前感知内存的使用情况。

操作说明

  1. 进入云监控主页。

  2. 登录云监控控制台,选择Dashboard > 自定义大盘,单击创建监控大盘

  3. 单击添加图表,选择MaxCompute-预付费作为云监控产品。

  4. 选择监控项。MaxCompute提供了以下两类共5种预付费的监控指标:
    • QuotaGroup(Quota组维度,包括二级Quota组):预付费配额组CPU使用量、预付费配额组作业等待数、预付费配额组内存使用量。
    • User(主账号维度):预付费配额组整体CPU使用率、预付费配额组整体内存使用率。



  5. 选择Region和要监控的Quota组,单击发布完成一个监控项的图表配置。

  6. 查看监控项的图表。

  7. 配置报警规则,详情请参见创建阈值报警规则
  8. 配置报警联系人,详情请参见创建报警联系人/报警联系组