您可以在阿里云的云监控服务中配置监控报警,以监测MaxCompute包年包月资源组、作业消费、Tunnel上传下载的使用情况。

您可以登录云监控服务,添加监控指标,以便实时观察监控图表,了解各监控指标的实时变化。您还可以自定义报警规则、添加报警联系人。当您的Quota组资源达到或超过您设置的阈值,云监控服务会自动为您设置的联系人发送报警通知,报警通知方式支持电话、短信、邮件、钉钉机器人。

监控指标说明

  • MaxCompute-包年包月用户资源
    • 包年包月region配额组CPU使用率:用户在单个Region整体资源组维度的指标,是指每分钟Quota组CPU的使用占资源组整体CPU的百分比。
    • 包年包月region配额组内存使用率:用户在单个Region整体资源组维度的指标,是指每分钟Quota组内存的使用占资源组整体内存的百分比。
  • MaxCompute-包年包月Quota组资源
    • 包年包月配额组CPU使用量:Quota组维度的指标,是指每分钟Quota组CPU的使用量快照。

      例如,您购买150CU,用满1核为100%,最大使用量是15000%。您可以设置监控阈值为大于12000%则报警,如果您收到报警,表示资源组即将满负荷,继续提交作业有可能出现排队的情况。您可以根据您的业务规划,及时升配资源组或者合理规划作业。

    • 包年包月配额组内存使用量:Quota组维度的指标,是指每分钟Quota组内存的使用量快照。

      例如,您购买了150CU,内存最大为150*4=600GB,图表显示实际占用内存量,设置的报警阈值为大于等于550GB。如果您多次收到报警信息,建议您升配资源组。

    • 包年包月配额组作业等待数:Quota组维度的指标,是指每分钟Quota中在排队中的作业总数。

      例如,您根据您的业务特性,设置了大于等于5个作业排队则报警。如果您多次收到报警信息,建议您升配资源组或另外规划作业。

  • MaxCompute-按量付费
    • 日作业消费:以Project为单位,一天累计SQL、MR作业消费金额的监控指标。您可以设置最大日消费金额(元),达到或超过这个阈值会触发报警。
    • 月作业消费:以Project为单位,一个月累计SQL、MR作业消费金额的监控指标。您可以设置最大月消费金额(元),达到或超过这个阈值会触发报警。
  • MaxCompute-通用
    • Tunnel下载流量:以Project为单位的实时下载流量监控指标,您可以设置最大下载流量(bytes/minute),达到或超过这个阈值会触发报警。
    • Tunnel上传流量:以Project为单位的实时上传流量监控指标,您可以设置最大上传流量(bytes/minute),达到或超过这个阈值会触发报警。
    • Tunnel日累计下载数据量:以Project为单位,在一天内该Project累计下载的数据量,您可以设置最大数据量(MB),达到或超过这个阈值会触发报警。
    • Tunnel日累计上传数据量:以Project为单位,在一天内该Project累计上传的数据量,您可以设置最大数据量(MB),达到或超过这个阈值会触发报警。

操作说明

  1. 进入云监控主页。
  2. 登录云监控控制台,选择Dashboard > 自定义大盘,单击添加图表,进入添加图表页面。
  3. 选择图表类型。MaxCompute提供了折线图、面积图、TopN表格、热力图和饼图5种类型,供您选择。
  4. 云产品监控页签,选择MaxCompute-按量计费作为云监控产品。此处供选择的MaxCompute产品有以下几种:
    • MaxCompute-通用:包括Tunnel上传流量、Tunnel下载流量、Tunnel日累计上传数据量、Tunnel日累计下载数据量4个监控指标。
    • MaxCompute-按量付费:包括日作业消费、月作业消费2个监控指标。
    • MaxCompute-包年包月quota组资源:包括包年包月配额组CPU使用量、包年包月配额组内存使用量、包年包月配额组作业等待数3个监控指标。
    • MaxCompute-包年包月用户资源:包括包年包月region配额组CPU使用率、包年包月region配额组内存使用率2个监控指标。
  5. 监控项下拉菜单中配置监控项。MaxCompute-按量付费提供了日作业消费、月作业消费2个监控指标。监控指标的详细信息,请参见监控指标说明
  6. 单击资源,在下拉列表中选择需要监控的Region和Project(可多选)。
  7. 配置完成后,单击发布
  8. 单击导航栏自定义大盘,查看监控项的图表。
说明