智能运维:EMR AI助手快速上手

EMR AI助手(EMR Agent)是阿里云EMR推出的一款智能化工具,旨在助您更高效地管理和运维 EMR集群。通过合理利用EMR AI助手的各项功能,可以快速查询资源信息、唤起相关操作、诊断组件异常、获取技术支持等,能帮您提升运维效率和操作体验。本文为您介绍EMR AI助手的使用方法及对话示例,请您根据实际业务场景选择使用。

适用范围

  • 产品限制:EMR AI助手功能处于公测阶段,目前产品形态仅支持EMR on ECS。

  • 支持地域:华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)、西南1(成都)。

功能概览

EMR AI助手支持智能对话、异常诊断、操作唤起等几部分功能。

功能

说明

智能对话

在运维或使用EMR过程中,如果不熟悉操作流程或遇到问题时,可以求助EMR AI助手。EMR AI助手可以为您提供即时的智能问答服务,快速获得技术支持、提供解决方案或文档指引。

异常诊断

当遇到开源组件状态异常或运维操作执行失败时,您只需描述异常情况,EMR AI助手将通过智能诊断工具快速排查异常,提供详细的诊断报告和解决方案,提升运维效率。

操作唤起

EMR AI助手提供运维操作工具,如查看集群详情、集群扩容或修改组件配置等。您可以描述运维需求,通过EMR AI助手唤起操作卡片,并在操作卡片中确认参数后可直接发起操作。

使用场景

在大规模EMR集群管理中,常面临以下挑战:

  • 操作入口分散,查找困难

  • 组件异常排查流程复杂

  • 权限策略配置繁琐

  • 新手用户学习成本高

EMR AI助手解决方案: 利用自然语言理解能力,将复杂的运维动作转化为简单对话,显著缩短问题响应时间,降低人为错误风险,提升运维效率和操作体验。

权限说明

  • 主账号用户:可直接使用 EMR AI助手功能。

  • RAM 用户:需主账号授予以下权限方可正常使用。

    • 基础会话权限(必选):用于使用智能问答、查看历史会话、反馈建议等功能。需要给RAM用户添加以下emr-agent相关权限。

      # RAM用户通过该权限才可以使用EMR AI助手的智能对话、异常诊断、操作咨询等相关功能。
      {
        "Version": "1",
        "Statement": [
          {
            "Effect": "Allow",
            "Action": [
              "emr-agent:ListSession",
              "emr-agent:ListMessage",
              "emr-agent:DeleteSession",
              "emr-agent:FeedbackOnMessage",
              "emr-agent:ChatCompletion",
              "emr-agent:GetPresignedUrl",
              "emr-agent:UpdateCard"
            ],
            "Resource": "*"
          }
        ]
      }

      或者直接添加AliyunEMRFullAccess、AliyunEMRDevelopAccess系统策略权限。

    • 运维操作权限(按需):若需通过AI助手执行实际运维操作(如扩容、修改配置),还需具备对应集群的操作权限。请参考RAM用户授权完成授权配置。

快速开始

  1. 打开 EMR AI助手

    登录EMR on ECS控制台在应用侧边栏中单击image图标进入会话界面。image

  2. 发起对话

    在输入框中使用自然语言提出您的问题或需求,例如:

    • “如何开启弹性伸缩?”

    • “我的集群服务是否正常?”

    • “给集群扩容2Task节点”

    系统将自动识别意图并返回相应结果。

重要
  • EMR AI助手生成的结果不能作为最终的技术支持结论或业务决策依据。对于根据EMR AI助手输出采取行动所导致的任何直接或间接损失,阿里云不承担法律责任。

  • EMR AI助手的查询信息由AI自动生成,无法保证完全准确,仅供参考使用,建议您结合实际情况验证其准确性。

功能详解

智能对话

EMR AI助手支持智能对话功能,主要包括:

  • 提供关于阿里云EMR的全面知识解答,包括产品功能、使用场景等。

  • 支持自然语言交互,能够理解您的提问意图并尽可能给出准确回答。

  • 能够处理复杂问题,并提供解决方案。

示例

  • 如何为集群配置弹性伸缩

  • 查看账户下有哪些EMR集群

  • 查看集群服务是否正常

  • 如何修改服务配置

例如在EMR AI助手中输入如何为集群配置弹性伸缩,EMR AI助手会为您展示配置弹性伸缩的详细指导说明。image.gif

异常诊断

EMR AI助手支持异常诊断功能,主要包括:

  • 针对开源组件的异常问题进行智能诊断,分析可能的原因和解决方案。

  • 针对集群操作的报错信息进行分析,提供解决方案。

  • 支持实时监控指标的分析提供问题排查步骤和修复建议,帮助您快速定位问题。

示例

  • Zookeeper状态异常,该如何处理

  • 节点内存占用异常,该如何解决

例如在EMR AI助手中输入Zookeeper状态异常,该如何处理?,EMR AI助手会展示关于Zookeeper状态异常的排查建议。image.gif

例如在EMR AI助手中输入扩容失败,EMR AI助手会展示关于扩容失败操作的排查建议。

image.gif

操作唤醒

EMR AI助手支持操作唤醒功能,支持的操作如下:

  • 修改服务组件配置

  • 集群扩容

  • 修改集群引导操作配置

  • 查看资源列表(集群、集群模板、服务组件、节点组、引导脚本、弹性伸缩规则)

  • 查看操作历史

示例

例如在EMR AI助手中输入为集群扩容Task节点,EMR AI助手会展示集群扩容操作卡片,待用户确认后将执行扩容操作。

image.gif

反馈与支持

我们欢迎您在使用EMR AI助手的过程中,对其回复进行评价反馈(通过imageimage图标),以帮助EMR AI助手不断学习和改进,从而为您提供更加准确和高效的服务。