本节介绍元数据的一些基本操作。

前提条件

仅支持对创建集群时,元数据选择统一meta数据库的集群中的元数据进行操作。

新建库

  1. 登录阿里云E-MapReduce控制台
  2. 单击上方的元数据管理
  3. 表管理页面,单击新建库
  4. 新建库对话框中,设置相应的参数。
    建议数据来源设置为OSS
    说明
    • 由于HDFS是每个集群内部文件系统,在没有进行特殊的网络环境设置的情况下,不同集群之间的HDFS无法相互访问,所以EMR表管理功能对数据库和表的创建只支持基于OSS文件系统。
    • 数据库和表的文件路径都不能选择整个OSS bucket,需要选择到OSS bucket下面的目录。
  5. 单击确定
    可单击任务列表查看执行结果,等待状态成功时,表示操作成功;状态失败时,可单击操作列的查看详情,排查失败的原因。

新建表

注意 当前支持创建外部表和使用分区表。
  1. 登录阿里云E-MapReduce控制台
  2. 单击上方的元数据管理
  3. 表管理页面的中间区域,单击已创建的元数据库。
  4. 单击右上角的新建表
  5. 新建表对话框中,设置相应的参数。
    配置项 操作
    表名 填写表名
    字段分隔符 字段分隔符中选择分隔符或者自定义。
    外部表 默认不选中。

    需要创建外部表时,执行以下操作。

    1. 选中外部表复选框,单击文件路径图标,选择文件路径。
    2. 单击新增列,设置相关的参数。
    使用分区 默认
    需要创建使用分区表时,执行以下操作。
    1. 单击
    2. 单击新建分区列,设置相关的参数。
  6. 单击确定
    可单击任务列表查看执行结果,等待状态成功时,表示操作成功;状态失败时,可单击操作列的查看详情,排查失败的原因。

删除表

  1. 登录阿里云E-MapReduce控制台
  2. 单击上方的元数据管理
  3. 表管理页面的中间区域,单击已创建的元数据库。
  4. 单击待删除表操作列的删除
  5. 删除表对话框中,单击确认
    可单击任务列表查看执行结果,等待状态成功时,表示操作成功;状态失败时,可单击操作列的查看详情,排查失败的原因。

删除库

注意 删除数据库之前,必须删除数据库下所有的表。
  1. 登录阿里云E-MapReduce控制台
  2. 单击上方的元数据管理
  3. 表管理页面的中间区域,单击已创建的元数据库。
  4. 单击待删除库操作列的删除
  5. 删除库对话框中,单击确认
    可单击任务列表查看执行结果,等待状态成功时,表示操作成功;状态失败时,可单击操作列的查看详情,排查失败的原因。