管理笔记本

本文为您介绍如何管理EMR Notebook内的笔记本。

笔记本概述

笔记本是进行程序开发的载体,每个笔记本对应一个.ipynb文件。您可以在一个工作空间内创建一个或多个笔记本。

每个笔记本由单元格(Cell)组成。目前EMR Notebook支持以下类型的单元格:

  • SQL:用于编辑和运行SQL代码。

  • Python:用于编辑和运行Python程序。

  • Markdown:用于进行文本编辑,支持Markdown的语法。

新建笔记本

  1. 进入EMR Notebook页面。

    1. 登录E-MapReduce控制台

    2. 在左侧导航栏,选择EMR Workbench > Notebook

    3. 在Notebook页面,单击目标工作空间操作列的控制台

  2. 文件浏览器页面,单击image

  3. 在弹出的添加笔记本对话框中,输入名称,单击确定,新建一个笔记本。

  4. (可选)在文件浏览器页面,将鼠标悬浮至目标笔记本,右键选择重命名,可以对目标笔记本进行重命名操作。

运行笔记本

  1. 启动机器。

    您可以通过工作空间设置 > 机器,单击启动按钮来启动机器。

  2. 配置访问方式。

    您可以根据程序代码类型进行配置。

    SQL

    当程序代码为SQL时,需要提前配置数据库,并在SQL单元格中,选择合适的目标数据库。配置数据库的具体操作,请参见管理数据库

    PySpark

    当程序代码为PySpark时,需要提前添加外部集群,详情请参见管理外部集群。如果您绑定的集群,集群存储根路径使用了OSS-HDFS,则在运行PySpark时,还需授予Notebook访问OSS-HDFS的权限,具体操作请参见授予EMR Notebook访问OSS-HDFS的权限

    Python

    当程序代码为Python时,可以在机器启动后,直接运行单元格。

  3. 运行单元格。

    • 运行所有单元格:在目标笔记本页面,单击上方的运行所有单元格

    • 运行单个单元格:在目标单元格中,单击左侧的image按钮。

    • 运行选中语句:在SQL放大模式下,选中需要执行的语句,单击上方的运行选中

  4. (可选)停止机器。

    为了避免资源浪费,您可以运行笔记本后,通过工作空间设置 > 机器,单击停止按钮来停止机器。

    说明
    • 机器空闲1小时后,将自动停止。

    • 机器停止后,再次启动机器时,需要手动重新安装您自定义添加的第三方库。

复制笔记本

您可以参照以下方法复制出一个同名、且配置相同的笔记本,但默认不会自动启动新建笔记本的机器。

  • 文件浏览器页面,将鼠标悬浮至目标笔记本,右键选择复制

  • 在目标Notebook的右上角,选择image > 复制

删除笔记本

重要

删除后的笔记本无法恢复,请谨慎操作。

您可以参照以下方法删除笔记本:

  • 文件浏览器页面,将鼠标悬浮至目标笔记本,右键选择删除

  • 在目标Notebook的右上角,选择image>删除

导出笔记本

您可以参照以下方法导出笔记本(.ipynb文件):

  • 文件浏览器页面,将鼠标悬浮至目标笔记本,右键选择导出

  • 在目标Notebook的右上角,选择image > 导出

导入笔记本

  1. 文件浏览器页面,单击image图标。

  2. 选择导出到本地的笔记本(.ipynb文件)。