本文为您介绍如何管理EMR Notebook内的笔记本。
笔记本概述
笔记本是进行程序开发的载体,每个笔记本对应一个.ipynb文件。您可以在一个工作空间内创建一个或多个笔记本。
每个笔记本由单元格(Cell)组成。目前EMR Notebook支持以下类型的单元格:
SQL:用于编辑和运行SQL代码。
Python:用于编辑和运行Python程序。
Markdown:用于进行文本编辑,支持Markdown的语法。
新建笔记本
进入EMR Notebook页面。
在左侧导航栏,选择EMR Workbench > Notebook。
在Notebook页面,单击目标工作空间操作列的控制台。
在文件浏览器页面,单击。
在弹出的添加笔记本对话框中,输入名称,单击确定,新建一个笔记本。
(可选)在文件浏览器页面,将鼠标悬浮至目标笔记本,右键选择重命名,可以对目标笔记本进行重命名操作。
运行笔记本
启动机器。
您可以通过工作空间设置 > 机器,单击启动按钮来启动机器。
配置访问方式。
您可以根据程序代码类型进行配置。
SQL
当程序代码为SQL时,需要提前配置数据库,并在SQL单元格中,选择合适的目标数据库。配置数据库的具体操作,请参见管理数据库。
PySpark
当程序代码为PySpark时,需要提前添加外部集群,详情请参见管理外部集群。如果您绑定的集群,集群存储根路径使用了OSS-HDFS,则在运行PySpark时,还需授予Notebook访问OSS-HDFS的权限,具体操作请参见授予EMR Notebook访问OSS-HDFS的权限。
Python
当程序代码为Python时,可以在机器启动后,直接运行单元格。
运行单元格。
运行所有单元格:在目标笔记本页面,单击上方的运行所有单元格。
运行单个单元格:在目标单元格中,单击左侧的按钮。
运行选中语句:在SQL放大模式下,选中需要执行的语句,单击上方的运行选中。
(可选)停止机器。
为了避免资源浪费,您可以运行笔记本后,通过工作空间设置 > 机器,单击停止按钮来停止机器。
说明机器空闲1小时后,将自动停止。
机器停止后,再次启动机器时,需要手动重新安装您自定义添加的第三方库。
复制笔记本
您可以参照以下方法复制出一个同名、且配置相同的笔记本,但默认不会自动启动新建笔记本的机器。
在文件浏览器页面,将鼠标悬浮至目标笔记本,右键选择复制。
在目标Notebook的右上角,选择 > 复制。
删除笔记本
删除后的笔记本无法恢复,请谨慎操作。
您可以参照以下方法删除笔记本:
在文件浏览器页面,将鼠标悬浮至目标笔记本,右键选择删除。
在目标Notebook的右上角,选择>删除。
导出笔记本
您可以参照以下方法导出笔记本(.ipynb文件):
在文件浏览器页面,将鼠标悬浮至目标笔记本,右键选择导出。
在目标Notebook的右上角,选择 > 导出。
导入笔记本
在文件浏览器页面,单击图标。
选择导出到本地的笔记本(.ipynb文件)。