什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言程序的代码的编写、调试和执行。

公测说明

详细信息,请参见EMR Notebook公测说明

产品优势

EMR Notebook可以为大数据用户带来全新的数据分析和数据开发体验。

  • 统一平台

    EMR Notebook支持多种开发语言,包括SQL和Python等。不论是进行SQL交互式查询还是PySpark程序开发,都可以在同一个开发环境中完成,无需在多种工具中进行切换。它支持EMR多种类型的集群,无需复杂配置,即可实现与EMR集群服务的连通,开箱即用。

  • 协同开发

    支持团队内多用户同时访问EMR Notebook,每个用户的Notebook开发环境是独立的,互不影响,实现高效协作。

  • 兼容开源

    EMR Notebook兼容开源Jupyter Notebook,您可以通过文件导入、导出的方式实现开发工具的自由切换,从而降低了使用门槛。

产品功能

  • 交互式编程环境

    支持逐步执行SQL和Python代码,并根据运行结果调整后续代码。

  • 多种数据源类型

    支持对接EMR集群下的StarRocks、Hive、Spark等多种数据源类型。

  • 数据可视化

    提供原生图表分析能力,并支持对接第三方数据可视化库,例如Matplotlib、Seaborn、Plotly等。

  • 机器资源实时监控

    在数据开发过程中,可以实时展示CPU、RAM的使用情况。