实践教程
- 通过DolphinScheduler提交Spark任务
- 通过Serverless Spark提交PySpark流任务
- 通过spark-submit命令行工具提交Spark任务
- 通过Apache Airflow使用Livy Operator提交任务
- 通过Apache Airflow向EMR Serverless Spark提交任务
- 通过Jupyter Notebook与Serverless Spark进行交互
- 通过实时计算Flink和Paimon实现流批一体
- 在EMR Serverless Spark中实现MaxCompute读写操作
- 在PySpark程序中使用Python第三方库
- 在Notebook中使用Python第三方库
- EMR Serverless Spark连接外部Hive Metastore
- 在EMR Serverless Spark中使用Paimon
- 在EMR Serverless Spark中使用Hudi
- 在EMR Serverless Spark中使用Iceberg