DSW(Data Science Workshop)是为算法开发者量身打造的一站式AI开发平台,集成了JupyterLab、WebIDE、Terminal多种云端开发环境,提供代码编写、调试及运行的沉浸式体验。DSW提供丰富的异构计算资源,支持挂载OSS、NAS、CPFS类型的数据集,预置了多种开源框架的镜像,支持实例的生命周期管理,实现开箱即用的高效开发模式。
快速入门
您可以参考如下视频,快速了解DSW支持的主要功能。
功能特性
一站式服务
DSW支持挂载OSS、NAS、CPFS等文件系统,支持接入MaxCompute数据。
提供了DLC和EAS工具,实现了从数据处理到开发调试、训练模型以及将模型部署的AI开发全链路。
灵活易用
提供丰富的异构计算资源,包括公共资源组和专有资源组,用户可以灵活选择和变更配置。
支持多种开源框架的镜像,并且支持用户制作自定义镜像。
内置Notebook、WebIDE、Terminal等开发环境,满足个性化开发需求。
除Python之外,还支持R语言和SQL语句的编写和执行。
精细化管理
支持定时关机、闲置关机等生命周期管理配置,帮助用户节省成本。
提供CPU/GPU/内存水位实时监控,让用户实时掌握资源使用情况,及时调整任务分配和优化代码性能。
场景化实践
Notebook Gallery提供了LLM、AIGC前沿领域的教程案例,打造属于开发者的内容平台,支持用户快速上手,以及对感兴趣的内容进行二次开发。
企业级能力
工作空间管理员可以进行全局资源分配,以及配置资源回收策略。
应用场景
机器学习和数据科学
DSW支持JupyterLab交互式编程环境,预置了PyTorch、Tensorflow等丰富的镜像,算法人员和数据科学家可以轻松地进行数据工程、模型开发和训练、可视化分析等任务,无需担心资源运维和环境配置。
AIGC和大模型
Notebook Gallery提供了海量前沿案例,以Notebook的形式介绍了热门场景的最佳实践,如Stable Diffusion、Llama2、通义千问等。用户可以直接在DSW运行这些教程,在实践中学习,也可以基于教程二次开发,打造自己的创意场景。
AI+大数据一体化
DSW除了支持Python和R语言之外,还对接了大数据的能力,用户能够通过SQL File插件,使用SQL语句对MaxCompute数据源进行数据查询,或通过Notebook连接EMR集群提交Spark任务。