机器学习介绍

RDS MySQL机器学习(RDS MySQL Machine Learning)是一种集成在RDS MySQL服务中的完全托管、简化机器学习流程的解决方案。通过简单的SQL命令即可实现基于目标数据的模型训练以及数据预测,支撑企业AI业务发展。

公测说明

RDS MySQL机器学习服务已开启公测,您可以通过阿里云账号(主账号)提交公测申请,审核通过后即可开启机器学习服务。公测期间有如下限制:

  • 仅支持如下地域以及可用区下的实例使用机器学习服务:

    • 华东1(杭州):可用区G、可用区H、可用区I

    • 华北2(北京):可用区G、可用区H、可用区K

    • 华东2(上海):可用区B、可用区E、可用区G

    • 华南1(深圳):可用区D、可用区E

  • 仅提供一个机器学习内网连接地址,且该连接地址不支持修改。

    说明

    机器学习的连接地址仅用于机器学习服务,请勿用于常规读写业务。

  • 仅支持模型训练(TRAIN)与预测(PREDICT)。

  • 模型训练过程会从RDS MySQL实例中拉取数据到机器学习服务内置存储中,内置存储空间限制为50 GB,拉取的数据超过50 GB将无法进行模型训练。

架构图

架构图

组件介绍

  • 用户ECS:访问RDS的客户端。

  • 数据库代理:提供RDS MySQL机器学习和数据库独享代理两种服务,两者互不干扰。根据用户发送的请求类型的不同,数据库代理会自动解析请求并通过ML Route或RW Route路由至相应服务。

    • ML Route:RDS MySQL机器学习的扩展SQL请求会通过ML Route路由至RDS MySQL机器学习平台进行建模、训练、预测等操作。

    • RW Route:普通的SQL请求(如读写分离的请求)会通过RW Route路由至后端RDS实例执行。

    说明

    公测期间RDS MySQL机器学习服务和数据库独享代理服务各自拥有单独的域名,不会区分不同请求进行路由。

  • RDS:RDS MySQL实例。

  • ML:RDS MySQL机器学习,负责对您指定的数据进行建模、训练以及通过训练完成的模型预测用户数据。

工作方式

通过ML Route将机器学习的SQL请求发送至RDS内置的机器学习平台,基于指定的RDS MySQL实例中的数据进行模型训练,使用训练完成的模型预测用户数据,并返回最终结果。

功能介绍

image

在传统数据库+AI的模式下,实现AI数据智能处理需要数据过滤、特征工程、模型训练、部署、服务等多个阶段,需要不同系统、组件和人员来完成,涉及大量运维管理工作。

RDS MySQL机器学习基于蚂蚁金服的开源机器学习工具SQLFlow,发挥云数据库RDS的服务优势,降低人工智能应用的技术门槛,让技术人员使用AI如同操作SQL一样简单。通过扩展的SQL,即可实现机器学习模型的训练、部署、预测和管理操作,节省了大量时间和人力成本。

RDS MySQL机器学习的主要特点如下:

  • 自动化的模型训练:RDS MySQL机器学习会根据您定义的训练数据集和算法自动进行模型创建和训练,通过用户指定的模型和预测数据集自动生成预测结果。

  • 简易的模型管理:通过表来记录模型信息,提供完整的模型管理能力。

  • 扩展的SQL访问:与AI相关的操作都通过扩展的SQL来实现,让您可以和操作数据库一样来操作机器学习的流程。例如模型的创建、训练、预测等。

  • 数据安全:您指定用于模型训练的数据以及模型只会在RDS服务内部流转,不会离开RDS服务,保证数据的安全性。

适用场景

  • 机器学习过程中对数据安全有要求,需要进行风控识别的场景。

  • 需要基于RDS MySQL数据,实现业务智能推荐的场景。