更新时间:2020-10-10 10:02
机器学习SQL提供以SQL的方式训练和预测机器学习模型。利用机器学习SQL,您可以迅速对DMS中已有的数据库数据进行更深入的分析和建模,提升对数据的分析效率,盘活对历史数据的利用率,最终达到以数据驱动产生的目的。
目前机器学习SQL支持的数据库类型有:
目前机器学习SQL支持的机器学习算法有:
机器学习SQL旨在帮助企业降低在机器学习领域的成本。一是人员成本,资深的机器学习算法科学家都比较稀缺,用人成本较高。二是算法科学家与业务人员的沟通成本,懂业务的人员未必能掌握机器学习的算法,但只需要掌握SQL,就能尝试解决部分机器学习场景的问题。
“机器学习SQL”第一版在个人版的DMS中上线,你可以通过导航栏的“SQL操作”中看到它:
界面介绍
场景介绍
machine_learning_default_
,可以在“跨实例SQL查询”窗口编辑维护。算法 | Functions | 具体说明 |
---|---|---|
聚类 | auto_cluster_learn、auto_cluster_predict | 自动智能选取最好聚类算法(Plan) |
Kmeans | kmeans_learn、kmeans_predict | [Kmeans] |
回归 | auto_regression_learn、auto_regression_predict | 自动智能选取最好的回归算法(Plan) |
Linear Regression | regression_learn、regression_predict | [Linear Regression] |
0/1分类 | auto_binary_classify_learn、auto_binary_classify_predict | 自动智能选取最好的二元分类算法(Plan) |
Logistic Regression | logistic_learn、logistic_predict | [Logistic Regression] |
Decision Tree(classify) | cla_decision_tree_learn、cla_decision_tree_predict | [Decision Tree] |
Random Forest | random_forest_learn、random_forest_predict | [Random Forest] |
model_explain
string model_explain(model)
名称 | 类型 | 说明 |
---|---|---|
model | VARBINARY | 模型 |
介绍:无监督学习的聚类算法
函数:kmeans_learn
model kmeans_learn (json | string | array feature, int k)
名称 | 类型 | 说明 |
---|---|---|
feature | json | 向量特征,只能输入jsonarray。例:[1,2,3] 、[3.5,2,5.2] 。 |
feature | arrary | 同上,例:array[1,2,3] 。 |
featureJsonStr | string | string表达的jsonarray。 |
K | int | 聚类个数 |
名称 | 类型 | 说明 |
---|---|---|
model | VARBINARY | 模型输出 |
函数:kmeans_predict
int kmeans_predict(model, json | string | array feature)
名称 | 类型 | 说明 |
---|---|---|
feature | json | 向量特征,只能输入jsonarray。例:[1,2,3] 、[3.5,2,5.2] 。 |
feature | arrary | 同上,例:array[1,2,3] 。 |
featureJsonStr | string | string表达的jsonarray。 |
model | VARBINARY | 模型 |
名称 | 类型 | 说明 |
---|---|---|
result | int | 所属的类别 |
介绍:线性回归,可预测连续值的输出。
函数:regression_learn
model regression_learn(json | string | array feature, double | int label)
名称 | 类型 | 说明 |
---|---|---|
feature | json | 向量特征,只能输入jsonarray。例:[1,2,3] 、[3.5,2,5.2] 。 |
feature | arrary | 同上,例:array[1,2,3] 。 |
featureJsonStr | string | string表达的jsonarray。 |
label | int | 观测值 |
label | double | 观测值 |
名称 | 类型 | 说明 |
---|---|---|
model | VARBINARY | 模型输出 |
函数:regression_predict
double regression_predict(model, json | string | array feature)
名称 | 类型 | 说明 |
---|---|---|
feature | json | 向量特征,只能输入jsonarray。例:[1,2,3] 、[3.5,2,5.2] 。 |
feature | arrary | 同上,例:array[1,2,3] 。 |
featureJsonStr | string | string表达的jsonarray。 |
model | VARBINARY | 模型 |
名称 | 类型 | 说明 |
---|---|---|
result | double | 预测值 |
介绍:监督学习算法,用于做0/1分类。
函数:logistic_learn
model logistic_learn(json | string | array feature, double | int label)
名称 | 类型 | 说明 |
---|---|---|
feature | json | 向量特征,只能输入jsonarray。例:[1,2,3] 、[3.5,2,5.2] 。 |
feature | arrary | 同上,例:array[1,2,3] 。 |
featureJsonStr | string | string表达的jsonarray |
label | int | 观测值,一定要0或者1 |
label | double | 观测值,一定要0或者1 |
名称 | 类型 | 说明 |
---|---|---|
model | VARBINARY | 模型输出 |
函数:logistic_predict
int logistic_predict(model, json | string | array feature)
名称 | 类型 | 说明 |
---|---|---|
feature | json | 向量特征,只能输入jsonarray。例:[1,2,3] 、[3.5,2,5.2] 。 |
feature | arrary | 同上,例:array[1,2,3] 。 |
featureJsonStr | string | string表达的jsonarray |
model | VARBINARY | 模型 |
名称 | 类型 | 说明 |
---|---|---|
result | double | 预测值,0或者1 |
在文档使用中是否遇到以下问题
更多建议
匿名提交