通过创建数据源,将阿里云数据库RDS实例(MySQL引擎)或您自建MySQL中指定数据表里的数据同步到您的结构化知识库中。
操作步骤
使用RDS MySQL
访问阿里云百炼的知识库界面,单击创建知识库。
输入知识库名称和知识库描述,数据类型选择结构化数据,然后单击下一步。
数据来源选择关联RDS,数据源类型选择阿里云RDS MySQL。
RDS实例限制:目前只支持MySQL引擎(版本无限制),暂不支持PostgreSQL等其它引擎;实例地域不限;只支持基础系列和高可用系列(暂不支持开启数据库代理);创建RDS实例时,网络类型必须是专有网络,加入白名单需选是(将VPC网段加入到RDS实例白名单中)。
数据库和表限制:知识库只能关联单个数据库中的一张表,不支持多表关联;关联表中的数据量最大为1000万行,且每一行记录的大小必须控制在100KB以内。若最大行数限制无法满足实际业务需求,您可以提交阿里云工单申请调整。
网络类型选择公网或私网,然后单击新建数据源。
新建数据源前需开通阿里云事件总线EventBridge服务,否则保存数据源时会提示
Service not enable
。阿里云百炼与RDS实例必须归属同一阿里云账号;否则请选择自建MySQL(并将RDS视作公网数据源),绕过此限制。
私网数据源仅支持部分地域的RDS实例;其他地域请选择公网数据源。私网数据源在安全性和性能方面更具优势。
新建公网数据源
为确保知识库能正常接收RDS数据,请为RDS实例设置EventBridge白名单。
若未正确设置白名单,保存数据源时会提示
Communications link failure
。填写新建数据源配置。其中,关于数据源名称与地址的说明如下:
配置项
说明
数据源名称
数据源名称在同一个业务空间中应是唯一的。即使数据源创建失败,该名称也无法再次使用。
数据库实例
填写RDS实例ID。请前往RDS控制台,单击左侧导航栏中的实例列表获取。
数据库地址
填写RDS实例的外网地址。您可以在RDS实例的数据库连接界面获取该信息:前往RDS控制台,单击左侧导航栏中的实例列表,然后单击包含数据表的RDS实例。接着,单击左侧导航栏中的数据库连接,即可查看该实例对应的外网地址。
若该 RDS 实例未开通外网地址,请先按照界面指引完成 RDS 外网地址开通。
数据库端口
填写RDS实例的外网端口。该信息同样可以在RDS实例的数据库连接界面获取。
数据库用户名
数据库账号类型需为高权限账号,关于账号说明和获取方式请参见创建账号。
使用普通账号保存数据源时会提示
There is no permission:RELOAD
。单击保存数据源,提交新建任务。系统将为您自动配置RDS数据源,期间当前业务空间会被锁定,禁止同时创建其他数据源。
首次提交任务时,请根据界面指引开通EventBridge服务关联角色,请使用主账号操作。如需使用RAM用户,需主账号为该RAM用户配置必要权限。
在请求高峰时段,创建数据源过程可能需要几分钟,请耐心等待。
状态
说明
创建成功
表示数据源创建成功。请选择该数据源并执行下一步。
创建失败
表示数据源创建失败。请检查各项参数是否正确,修改后单击重试重新创建数据源。您可单击删除,删除创建失败的数据源。
新建私网数据源
填写新建数据源配置。
配置项
说明
数据源名称
数据源名称在同一个业务空间中应是唯一的。即使数据源创建失败,该名称也无法再次使用。
所属地域
数据库实例
填写RDS实例ID。请前往RDS控制台,单击左侧导航栏中的实例列表获取。
数据库地址
填写RDS实例的内网地址。您可以在RDS实例的数据库连接界面获取该信息:前往RDS控制台,单击左侧导航栏中的实例列表,然后单击包含数据表的RDS实例。接着,单击左侧导航中的数据库连接,即可查看该实例对应的内网地址。
数据库端口
填写RDS实例的内网端口。该信息同样可以在RDS实例的数据库连接界面获取。
数据库用户名
数据库账号类型需为高权限账号,关于账号说明和获取方式请参见创建账号。
使用普通账号保存数据源时会提示
There is no permission:RELOAD
。VPC ID
应填写RDS实例的VPC ID。该信息同样可以在RDS实例的数据库连接界面获取。
VSwitch IDs
将鼠标悬浮于RDS实例的VPC ID上即可显示VSwitch ID。
RDS MySQL高可用系列实例可能拥有多个 VSwitch ID,请完整填写该实例关联的所有 VSwitch ID。
安全组ID
该安全组应为直接创建,非由第三方产品或服务间接创建。您可以前往ECS控制台的安全组界面创建安全组。该安全组需满足以下要求:
安全组的地域需与上方所属地域保持一致;
安全组的网络需选择RDS所在的VPC;
安全组类型支持普通安全组和企业级安全组。
安全组的网络入方向未设置任何访问限制;
正确示例:
错误示例:
单击保存数据源,提交新建任务。系统将为您自动配置RDS数据源,期间当前业务空间会被锁定,禁止同时创建其他数据源。
首次提交任务时,请根据界面指引开通EventBridge服务关联角色,请使用主账号操作。如需使用RAM用户,需主账号为该RAM用户配置必要权限。
在请求高峰时段,创建数据源过程可能需要几分钟,请耐心等待。
状态
说明
创建成功
表示数据源创建成功。请选择该数据源并执行下一步。
创建失败
表示数据源创建失败。请检查各项参数是否正确,修改后单击重试重新创建数据源。您可单击删除,删除创建失败的数据源。
使用自建MySQL
访问阿里云百炼的知识库界面,单击创建知识库。
输入知识库名称和知识库描述,数据类型选择结构化数据,然后单击下一步。
数据来源选择关联RDS,数据源类型选择自建MySQL。
自建MySQL限制:必须部署在阿里云ECS实例(地域不限)上;目前只支持MySQL 5.6、5.7和8.0;不支持MySQL代理Proxy。
数据库和表限制:知识库只能关联单个数据库中的一张表,不支持多表关联;关联表中的数据量最大为1000万行,且每一行记录的大小必须控制在100KB以内。若最大行数限制无法满足实际业务需求,您可以提交阿里云工单申请调整。
网络类型选择公网或私网,然后单击新建数据源。
新建数据源前需开通阿里云事件总线EventBridge服务,否则保存数据源时会提示
Service not enable
。私网数据源仅支持部分地域的ECS实例;其他地域请选择公网数据源。私网数据源在安全性和性能方面更具优势。
新建公网数据源
为确保知识库能正常接收数据,请为您的自建MySQL配置EventBridge白名单。
若未正确配置白名单,保存数据源时会提示
Communications link failure
。填写新建数据源配置。
配置项
说明
数据源名称
数据源名称在同一个业务空间中应是唯一的。即使数据源创建失败,该名称也无法再次使用。
数据库地址
填写您自建MySQL的公网地址。
数据库端口
填写您自建MySQL的端口。
数据库用户名
填写您在前面加白步骤中执行过GRANT授权的数据库账号。
单击保存数据源,提交新建任务。系统将为您自动配置自建MySQL数据源,期间当前业务空间会被锁定,禁止同时创建其他数据源。
首次提交任务时,请根据界面指引开通EventBridge服务关联角色,请使用主账号操作。如需使用RAM用户,需主账号为该RAM用户配置必要权限。
在请求高峰时段,创建数据源过程可能需要几分钟,请耐心等待。
状态
说明
创建成功
表示数据源创建成功。请选择该数据源并执行下一步。
创建失败
表示数据源创建失败。请检查各项参数是否正确,修改后单击重试重新创建数据源。您可单击删除,删除创建失败的数据源。
新建私网数据源
为确保知识库能正常接收数据,请为您的自建MySQL配置EventBridge白名单。
若未正确配置白名单,保存数据源时会提示
Communications link failure
。填写新建数据源配置。
配置项
说明
数据源名称
数据源名称在同一个业务空间中应是唯一的。即使数据源创建失败,该名称也无法再次使用。
所属地域
数据库地址
填写您自建MySQL的私网地址。您可以在ECS的实例界面获取该信息:前往ECS控制台,单击左侧导航栏中的实例,即可查看对应实例的私网地址。
数据库端口
填写您自建MySQL的端口。
数据库用户名
填写您在前面加白步骤中执行过GRANT授权的数据库账号。
VPC ID
填写您自建MySQL所部署ECS实例所在VPC的实例ID(vpc-xxxxxx)。该信息同样可以前往ECS控制台获取。
VSwitch IDs
实例VPC ID下方即是VSwitch ID(vsw-xxxxxx)。
安全组ID
该安全组应为直接创建,非由第三方产品或服务间接创建。您可以前往ECS控制台的安全组界面创建安全组。该安全组需满足以下要求:
安全组的地域需与上方所属地域保持一致;
安全组的网络需选择ECS所在的VPC;
安全组类型支持普通安全组和企业级安全组。
入方向未设置任何访问限制;
正确示例:
错误示例:
单击保存数据源,提交新建任务。系统将为您自动配置MySQL数据源,期间当前业务空间会被锁定,禁止同时创建其他数据源。
首次提交任务时,请根据界面指引开通EventBridge服务关联角色,请使用主账号操作。如需使用RAM用户,需主账号为该RAM用户配置必要权限。
在请求高峰时段,创建数据源过程可能需要几分钟,请耐心等待。
状态
说明
创建成功
表示数据源创建成功。请选择该数据源并执行下一步。
创建失败
表示数据源创建失败。请检查各项参数是否正确,修改后单击重试重新创建数据源。您可单击删除,删除创建失败的数据源。
下一步
基于已创建的数据源,配置结构化知识库的索引。具体操作请参见知识库:创建知识库中的“索引配置”部分。
计费说明
新建数据源功能本身不收费。
阿里云数据库RDS和阿里云百炼知识库之间的数据同步通过阿里云事件总线EventBridge服务实现,您需要支付相关的费用。关于EventBridge服务的费用详情,请参见计费概述。