使用API为LLM智能问答版创建网站数据导入任务-智能开放搜索 OpenSearch-阿里云

新增网站任务。

URL

POST /v4/openapi/app-groups/[appGroupIdentity]/chatos/spiders

HTTP

POST

JSON

参数	类型	必须	描述
url	String	是	网站链接：一个应用下url不能重复。
category	String	是	类目：该字段会放到主表的category字段，用于区分不同的网站导入数据。一个应用下面category不能重复。
urlRegex	List<String>	否	url过滤：用于网页url过滤，基于正则表达式，支持多个过滤条件。默认的URL过滤规则为以url的开头的网站地址。比如网站url为`http://www.abc.com/`，则默认正则表达式为：`http://www\.abc\.com/.*`。
xpathSelectors	List<String>	否	xpath选择器：用于精准获取网页内容，基于Xpath选择器，支持多个配置。比如要精确获取div标签下的内容，该项设为：`//div`。
cssSelectors	List<String>	否	css选择器：用于精准获取网页内容，基于CSS选择器，支持多个配置。比如要精确获取div标签下class为content的内容，<div class="content">网页内容</div> 该项设为：`div.content`。

请求体示例：

{ 
 "category": "opensearch产品文档"
 "url": "http://xxx"
}

参数	类型	描述
errors	List	错误内容。
status	String	status：执行结果，OK为成功，FAIL为失败，请根据返回错误码进行排查。
request_id	String	当前请求ID。
code	String	错误码。
message	String	错误信息。
latency	String	延迟时间。

响应体示例：

{
 "status" : "OK",
 "requestId" : "",
 "httpCode": 200,
 "code": "",
 "message": "",
 "latency" : 123
 
}