进阶指南

param clazz rpcface 模型类,通过 clazz 参数可以判断当前调用的是哪个 RPC 模型类*@param method 当前 RPC 调用的方法。throws RpcException*@return true 表示继续向下执行,false 表示中断当前请求,抛出 RpcException,错误码:9。...

领域模型概述

同步RPC调用模型 同步RPC调用模型下,不同系统之间直接进行调用通信,每个请求直接从调用方发送到被调用方,然后要求被调用方立即返回响应结果给调用方,以确定本次调用结果是否成功。重要 此处的同步并不代表RPC的编程接口方式,RPC也可以...

快速开始

下载的 RPC 代码结构如下,包括 RPC 配置、request 模型和 response 模型。调用 RPC 客户端发起 PRC 调用。代码示例如下:/获取 client 实例 RpcDemoClient client=MPRpc.getRpcProxy(RpcDemoClient.class);设置请求 GetIdGetReq req=new ...

版本说明

Dcom.alipay.sofa.rpc.compatible.rms3124=true 修复 Spring Framework 版本升级:5.1.14.RELEASE 升级至 5.2.20.RELEASE,Spring RCE 漏洞 在 Spring Framework 的这个版本中被修复。更新 jackson.version 2.11.2 升级至 2.11.4。netty 4....

导入概述

为了更好地满足各种不同的业务场景,StarRocks支持多种数据模型,StarRocks中存储的数据需要按照特定的模型进行组织。本文为您介绍数据导入的基本概念、原理、系统配置、不同导入方式的适用场景,以及一些最佳实践案例和常见问题。背景信息...

导入概述

为了更好地满足各种不同的业务场景,StarRocks支持多种数据模型,StarRocks中存储的数据需要按照特定的模型进行组织。本文为您介绍数据导入的基本概念、原理、系统配置、不同导入方式的适用场景,以及一些最佳实践案例和常见问题。背景信息...

使用 SDK

RPC 相关模块为 APMobileNetwork.framework、MPMgsAdapter,推荐使用 MPMgsAdapter 中的接口。本文引导您通过以下步骤使用移动网关 SDK:初始化网关服务 生成 RPC 代码 发送请求 请求自定义配置 自定义 RPC 拦截器 数据加密 数据签名 初始...

部署推理服务

print(tf_infer_spec.warm_up_data_path)print(tf_infer_spec.metadata.rpc.keepalive)使用镜像部署 使用Processor部署模型提供了易用性,但是无法支持用户灵活自定义的诉求,例如模型或是推理服务程序有较为复杂的依赖。对于类似的场景,...

定制化翻译服务调用指南

本接口(PredictMTModel)通过RPC方式,用于获取机翻自学习模型产出的结果。1.1 输入参数 参数名称 必选 类型 描述 ModelId 是 Long 模型Id Content 是 String 需要翻译的内容,长度限制5000字节 ModelVersion 否 String 可以传入模型的...

定制化翻译服务调用指南

本接口(PredictMTModel)通过RPC方式,用于获取机翻自学习模型产出的结果。1.1 输入参数 参数名称 必选 类型 描述 ModelId 是 Long 模型Id Content 是 String 需要翻译的内容,长度限制5000字节 ModelVersion 否 String 可以传入模型的...

服务网格工作原理

RPC 类别,主要支持 request-response 等通信模型,比如 Dubbo、SOFA、Spring Cloud 等私有协议。MQ 场景,处理消息框架通信场景。routers 主要保存和协议相关的路由配置映射,匹配 Header 中 Service 信息到具体的 Cluster。clusters 主要...

服务模型所有相关参数说明

rpc.batching 否 是否开启Server端Batching,用于GPU模型加速。取值如下:false:默认值,关闭Server端Batching。true:开启Server端Batching。rpc.keepalive 否 单个请求的最长处理时间。如果请求处理时长超过该值,则服务端返回408超时并...

HDFS指标

CopyBlockOpNumOps hdfs_datanode_rpc_CopyBlockOpNumOps DataNode RPC CopyBlock调用次数 HeartbeatsAvgTime hdfs_datanode_rpc_HeartbeatsAvgTime DataNode RPC Heartbeats调用平均时间。单位:毫秒。HeartbeatsNumOps hdfs_datanode_rpc...

uservice

cmd_id:RPC 序号 data:存RPC相关参数的buffer RPC 初始化 int rpc_init(rpc_t*rpc,int cmd_id,int timeout_ms);初始化 RPC,设置 RPC 的命令号(cmd_id),命令调用的超时时间(timeout_ms),单位毫秒 参数:rpc:rpc cmd_id:RPC 的命令号 ...

应用维度配置扩展

在 SOFABoot 的使用场景下,RPC 框架在应用层面提供一些配置参数,如端口、线程池等信息。应用参数都是通过 Spring Boot@ConfigurationProperties 进行的绑定,绑定属性类为 com.alipay.sofa.rpc.boot.config.SofaBootRpcProperties,配置...

RPC 调用

本文介绍的是 RPC 接口的使用方法。说明 由于 JS 传入的 JSON 数据无法包含数据类型,在 Native 层转为字典时可能会由于数据类型问题导致误差,如果是数字类型的精确值,尽量使用字符串来进行传递。例如:{"value":9.45} 会被 native 转为 ...

模型调优

模型调优 模型调优是通过Fine-tuning训练模式提高模型效果的功能模块,作为重要的大模型效果优化方式,用户可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型效果。...

基本概念

DashScope灵积模型服务通过标准化的API提供“模型即服务”(Model-as-a-Service,MaaS)。不同于以往以任务为中心的AI API,DashScope构建在面向未来的、以模型为中心的理念下,因此也引入了一些新的概念和术语。开发者可以通过本文了解...

模型评测

完成模型部署后,如需测试模型的效果,可在模型评测中进行评测,模型评测需要首先构建评测的数据集,构建方法类似于训练集的构建,数据格式同样是问答Pair对,对于Prompt而言往往是需要验证的问题,对于Completion而言往往是评测参考的答案...

模型训练最佳实践

创建新模型训练任务需要选择模型类型,平台支持两种模型类型,如果第一次训练模型,一般选择预置模型,如果希望基于已训练的模型进行再次训练,则可选择自定义模型,定义如下:预置模型 预置模型为未经过任何训练的原始模型,您可以通过...

引用 SOFARPC 服务

RPC 是日常开发中最常用的中间件,本文主要说明如何引用一个 RPC 服务。前提条件 已完成环境搭建。具体步骤,请参见 搭建环境。已下载 示例工程。已将工程导入 IDE 工具。具体操作,请参见 快速入门。引入接口定义依赖 要引用一个 RPC 服务...

快速开始

以下是四个常见的大模型应用场景:直接调用模型 模型训练 创建智能体API 创建RAG应用 直接调用模型 模型体验中心 您可以单击左侧边栏的 模型中心-模型服务-模型体验中心,选择1-3个模型进行测试,体验模型的问答效果。模型广场 您可以进入 ...

基本概念

模型服务 我的模型 管理所有已开通、已部署的模型,包括模型广场已开通模型及经过训练并完成部署的模型,支持针对模型进行调用、评估、训练。模型广场 在这里您可以根据业务所需挑选通义系列大模型、官方行业或场景大模型、第三方大模型等...

模型部署

模型部署 模型部署支持用户部署训练完成的模型或系统预置的模型模型需要部署成功后方可正式提供模型服务,用于模型调用或评测,模型部署支持使用预付费资源和后付费资源两种方式,模型部署成功后将持续计费,支持随时扩缩容或上下线,...

模型体验介绍

模型体验 支持选择多个模型同时体验,快速对比不同模型的效果,最多同时选择3个模型,支持差异化模型配置及重复模型选择。说明 体验模型将会消耗Tokens,费用以实际发生为主(独立部署模型除外)。各大模型收费标准请查看 模型广场介绍,...

模型体验中心

您可以在模型体验中心试用通义千问、Llama2等语言模型,初步了解模型功能,比较不同模型效果,从而评估是否将模型到自己的业务流程中。前提条件 已开通灵积模型服务并创建API-KEY,具体操作,请参见 开通服务并创建API-KEY。操作步骤 说明 ...

三方开源大语言模型

支持prompt格式输入 百川模型2-7B对话版 baichuan2-7b-chat-v1 百川模型2-7B对话版/百川模型2-13B对话版,支持message和prompt格式输入 百川模型2-13B对话版 baichuan2-13b-chat-v1 MOSS开源对话语言模型 moss-moon-003-base MOSS-MOON-003...

配置RPC行为

RPC行为可以在RPC类型埋点资源触发了某种规则后,返回相应的自定义的处理行为,例如某个RPC接口触发流控规则后返回自定义的接口返回值。本文介绍如何新增、修改、删除和关联RPC行为。前提条件 将应用接入AHAS应用防护。具体操作,请参见 接...

概念解释

模型调优 预置模型 预置模型为未经过任何训练的原始模型,您可以通过选择基础模型进行训练从而得到自创模型,不同的基础模型的参数和能力不同,我们将持续推出不同能力方向的模型。自定义模型 自订阅模型是基于您训练过的模型进行再次训练...

模型广场介绍

重要 模型广场介绍列表 通义系列模型介绍请访问 通义千问 通义开源系列模型介绍请访问 通义千问开源系列 通义万相模型介绍请访问 通义万相 三方开源大模型请访问 三方开源大语言模型 模型更名 模型名称 更名后的模型 通义千问-Max qwen-max...

计量计费

计费单价 模型服务 模型名 计费单价 百川模型2-13B对话版 baichuan2-13b-chat-v1 0.008元/1,000 tokens 百川模型2-7B对话版 baichuan2-7b-chat-v1 0.006元/1,000 tokens 百川模型1 baichuan-7b-v1 限时免费中 免费额度 说明 免费额度是基于...

2024年产品更新公告

说明 阿里云百炼大模型服务平台圈子&子社区上线啦!欢迎大家在社区中踊跃参与留言,期待与您在社区中,共同探讨大模型的世界。重要 qwen-max-1201 计划于2024年4月22日下线升级,如您继续使用,建议您提前切换至 qwen-max,感谢您的关注~...

计量计费

计费单价 模型服务 模型名 计费单价 百川模型2-13B对话版 baichuan2-13b-chat-v1 0.008元/1,000 tokens 百川模型2-7B对话版 baichuan2-7b-chat-v1 0.006元/1,000 tokens 百川模型1 baichuan-7b-v1 限时免费中 免费额度 说明 免费额度是基于...

模型广场

通义千问 大语言模型 通义千问开源系列 大语言模型 通义万相系列 LLaMa2 大语言模型 百川开源 大语言模型 ChatGLM开源双语对话语言模型 姜子牙通用大模型 Dolly开源大语言模型 BELLE开源中文对话大模型 元语功能型对话大模型V2 BiLLa开源...

模型介绍

通义千问是由阿里云自主研发的大语言模型,用于理解和分析用户输入的自然语言,在不同领域、任务内为用户提供服务和帮助。您可以通过提供尽可能清晰详细的指令,来获取符合您预期的结果。说明 支持的领域/任务:aigc(生成式人工智能)模型...

产品简介

DashScope灵积模型服务建立在“模型即服务”(Model-as-a-Service,MaaS)的理念基础之上,围绕AI各领域模型,通过标准化的API提供包括模型推理、模型微调训练在内的多种模型服务。通过围绕模型为中心,DashScope灵积模型服务致力于为AI...

如何开启模型训练

视频介绍 定义 模型调优是通过Fine-tuning训练模式提高模型效果的功能模块,作为重要的大模型效果优化方式,用户可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型...

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参考 无线保镖结果码说明 进行排查。

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参考 无线保镖结果码说明 进行排查。

动态与公告

2024年04月 公告类型 模型名称 公告描述 生效时间 相关文档 模型下线 通义千问 qwen-max-1201的维护时间已经到期,4月22日将正式下线,同时4月8日开始模型限流也会逐步调低直至下线,请及时迁移到更新版本模型。2024-04-22 计量计费 2024年...
共有188条 < 1 2 3 4 ... 188 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
表格存储 全局事务服务 (文档停止维护) 人工智能平台 PAI 图数据库 智能视觉生产 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用