监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

支持计划

配置指导以及故障排除 配置指导以及故障排除 配置指导以及故障排除 专属技术服务经理 不支持 不支持 专属技术服务经理(TAM)健康检查 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor。专属技术服务经理...

通过自定义模型识别

过滤字段:如果某些字段容易与样本字段混淆,则您也可以在该规则模型中将其排除排除后,使用该规则模型识别数据时,排除的字段将不会命中。同时,排除的字段将作为负向样本加入模型训练,以达到不命中混淆数据,提高识别准确率的效果。...

模型配置

说明 统计类标签,例如最近90天销量,将会影响模型训练效果,因此需要全部指出,以便系统在模型训练时排除统计类标签。输入复购周期(天),支持15~90的整数,即设置为推荐未来N天内的匹配商品。说明“未来N天”是指以行为数据集的最近行为...

开发Link Visual的功能介绍

Error 事件 故障事件 设备主动上报故障事件 按需 App和设备开发者需要关注并处理该物模型 抓图功能开发 开发抓图功能时,您需要配置的物模型如下。标识符 功能类型 功能名称 描述 控制台勾选 开发指南 TriggerPicCapture 服务 触发设备抓图...

质检规则配置

例如下图,命中正则表达式:买.*(ssd盘|普通盘),排除正则表达式:用不了|不能用|不生效,所以结合起来就是只匹配用户购买产品的场景,但是要排除故障报修的场景,示例语句:我想买一块ssd盘,应该怎么操作(可命中)/我前两天买了ssd盘...

模型预测

selected_cols 无 排除列 否 预测模型不需要使用的输入列,不能和 输入选择列 同时使用。excluded_cols 无 输出保留列 否 在预测结果表中原样输出的列。reserved_cols 无 预测详情输出列 否 选择预测模型的输出到MaxCompute表的映射,详情...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

应用场景

通过温度传感器对整个风机的温度测点进行实时监控,并对海量温度数据进行深度学习,构建风机故障检测与感知预测模型,最终做到提前1-2周识别风机微小故障并预警,单台风机单次重大事件维护成本大大降低。生产工艺优化 您可以使用工业大脑...

应用故障自动诊断

故障定界:这一部分包含了诊断模型推测出的导致应用故障的浅层原因,一般包含以下3种情况:应用的某个实例故障导致的整体故障。应用的某个接口或者服务故障导致的整体故障。应用的下游应用故障导致本应用故障。根因分析:这一部分包含了...

模型服务网格

模型服务网格(Model Service Mesh)提供了一个可扩展的、高性能的基础架构,用于将多个模型服务进行管理、部署和调度,以此更好地处理模型的部署、版本管理、路由和推理请求的负载均衡。本文介绍模型服务网格的概念和相关功能。什么是模型...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

安全告警概述

通过威胁检测模型,提供全面的安全告警类型检测,帮助您及时发现资产中的安全威胁、实时掌握资产的安全态势。背景信息 安全告警事件是指云安全中心检测到的您服务器或者云产品中存在的威胁,例如某个恶意IP对资产攻击、资产已被入侵的异常...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

设备使用物模型通信

开发语言 Link SDK使用示例 C Link SDK Extended 物模型开发 C(v4.x)物模型使用 C(v3.x)物模型编程 Android 物模型开发 Java 物模型开发 Python 物模型通信 Node.js 物模型开发 iOS 不支持 物模型通信流程 重要 下述设备与物联网平台...

用户窃电识别

例如通过采集电量异常、负荷异常、终端报警、主站报警及线损异常等信息监测窃漏电情况及计量装置故障,或根据报警事件发生前后客户计量点电流、电压及负荷数据情况,构建基于指标加权的用电异常分析模型...

EasyCkpt:AI大模型高性能状态保存恢复

EasyCkpt是PAI为PyTorch大模型训练场景而开发的高性能Checkpoint框架,通过实现接近0开销的模型保存机制,提供了大模型训练全过程进度无损的模型保存与恢复的能力。目前EasyCkpt支持当前流行的两种大模型训练框架Megatron和DeepSpeed,本文...

评分卡训练

评分卡是信用风险评估领域常用的建模工具,其原理是通过分箱输入将原始变量离散化后再使用线性模型(逻辑回归或线性回归等)进行模型训练,其中包含特征选择及分数转换等功能。同时也支持在训练过程中为变量添加约束条件。说明 如果未指定...

窃电用户自动识别概述

通过采集电量异常、负荷异常、线损异常、终端报警、主站报警信息,建立数据分析模型,工作人员可以实时监测窃漏电情况并发现计量装置故障。根据报警事件发生前后,客户计量点有关的电流、电压和负荷等数据情况,构建基于指标的用电异常分析...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

构建运营模型

运营模型是指组织和业务团队使用云计算平台支持业务的过程中,根据业务需求、企业架构、组织文化、现有的技术水平和工具等构建的模型。每个企业的运营模型都是独特的,本文将介绍四种常见的运营模型以供参考。构建运营模型的目的是为了实现...

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

产品简介 开源ChaosBlade与商业化AHAS CHAOS故障演练的特点如下:开源ChaosBlade具备使用简单、场景丰富、演练模型标准化等一系列特点,可以帮助企业快速实施混沌工程。商业化AHAS CHAOS故障演练是阿里巴巴内部广泛使用的演练平台云上版本...

强弱依赖治理概述

强弱依赖治理就是通过科学的手段持续稳定地得到应用间依赖关系、流量、强弱等数据,提前发现因为依赖问题可能导致的故障,避免依赖故障影响用户体验,积累数据持续推进系统稳定性提升。什么是强弱依赖?异常发生时,不影响核心业务流程,不...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

产品架构

ChaosBlade ChaosBlade是AHAS Agent的核心组件,用来解析、校验和执行服务端下发的故障指令,并且已正式对外开源,具有以下特点:简单易用:清晰易懂的混沌工程实验模型,易于理解。自带完善的命令行工具,方便本地调试。功能稳定:在阿里...

服务介绍

为该孪生空间创建一个场景,为园区中建筑和设备建立3D模型,关联孪生节点物模型,展示园区温湿度状态和警示信息,通过设备运行数据和告警信息,对设备进行故障预判并及时修复。下图为一个园区孪生实体图示例,构建温湿度统计的业务模型。您...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

模型技术服务内容说明

1.服务概述 1.1 服务说明 大模型应用咨询服务 根据客户的业务诉求,基于大模型的相关应用场景进行整体规划设计和咨询类服务。大模型工程技术服务 覆盖从场景设计、数据和素材整理准备、产品部署培训、测试和应用推广全过程。基于提示词工程...

功能导航条

抑制 自定义小计 分析计算 数据/模型切换 下载 清空 抑制 抑制功能可以去除当前即席分析中全部为0、null或者空文本的行或列。帮助您排除一些脏数据的干扰。对所有行、列开启抑制 对所有行、列开启抑制时,整个表格中所有数据全部为0、null...

AI推理服务概述

借助ACK云原生AI套件提供的Arena命令行工具、AI负载调度、GPU管理、资源弹性伸缩等基础能力,您可以在Kubernetes集群中简便、高效地把训练好的模型部署为AI推理服务。阿里云容器服务ACK支持为推理服务提供弹性伸缩、GPU共享调度、性能监控...

常见问题

本文为您介绍DashScope灵积模型服务中的常见问题,方便您快速找到解决方案。1.服务开通问题 开通是否收费?DashScope灵积模型服务为免费开通,开通服务后,针对不同模型,DashScope提供不同的免费额度供您使用。具体开通流程的参考,请前往...

快速开始

直接调用大模型 涉及功能:模型体验中心、模型广场、Prompt工程 基于企业文档的大模型问答 涉及功能:应用中心-应用广场RAG应用、企业知识库 基于训练数据的专属大模型 涉及功能:模型工具-模型调优、训练数据、模型评测、模型部署 直接...

模型调优

模型调优 模型调优是通过Fine-tuning训练模式提高模型效果的功能模块,作为重要的大模型效果优化方式,用户可以通过构建符合业务场景任务的训练集,调整参数训练模型,训练模型学习业务数据和业务逻辑,最终提高在业务场景中的模型效果。...

基本概念

DashScope灵积模型服务通过标准化的API提供“模型即服务”(Model-as-a-Service,MaaS)。不同于以往以任务为中心的AI API,DashScope构建在面向未来的、以模型为中心的理念下,因此也引入了一些新的概念和术语。开发者可以通过本文了解...

模型评测

完成模型部署后,如需测试模型的效果,可在模型评测中进行评测,模型评测需要首先构建评测的数据集,构建方法类似于训练集的构建,数据格式同样是问答Pair对,对于Prompt而言往往是需要验证的问题,对于Completion而言往往是评测参考的答案...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
音视频通信 数据库自治服务 负载均衡 表格存储 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用