创建GPU实例

选择镜像时,您可以根据实际需要选择是否同步安装NVIDIA Tesla驱动,或者是否选择已预装 NVIDIA Tesla驱动或 NVIDIA GRID驱动的免费镜像来同步加载相应驱动。更多信息,请参见 Tesla或GRID驱动。存储 实例通过添加系统盘、数据盘和共享盘...

指定GPU规格创建Pod

ECI GPU实例内置了显卡设备驱动及CUDA驱动,因此运行ECI GPU实例只需使用内置了CUDA Toolkit等软件的基础镜像即可,无需关心驱动安装。本文介绍如何使用ECI GPU实例。规格说明 GPU规格含有GPU计算,适用于深度学习、图像处理等场景。GPU...

创建和管理流日志

在 流日志采集详情 面板,单击操作列查看ENI采集范围,单击 不采集流日志的弹性网卡 或 全部弹性网卡 页签,查看流日志采集弹性网卡的信息。不采集流日志的弹性网卡:流日志不支持捕获流量信息的弹性网卡。全部弹性网卡:流日志采集范围内...

指定GPU规格创建Pod

本文介绍如何指定ECS GPU规格创建一个ECI Pod,以及如何修改GPU驱动版本。规格说明 GPU规格含有GPU计算,适用于深度学习、图像处理等场景。GPU对应的Docker镜像可以直接运行在ECI GPU实例上。实例内已预装NVIDIA显卡设备驱动,不同GPU...

指定GPU规格创建Pod

本文介绍如何指定ECS GPU规格创建一个ECI Pod,以及如何修改GPU驱动版本。规格说明 GPU规格含有GPU计算,适用于深度学习、图像处理等场景。GPU对应的Docker镜像可以直接运行在ECI GPU实例上。实例内已预装NVIDIA显卡设备驱动,不同GPU...

导入历史日志文件

背景信息 Logtail基于监听文件的修改事件进行日志采集,还支持从本地文件中加载事件,以驱动日志采集采集历史日志文件就是基于本地事件加载实现的功能。说明 导入本地事件最长延迟为1分钟。由于加载本地事件属于特殊行为,Logtail会向...

如何手动更新Windows实例的virtio驱动

如果您需要手动更新Windows实例的virtio驱动,可以参考本文介绍的方式完成驱动更新。背景信息 云盘在线扩容和查询序列号操作依赖于镜像的virtio驱动版本,例如Windows实例的virtio驱动需要大于58011版本才能执行在线扩容操作,否则就需先...

GPU自助诊断

ECS管理控制台支持配置 GPU设备健康检查 功能,通过该功能可以对当前实例的GPU状态或驱动状态进行全方位诊断,方便您自行诊断当前实例的GPU驱动是否存在异常,帮助您及时发现和解决存在的常见问题。前提条件 已创建GPU实例且该实例...

节点诊断

数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 节点诊断覆盖的典型异常场景和AI智能诊断支持场景如下表所示。类别 支持的异常场景 节点诊断 节点NotReady:网络未就绪。节点NotReady:PID数量不足。节点NotReady:内存...

系统监控报警任务

ECS指标 当伸缩组类型为ECS时,系统监控报警任务支持的监控指标如下表所示:采集来源 监控指标(控制台)监控指标(API)单位 统计周期 适用网络 ECS实例(ECS)CPU使用率 CpuUtilization%15秒 1分钟 2分钟 5分钟 15分钟 专有网络、经典...

通过DaemonSet方式采集容器文本日志

对于Docker只支持overlay、overlay2这两种存储驱动,其他存储驱动需将日志所在目录通过数据卷挂载为临时目录。存储卷挂载方式:如果NAS以PVC的方式挂载到数据目录,不支持使用Daemonset方式部署Logtail,建议使用Sidecar方式或Deployment...

如何使用Prometheus监控Windows

如果将页面文件托管在与操作系统驱动器独立的驱动器上,则应该在OS主驱动器和页面文件的驱动器上明确跟踪、警告此指标。当磁盘空闲时间持续处于低位,表示磁盘持续繁忙地进行读写操作,此时您需要重点关注该指标。通常,页面文件磁盘上的高...

如何使用Prometheus监控Windows

如果将页面文件托管在与操作系统驱动器独立的驱动器上,则应该在OS主驱动器和页面文件的驱动器上明确跟踪、警告此指标。当磁盘空闲时间持续处于低位,表示磁盘持续繁忙地进行读写操作,此时您需要重点关注该指标。通常,页面文件磁盘上的高...

我是数采实施商

采集 本章节包括以下内容 点表配置 驱动视图 设备视图 设备模板 模板管理 OPC UA导入属性 资源部署 驱动视图 整体展示结构为:驱动-连接-设备-点位。左侧为驱动-连接列表,驱动即数采协议包,如下图所示,左侧驱动列表包括bacnet、device_...

Pod诊断

Pod的部分容器进程处于D状态,通常为容器进程在磁盘IO中,请尝试重启宿主机ECS,如仍无法恢复,请 提交工单 处理。Pod初始化状态 检查Pod是否正常初始化。请检查Pod状态及日志。更多信息,请参见 Pod异常问题排查。Pod申请的GPU资源 检查...

自助诊断GPU节点问题

如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点问题,并提供nvidia-smi和XID状态码排查列表。前提条件 已创建ACK Pro版集群...

ASM网关概述

通过入口网关访问网格内WebSocket服务 常用流量管理 在大促等场景下,瞬间洪峰流量会使系统超出最大负载,调用大量堆积,导致整个调用链路死。ASM提供了本地限流功能,支持对网关和服务进行流量限制,达到保护系统的目的。为入口网关配置...

Modbus驱动

Link IoT Edge提供Modbus官方驱动,用于支持工业领域广泛应用的Modbus通信协议设备。本文主要介绍Modbus驱动及其用法。概览 Modbus是常用的应用层数据通信协议,阿里云官方Modbus驱动(以下简称Modbus驱动)支持Modbus RTU和Modbus TCP两种...

在企业级实例上配置eRDMA

针对不支持安装eRDMA驱动的操作系统或者自动安装失败的情况,您可以在实例创建完成后,通过脚本方式或手动方式安装驱动。具体操作,请参见 为已有实例配置eRDMA。前往实例购买页。创建支持ERI的ECS实例。创建过程中需注意以下配置项(其他...

核心自治技术案例解析

您可以采集各种数据,比如从链路上采集数百个数据库性能指标和从链路上采集已加载SQL语句的查询日志,海量数据的离在线处理与存储,基于机器学习和数据库领域预测算法,实现各业务数据库实例的持续模型训练,实时模型预测和实时异常检测...

接入指南

采集指标 单击应用/组件对应的卡片,然后单击 采集指标 页签,可以查看不同环境下的采集指标。告警规则模板 单击应用/组件对应的卡片,然后单击 告警规则模板 页签,可以查看不同环境下的告警规则模板。子产品入口 除了通过ARMS接入中心接...

使用VFIO驱动替代UIO驱动

本文介绍如何在普通云服务器和弹性裸金属服务器中使用VFIO驱动替代UIO驱动,解决DPDK应用运行异常的问题。前提条件 已为实例设置HugePages。具体操作,请参见 调整Linux实例大页内存的方法。已为实例安装DPDK。关于DPDK的更多信息,请参见 ...

通过OSS URL自定义节点GPU驱动

NVIDIA各型(P100、T4、V100、A10等)对驱动版本的更详细的要求,请参见 NVIDIA官方文档。步骤一:下载目标驱动 如果 ACK支持的NVIDIA驱动版本列表 未包含您的业务所需的驱动版本,您可以从 NVIDIA官方网站 下载目标驱动版本,本文以驱动...

通过指定版本号自定义节点GPU驱动版本

NVIDIA各型(P100、T4、V100、A10等)对驱动版本的更详细的要求,请参见 NVIDIA官方文档。步骤一:确定NVIDIA驱动版本 从 ACK支持的NVIDIA驱动版本列表 选择与您业务相匹配的NVIDIA驱动版本。具体操作,请参见 如何选择节点NVIDIA驱动...

Tesla或GRID驱动安装指引

推荐安装的驱动:推荐的驱动类型 驱动安装方式 Tesla驱动 仅支持在创建实例后单独安装Tesla驱动:手动安装GPU驱动(Windows)图形加速/渲染场景 适用的GPU实例:GPU为T4、A10的实例(即 gn6i、gn7i、ebmgn6i、ebmgn7i 实例规格)。...

简介

机器组是包含多台服务器的虚拟分组,日志服务通过机器组的方式管理所有需要通过Logtail采集日志的服务器。日志服务支持通过一个Logtail采集配置来采集多台服务器上的日志,您可以将这些服务器加入到同一个机器组,并将Logtail采集配置应用...

1 人行方案选型标准

门禁机开门 驱动接口(1)同步权限 请求方向:边缘->设备(2)刷卡通行事件 请求方向:设备->边缘(3)查询设备上的权限信息 请求方向:边缘->设备(4)上报设备上的权限信息 请求方向:设备->边缘 3.3 二维码 方案要求(1)IoT门禁服务生成...

通过DaemonSet-CRD方式采集容器日志

在容器中以DaemonSet模式安装Logtail后,您可通过CRD方式创建Logtail配置采集容器日志。前提条件 已安装Logtail组件。具体操作,请参见 安装Logtail组件(阿里云Kubernetes集群)。目标容器持续产生日志。重要 Logtail只采集增量日志。如果...

使用已有的SLS资源设置日志采集

SAE 支持将日志采集到日志服务SLS。本文介绍为托管到 SAE 的应用设置日志采集的注意事项。背景信息 通过 SAE 设置SLS日志采集时,可以复用已经存在的SLS资源。但是 SAE 在删除应用时,会同步删除为该应用代购的SLS资源。所以,在使用已有...

3.1 门禁控制器对接方案介绍

4.2 信息收集 刷卡门禁设备信息:提供设备的硬件型号、设备ID、设备IP及端口号 提供用于调试的卡号 射频读取时间 是否支持手机NFC 手机NFC读取时间 设备保存权限的时间 4.3 驱动开发及自测 参考《3.2 自定义协议驱动开发指导》文档,...

通过DaemonSet-控制台方式采集容器标准输出

Docker容器引擎限制:目前标准输出采集仅支持JSON类型的日志驱动。上下文限制:默认同一Logtail配置下的所有容器的标准输出处于同一上下文中,即无法使用控制台的上下文查询及Livetail功能直接查看某一容器标准输出的上下文。如果需要使用...

通过DaemonSet-控制台方式采集容器标准输出

Docker容器引擎限制:目前标准输出采集仅支持JSON类型的日志驱动。上下文限制:默认同一Logtail配置下的所有容器的标准输出处于同一上下文中,即无法使用控制台的上下文查询及Livetail功能直接查看某一容器标准输出的上下文。如果需要使用...

升级Tesla或GRID驱动

如果您的NVIDIA Tesla或NVIDIA GRID驱动版本已不适用于当前场景,或者您安装了错误的驱动类型或版本导致GPU实例无法使用,您可以通过卸载当前驱动再安装所需驱动的方式,完成Tesla或GRID驱动的升级操作。升级NVIDIA Tesla 驱动 升级Tesla...

GPU实例FAQ

随着功能迭代、新型推出、BUG修复、驱动生命周期到期等原因,GPU实例所使用的驱动版本未来可能变化,请避免在容器镜像中添加驱动特定相关内容,更多内容,请参见 镜像使用说明。函数计算GPU实例的CUDA版本是什么?CUDA版本由您在构建容器...

镜像使用说明

随着功能迭代、新型推出、BUG修复、驱动生命周期到期等原因,GPU实例所使用的驱动版本未来可能变化。若您已经在使用NVIDIA Container Runtime等GPU容器虚拟化技术,请您避免使用 docker commit 命令创建镜像,此类镜像中会包含已注入的...

接入NVIDIA GPU监控数据

步骤一:安装NVIDIA GPU驱动 日志服务使用 nvidia-smi 命令采集GPU信息,该命令包含在GPU驱动程序中,因此需要先安装驱动程序。具体操作,请参见 在GPU计算型实例中安装GPU驱动(Linux)。如果您使用阿里云ECS的GPU实例,则GPU实例中已默认...

接入Nvidia GPU监控数据

步骤一:安装NVIDIA GPU驱动 日志服务 使用 nvidia-smi 命令采集GPU信息,该命令包含在GPU驱动程序中,因此需要先安装驱动程序。具体操作,请参见 在GPU计算型实例中安装GPU驱动(Linux)。如果您使用阿里云ECS的GPU实例,则GPU实例中已...

GPU云服务器常见问题

根据您使用的操作系统,安装GRID驱动的说明如下:如果您需要安装Windows操作系统的GRID驱动,请前往 云市场 购买配备了GRID驱动的镜像,如 Windows Server 2019 中文版预装GRID驱动镜像、Windows Server 2016 中文版预装GRID驱动镜像,然后...

量产管理

如果选择了这两种加速,后续的安装包会自带驱动安装能力。此外,配置确认之后,请注意 发布 该型号。3.创建软硬一体机 所谓“软硬一体机”,是指一台 包含固定应用功能的硬件。在创建硬件型号之后,我们需要将应用放进这个型号中,从而...

通过SLS CRD采集日志

本文介绍在ACK Serverless集群中,如何通过SLS CRD来配置日志采集,实现通过阿里云日志服务SLS自动采集容器日志。背景信息 阿里云日志服务SLS(Log Service)是针对日志数据的一站式服务,您无需开发就能快捷完成日志数据采集、消费、投递...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
函数计算(旧版) 物联网平台 视频点播 号码认证服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用