产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

大数据安全治理的难点

通常,大数据系统中的工作流涉及多部门、多责任人且跨系统数据,如何才能协调好这些业务系统准时、保质保量地产出数据,避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据,关乎到企业数据业务的连续性问题甚至高层的信任问题...

Napatech案例

基于Lindorm的解决方案,用户在采用到100Gbps+流量产生的大量数据包元数据直接通过Lindorm存储,在数据的存储和索引性能方面得到极的提升,同时也极地降低整个系统的运维成本。客户价值 支持多个100G数据流量采集点的数据包元数据存储...

功能概览

1.4 生态融合 系出飞天,与阿里云大数据系统深度整合,无缝对接MaxCompute、实时计算、交互式分析等产品,打通整个大数据体系。2.产品功能 2.1 数据接入 提供多种SDK、API和Flume、Logstash等第三方插件,让您高效便捷的把数据接入到数据...

冷热分层

背景信息 在海量大数据场景下,随着业务和数据量的不断增长,性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作...

生态集成

云原生数据仓库AnalyticDB PostgreSQL版 具备完善和开放的生态系统,支持无缝对接业界以及阿里云生态的数据管理工具,BI报表可视化工具,ETL工具,数据迁移工具,同时可以与业界流行的流式处理系统,日志类系统大数据类系统,传统数仓及...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

ECS实例说明

大数据型 使用本地SATA盘作存储数据,存储性价比高,是大数据量(TB级别的数据量)场景下的推荐机型。说明 Hadoop、Data Science、Dataflow和Druid类型的集群支持Core节点;Zookeeper和Kafka类型的集群不支持Core节点。本地SSD型 使用本地...

数据分析整体趋势

Hadoop也在早期的MapReduce接口基础上增加了SQL接口,SQL语法逐渐成为大数据分析系统的标准配置。随着AWS,Azure,Alibaba,Google等云厂商的出现,云原生分布式数据仓库成为目前数据分析技术的主要解决方案,代表性云服务包括Amazon ...

概述

背景信息 在大数据生态系统中,Alluxio位于数据驱动框架或应用(例如Apache Spark、Presto、TensorFlow、Apache Flink和Apache Hive等)和各种持久化存储系统(例如HDFS和阿里云OSS)之间,使得上层的计算应用可以通过统一的客户端API和...

应用场景

前端的监控系统大数据处理系统会利用 TSDB 的数据查询和计算分析能力进行业务监控和分析结果的实时展现。电力化工及工业制造监控分析 传统电力化工以及工业制造行业需要通过实时的监控系统进行设备状态检测,故障发现以及业务趋势分析。...

公交出行:启迪公交

PolarDB-X 专注解决海量数据存储、超高并发吞吐、表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验,助力企业加速完成业务数字化转型。本文介绍启迪公交如何通过 PolarDB-X 应对业务挑战。所属...

应用场景

数据库Redis版 适用于多种场景,尤其是请求并发量场景中的数据存储。游戏行业应用 游戏行业通常将云数据库Redis版作为重要的部署架构组件,用于缓存或数据持久化。场景一:Redis作为缓存加速应用访问 Redis作为缓存层,加速应用访问。...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。更多信息,请参见 Apache Hudi官网。权限说明 仅支持 超级管理员、数据源管理员、...

创建Teradata数据

通过创建Teradata数据源能够实现Dataphin读取Teradata的业务数据或向Teradata写入数据。本文为您介绍如何创建Teradata数据源。背景信息 Teradata是一款大型数据仓库系统。如果您使用的是Teradata,在对接Dataphin进行数据开发或导出...

创建Teradata数据

通过创建Teradata数据源能够实现Dataphin读取Teradata的业务数据或向Teradata写入数据。本文为您介绍如何创建Teradata数据源。背景信息 Teradata是一款大型数据仓库系统。如果您使用的是Teradata,在对接Dataphin进行数据开发或导出...

保险行业解决方案与案例

与此同时国寿数据应用全面进入实时化,通过DTS将 PolarDB PostgreSQL版(兼容Oracle)实时变化的数据同步到KAFKA平台,下游业务系统大数据平台通过数据订阅以满足监管报送等各种场景;通过上线前完整兼容性评估,上线过程中全量SQL回归压...

基本概念

DTS 数据传输服务(Data Transmission Service,简称DTS)支持关系型数据库(RDBMS)、非关系型数据库(NoSQL)、数据多维分析(OLAP)等数据源间的数据交互,集数据同步、迁移、订阅、集成、加工于一体,帮助您构建安全、可扩展、高可用的...

配置脚本代码节点

例如:使用高级的工具(例如:Python的Numpy库、Sklearn库,Spark的MLlib库)加工数据,产出各种业务模型,应用到搜索系统的精排、推荐系统数据消费场景。例如,读取数据生成的Excel脚本,读取数据发邮件的脚本等。使用限制 目前仅支持...

应用场景

应用场景 1.实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接...大数据实时化 数仓是大数据的基础,实时化的数仓能够让BI、报表、推荐(用户标签产出)等多种业务收益,大数据系统总体向实时化迈进。

Tair扩展数据结构概览

最佳实践:推荐系统、爬虫系统,更多信息请参见 Bloom。Cpc 无 TairCpc是基于CPC(Compressed Probability Counting)压缩算法开发的数据结构,支持仅占用很小的内存空间对采样数据进行高性能计算,支持滚动窗口和滑动窗口,可以更好地支持...

添加及管理识别结果

您可单击数据分类名称后的 推荐 或者单击 操作 列下的 查看识别详情 进入字段识别详情对话框,查看系统推荐的更合适的识别结果,并根据业务需求决策是否需要使用推荐的识别结果。③ 操作区 您可对识别结果执行查看识别详情、编辑识别结果、...

应用场景

数据库GDB针对高度互联数据的存储和查询场景进行设计,并在内核层面进行了大量优化,非常适合营收增长、金融风控、商品推荐、社交推荐、循环担保检测、异常指标监控和违规团伙挖掘等场景。营收增长 图数据库GDB提供智能搜索推荐一体化...

电商网站智能推荐

概述 本实践以电商网站为例,通过日志服务采集日志,将RDS作为后端数据服务、MaxCompute作为数据仓库,并通过DataWorks进行数据同步和处理,使用智能推荐产品搭建电商网站智能推荐系统。电商行业需要向用户推荐的物品包括物流信息、售卖...

全量数据管理概述

数据源相关概念 目前智能推荐系统数据源只支持MaxCompute(ODPS),后续会陆续开放OSS,RDS等其他方式。MaxCompute:大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案,详情参见 MaxCompute 表:表...

V3.3.28版本说明

商品推荐 基于商品标签数据集进行商品筛选,筛选出商品池,作为候选推荐商品的范围。基于算法模型和商品池新建商品推荐任务,查看并使用推荐结果。用户洞察 数据数据数据集类型增加商品标签数据集。为与商品标签数据集区分,原“标签...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...

模型配置

模型验证是取等量人数的 随机人群、高潜验证人群,将他们的准确率、召回率做对比:首先,系统取等量人数的 随机人群、高潜验证人群:高潜验证人群:从历史人群中抽取部分人群使用模型进行商品推荐,人数为M人。然后对每人取推荐结果中的...

概述

在真实的推荐系统中,会有源源不断的新用户、新物品加入,这些新加入系统的用户和物品由于缺乏足够丰富的历史交互行为数据,常常不能获得准确的推荐内容,或被准确推荐给合适的用户。这就是所谓的推荐冷启动问题。冷启动对推荐系统来说是...

基于向量分析的个性化推荐系统

个性化推荐系统数据库表结构设计 上图是个性化新闻推荐系统中分析型数据库MySQL版数据库表结构设计,包含了三张表 news、person、browses_history,分别存储新闻信息、用户基本信息、用户浏览记录。news 表 news 表存储新闻信息,包含...

使用须知

若您首次搭建推荐系统,缺乏相关技术经验,且前期存在算法、工程人力不足的情况,我们建议您优先启用端到端行业推荐服务AIRec服务对接,待您已具备相关技术人员,并希望自主掌控推荐链路,我们建议您按照如下步骤进行评估,并与阿里侧架构...

基本概念

相关推荐 主要用于当终端用户的兴趣已基本确定时,我们将根据确定的兴趣集中点(某1/N个商品、某1/N篇文章)并根据终端用户海量行为计算与分析找到动态关联的推荐内容进行推荐,根据推荐内容之间的属性与特征相关度找到静态关联内容进行...

概述

Flink(VVR)完全兼容开源Flink,相关内容请参见如下文档:DataStream API Table API&SQL Python API 使用场景 Flink广泛应用于大数据实时化的场景,本文从技术领域和企业应用场景进行介绍。技术领域 从技术领域的角度,Flink主要用于以下...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

概述

数据组织 ZooKeeper的数据组织方式与标准文件系统类似,组织成类似文件树的结构,在ZooKeeper中使用znode(ZooKeeper node)来描述文件,与标准文件系统不同的是,znode并不区分目录或者文件的概念,每个znode都可以存储数据。ZooKeeper...

支持的云服务

AnalyticDB for MySQL 云原生数据仓库 AnalyticDB MySQL 版(AnalyticDB for MySQL)是海量数据实时高并发在线分析(Realtime OLAP)云计算服务,与MaxCompute结合应用于大数据驱动业务系统的场景。通过MaxCompute离线计算挖掘,产出高质量...

DataWorks On EMR使用说明

背景信息 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。阿里云...

概述

推荐系统服务,即通过用户特征匹配实现推荐匹配的功能。基于语义的文本检索和推荐,通过文本检索近似文本。问答机器人,通过与模型结合搭建高效的问答机器人服务。文件去重,通过文件指纹特征来去除重复文件。优势 云原生数据仓库...

新手引导

功能背景 为了帮助您快速接入AIRec服务,“新手引导”功能带领您step-by-step地完成每个接入环节,即使您不了解推荐系统也可以快速搭建起自己的智能推荐应用。“新手引导”功能将AIRec接入的流程细分为4模块、11个子环节,每个子环节都...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 云数据库 Redis 版 云数据库 RDS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用