全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 更多
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 智能硬件

画像分析

更新时间:2017-06-07 13:26:11

画像概况

数据服务是架设在标签视图之上的业务功能模块,可以通过界面化的配置或者API的操作能够以标签为里度对跨计算资源的数据进行统一的业务计算操作。透过数据服务+逻辑建模的组合,既节省工作量又有很好的扩展性。特别是对于大数据环境需要整合多个系统数据的前提下,很难一次把所有数据需求全部规划完整,那么这种动态逻辑建模的方式就有非常好的扩展性。从应用的角度来说,由标签模型视图层隔开明细数据复杂的数据结构,能够在相对扁平的标签体系之上进行明细数据上计算和查询,对于数据开发与应用开发的分工流程上来说也是更为合理的。

整合分析作为DTBoost数据服务的其中之一,其所适用的场景主要是结合阿里云分析型数据库(Analytics DataBase),将您分布在多个存储资源的数据整合起来,在标签模型上构建大数据画像类的交互式分析应用,让您的业务人员可以自由灵活的分析这些对象各种属性与行为之间的关联性。可以广泛应用于工业设备画像分析、企业经营画像分析、用户行为画像分析等多个场景当中。

大数据画像类分析应用有如下几个特性

  • 基于行为等明细数据的分析

    在过去以各项KPI指标计算为主要分析目的背景下,很容易把所有的指标计算提前构建。随着数据采集和使用场景的丰富,业务人员希望能够自由地分析各类行为明细数据,如查看不同客户属性在各个商品类目下消费的偏好和关联购买的情况,或者不同时间采购的不同类型、属性、地域设备的故障率与检修情况,还能够把多个维度细分下的具体客户/设备清单进行查看。业务人员进行的分析可能是任意维度之间的交叉关系,就很难进行预先的计算。

  • 从半结构化数据中抽取特征

    从另一点来说,灵活分析还意味着能够与预测、评分、文本特征提取等算法技术相结合,进行广度与深度兼备的分析。往往很多的画像特征如抽象的兴趣,如喜欢动漫``爱美一族等风格兴趣偏好类的特征,通常需要通过算法从用户的点击、收藏、购买行为与相关物品的文本描述当中进行特征抽取。这就需要能够借助一些偏好计算、文本挖掘类的算法能够从这些半结构化的数据当中对用户互相的特征进行深度的挖掘。

  • 交互式的查询分析

    业务人员希望得到的分析是在数据当中探索有用的信息,如发现影响消费者购买的可能因素,或者故障设备的关联因素,这就需要能够根据不断调整的筛选条件、维度组合、下钻上聚能够快速返回结果,直到获取到足够多的信息。这就对查询速度的高响应提出了要求。

    在这种交互式的分析场景下也对整体界面的组织提出了要求,业务人员关心的是在不断探索中获得的数据洞察,如果还需要用户进行复杂的报表配置或者是数据结构/技术上的学习理解,就会大大影响数据探索发现的过程。各种数据的分析还需要与各种类型的可视化形态结合,除了常规的图表外,可能还需要各种尺度特别是城市内尺度的地图图表,表达拓扑关系的关系网络图表,以及能展示文本特征的图表。

从以上几点来看,交互式数据分析产品的开发变得非常有挑战性,应用开发当中既需要充分理解数据结构,才能把跨表查询的逻辑与界面交互进行有机的组织;还需要了解多个专业存储与计算资源的特性,把不同计算产出的结果组织到同一个分析界面当中;也需要熟悉各类的可视化图表与分析控件的使用方法,结合到不同类型的分析当中。DTBoost整合分析模块就是面向这类场景为您提供以下功能,帮助您加速应用开发的难度。

功能组件

从功能上来看整合分析提供了两大块的功能,分析服务层部分用户在管理控制台中可以完成

接口调试

分析服务接口模块可以让您在此进行分析语句的调试,和自助化封装数据分析接口。您可以将分析。画像分析的查询表达都是建构在实体关系模型之上的。并且可以对接口进行调试,查看查询的结果/执行错误,以及语法每一步解析所耗费的时间,所解析的真实SQL语句,来帮助您调试分析接口。

接口调试

界面配置

通过画像分析界面搭建工具,灵活配置交互式画像分析界面。对筛选出来的特定的分析对象进行多维透视,并进一步钻取分析,并可以将分析筛选出来的对象导出到其他系统当中,如结合广告投放系统进行精准营销。整个界面的代码是完全开放的,可以无缝与您的现有系统进行整合。

界面配置2

界面配置1

上层提供的交互分析应用框架是以源代码的方式提供,用户只需把整个应用运行,会根据配置文件的填写自动渲染出一个可进行交互式分析的界面。用户可以进行代码的修改进行样式的改造。多个配置文件可以通过配置从不同的URL进行路由,让不同的用户可以看到不同的分析应用。

下图为某客户成功案例界面配置成功案例

典型应用

用户全景画像

在受众分析、CRM、用户行为、人口分析等场景下,通常需要对这些人群的明细行为数据进行分析。分析人员在进行分析的时候,可能多种行为与多种用户属性之间的组合筛选变化多样,无法按传统数据分析建模方法提前预算好所有组合。

  1. 用户根据消费者行为选取想要分析的目标群体全景洞察1

  2. 对于选取的目标群体,分析其各项特征,发现分布密集的特征全景洞察2

  3. 根据这些典型特征,找到还未购买的群体,针对这类群体对接下游系统,进行数据导出,进行定向广告推送。全景洞察3

设备全履历

设备全履历1

设备全履历2

设备故障统计

技术架构

画像分析技术架构

从技术架构来讲分为两个部分,在服务层部分通过TQL查询接口接收用户输入的参数,结合标签模型中的元信息会进行真实SQL的语法解析,然后把相应的SQL传送给相应的计算资源进行计算,通过接口获得返回的计算结果。使用Debug模式同时返回所解析的真实SQL以及每一步计算所耗费的时长,可以用于优化相应的查询语句。此处的语法解析主要是把用户在扁平化的标签模型视图上的查询逻辑,翻译为真实的多个表之间关联JOIN的查询。

数据订阅部分可以通过界面实现数据的一键搬迁,控制台界面会调用数据订阅的接口获取相应数据的元信息,调用标签中心底层智能搬运的接口,在相应的计算存储资源会自动建表建立索引后,触发调度任务进行数据同步。

在交互分析的应用框架层,会提供应用开发配置框架的源代码。其中包括相应的前端组件,WebService后端服务,界面配置文件,以及根据界面配置文件渲染相应界面同时翻译为相应的查询的接口。同时配置文件还能够进行相应的路由配置,让不同的页面URL可以路由到不同的配置,让不同的人看到不同的界面。

产品特性

  1. 一键数据整合

    针对不同的分析主体,您可一键完成分布在多个存储资源当中的多个标签到在线查询数据库当中的同步、索引工作,像管理一张表一样的管理不同数据源。兼容的在线分析数据库既可以是阿里云分析型数据库(Analytics DataBase),也可以是阿里云RDS关系型数据库

  2. Web开发友好

    Web应用开发者者直接通过与整合分析查询和标签元信息API接口的交互,结合阿里云DataV或是其他图表组件,即可以快速搭建自己的分析型数据产品。

  3. 查询表达简单

    在扁平化的标签体系上,一定程度简化了表关联和子查询的表达,让Web应用开发人员更加关注在应用逻辑而非数据表的组织逻辑。查询参数提供JSON对象模式,也提供与SQL相似的的TQL(Tag Query Laugage)模式。

  4. 与DTBoost其他模块无缝结合由于标签体系下,多个模块之间共享同一个标签视图,以及同一个标签在不同的存储计算资源能够自动搬迁,使得整合分析能够与DTBoost的算法模块、特征工程模块、实时预警模块产出的数据有一致性的表达,相互打通无缝结合。

  5. 交互式分析应用框架

    以SDK代码的方式提供分析界面配置工具,即刻生成交互式的分析应用。相比传统BI工具,配置出来的分析界面像一个独立的交互分析产品,可以整合入您整体的分析系统当中,更容易让用户灵活的洞察,对实体的属性、行为、地理出行等进行灵活的分析。

本文导读目录