智能标签产品从大数据应用落地点出发,提供了将治理后的数据以业务化视角进行建模、查看、管理及使用,并提供业务衍生标签的自定义功能,为上层应用提供统一的标签数据目录和标签调用接口,沉淀上层应用制作的模型标签,实现高价值标签共享复用,形成标签运营生态。
总述
智能标签在相应行业应用解决方案的结合下,能够让不是很熟悉大数据应用系统开发的程序员也能够快速搭建大数据应用,从而实现大数据价值的快速落地,智能标签帮助数据开发人员进行数据表的实体化,加速应用开发,沉淀业务模型的输入。比如在订单中,卖家能够理解的内容是成交笔数、成交金额、成交日期等实际现实对象,而非一张张表,如订单表。需要智能标签能面向零售行业,提供实体化的对象,如买家这个实体,这个实体上,需要赋予性别、年龄等标签信息,同时和商品建立关系,这个被赋予实际标签的实体,才是卖家能够理解的对象,基于这个对象才能去做分析。
智能标签帮助构建这样的对象,提供给分析型应用实际的内容,同时让应用开发者也直观了解需要去获取的数据对象,直接使用实体化后的对象及标签进行加工、衍生、调用。
优势
智能标签是以标签中心为基础,建立跨多个云计算资源之上的统一逻辑模型,开发者可以在“标签”这种逻辑模型,通过接口的方式进行快速的应用搭建。这种方式的好处:
屏蔽掉应用开发人员对于下层多个计算存储资源的深入理解与复杂的系统对接工作。
通过数据服务的形式透出也有助于IT部门对数据使用的管理,避免资源的重复和冗余。
标签模型设计
标签模型基于OLT(对象、关系、标签)模型来抽象物理数据,构建语义层,为业务人员“看懂数据”从而“使用数据”提供基础,支持对象关系的多级类目管理。
对象定义:包括实体类(无时间维)和事件类(有时间维),描述一个客观存在实体或事件;从数据角度看,是一个多种数据描述同一实体或事件的集合。
关系定义:关系是建立在两个对象上的关系。如用户和购买商品事件的关系,用户和学习课程事件的关系等。
标签定义:标签是挂接在对象,对对象进行描述的属性的集合。
对象管理
新建对象及标签:支持跨存储类型的数据源整合,低门槛构建“宽表”,形成业务可以理解的对象及其原生标签信息。
对象导出、导入:支持将对象导出、导入,包含对象相关的标签、计划、标签API,便于在其他系统或工作组中快速部署。
标签管理
支持对标签进行编辑、上线、下线、公开、撤回;实现标签的生命周期管理。
标签工厂
计划列表管理
支持已有标签加工生成衍生标签功能。
支持文本TQL编写标签方案,将衍生标签配置关联到实体或关系上,生成的标签方案任务分为一次性调度和周期调度。
支持标签方案生成任务的运维管理功能,并提供对计划任务的上线、下线、查看、运维、删除等功能。
物理表查看
支持查看云计算资源下的物理表信息,并提供刷新、字段详情查看、数据预览等功能。
标签加速
支持将构建的标签模型统一加速至分析型数据库形成大宽表,以提供后续分析场景使用。
分析引擎
查询调试
支持实体关系上的标签和获得授权标签的查询功能。
支持实体关系使用TQL(Tag Query Language)语言的关联查询。
支持查询结果的列表查看和JSON格式查看。
支持可视化的页面调试,展示TQL的每个执行流程;每一流程的时间性能消耗。
支持多种云计算资源中的标签查询。
支持分析查询结果生成API,并提供在分析查询中配置参数。
API列表
支持API的类目管理、列表管理、详情查看、调试和版本管理等功能。
标签探查
支持查询所有实体的标签及标签内容数据,支持多标签的内容筛选能力。
标签属性配置
支持为标签提供易于识别的属性和属性值,便于画像分析时能够提供方便快捷的进行数据筛选,提高了画像分析的效率。
标签使用统计
支持标签生产和使用情况统计,包含标签类目统计、标签使用、对象使用统计等。